网络知识 娱乐 Python pandas学习

Python pandas学习

今天学习的是

1;pandas的另外一个数据类型:DataFrame。

2;以及生成Series和DataFrame

3;pandas的数据类型

DataFrame(data=None, index: 'Axes | None' = None, columns: 'Axes | None' = None, dtype: 'Dtype | None' = None, copy: 'bool | None' = None)

1;data:数据

2;index:行的标签

3;columns: 列的标签

4;dtype: 输出的类型。


来举几个例子:

import pandas as pdnna = {'col1': [1, 2], 'col2': [3, 4]}nb = pd.DataFrame(a)nprint(b)nna = {'姓名':['张三','李四'],'年龄':[20,25],'身高':[1.73,1.75]}nb=pd.DataFrame(a)nprint(b)nnna = {'姓名':['张三','李四'],'年龄':[20,25],'身高':[1.73,1.75]}nb=pd.DataFrame(a,index=(1,2))nprint(b)n

1;字典的键是行的内容,字典的值是列的内容,一一对应

2;index 可更改标签数值,如果默认则从0开始,可以看第三个例子,标签的个数需要与值的个数一致,否则会报错。


生成Series,Series是一个带有标签的一维数组,这个数组可以由任何类型数据构成,包括整型、浮点、字符、Python对象等。它的轴标签被称为索引,它是Pandas最基础的数据结构。

数据是:列表和元组的情况下:

import pandas as pdna = [1,2,3,4,5,6]nb = pd.Series(a)nprint(b)nnna = (1,2,3,4,5,6)nb = pd.Series(a)nprint(b)

结果都是一样,左边是索引值,右边是值。

数据是:NumPy的ndarray结构:

import pandas as pdnimport numpy as npna = pd.Series(np.random.rand(6),index=[1,2,3,4,5,6])nprint(a)

Numpy 可以轻松地生产一组数组并且给这组随机数标记。

Python pandas学习

数据是:字典

import pandas as pdnimport numpy as npna = {'张三':18,'李四':20,'王二':25}nb = pd.Series(a)nprint(b)

原数据是字典的标记值就是字典的键,如果要更改标记值就更改index=


生成DataFrame,DataFrame是二维数据结构,数据以行和列的形式排列,表达一定的数据意义。DataFrame的形式类似于CSV、Excel和SQL的结果表,有多个数据列,由多个Series组成。

数据是:字典

import pandas as pdnimport numpy as npna = {'男性':['张三','李四','王二'],'女性':['刘梅','安红','妞妞']}nprint(pd.DataFrame(a))


pandas的数据类型:

常见的3种数据类型:

int64:整数

float64:浮点数

object:文字

Python检查类型用的是type,pandas用的是types