「全面」pandas数据分析面试题（一）汇总-网络知识

哈喽，大家好，接下来总共为大家准备了120道关于pandas数据分析面试题。我们会分为几篇文章来写，今天是前16道题：

1、如何创建series和DataFrame：

1)可通过列表直接创建series：

pd.Series([1,2,3])

2）也可以通过字典创建series：

dic={

"one":1,"two":2,"three":3

}

df=pd.Series(dic)

3）可以通过字典创建DataFrame：

dic={

"name":['python','pandas'],"price":[40,50],"adress":['北京','上海']

}

df=pd.DataFrame(dic)

2、提取含有字符串“Python”的行

方法：df[df['name']=='python'])

3、提取列名：

方法；df.columns

4、修改列名

将第二列列名改为age:

df.rename(columns={'price':'age'},inplace=True)

5、统计第二列中每项出现的次数

df["name"].value_counts()

6、提取第二列中大于40的行：

df[df['price']>40]

7、对第一列数据进行去重：

df["name"].unique()

8、对price这一列计算平均值：

df["price"].mean()

9、将第一列name列转换为列表：

df["name"].tolist()

10、将该dataframe保存为Excel表：

df.to_excel('pandas面试题.xlsx')

11、查看该dataframe数据情况，有几行几列：

df.shape

12、查找price这一列大于40小于70的行：

df[(df["price"]>40)&(df["price"]

13、交换第一列和最后一列的位置：

df[["adress","price","name"]]

14、提取第二列price中最大值所在的行：

df[df["price"]==df["price"].max()]

15、查看数据前3行：

df.head(3)

16、查看数据后3行：

df.tail(3)

相关文章

央媒谈“文盲演员”引发饭圈甩锅大战

野生大熊猫深夜遛达 镜头前呆萌打卡

张萌谈演员到底需不需要有文化

情人节多地迎领证高峰

婚房烂尾10年业主住进毛坯房

多地首套房贷利率降至4%以下 为什么急于提前还贷

野生大熊猫深夜遛达镜头前呆萌打卡

多地首套房贷利率降至4%以下为什么急于提前还贷