meta|【全面】pandas数据分析面试题（十一）汇总！

哈喽，大家好，今天我们继续介绍pandas面试题。
1、eval函数的用法
跟上篇文章说的assign函数的用法差不多， eval函数可以通过如下方式新增列：
直接定义某列的数据值：
df1.eval('c=1')

2、文本格式转换：
字符全部变成小写
s.str.lower()
# 字符全部大写
s.str.upper()
# 每个单词首字母大写
s.str.title()
# 字符串第一个字母大写
s.str.capitalize()
# 大小写字母转换
s.str.swapcase()
3、给定DataFrame ，有列A B ， A的值在1-100（含），对A列每10步长，求对应的B的和
df = pd.DataFrame({'A': [121111333435407999

'B': [121111333435407999
)
print(df)
df1 = df.groupby(pd.cut(df['A'
np.arange(0 101 10)))['B'
.sum()
print(df1)
4、一个全数值的DataFrame ，返回最大3个值的坐标
df = pd.DataFrame(np.random.random(size=(5 3)))
print(df)
df.unstack().sort_values()[-3:
.index.tolist()
5、可视化
import matplotlib.pyplot as plt
df = pd.DataFrame({\"xs\":[15281
\"ys\":[42196
)
plt.style.use('ggplot')
画出df的散点图：
df.plot.scatter(\"xs\" \"ys\" color = \"black\" marker = \"x\")
6、每连续4个月为一组，求最大值所在的日期
s.groupby(pd.Grouper(freq='4M')).idxmax()
7、创建2015-2016每月第三个星期四的序列
pd.date_range('2015-01-01' '2016-12-31' freq='WOM-3THU')
8、利用to_frame()实现Series转DataFrame」
s = pd.Series([0 1 2
)
# Series转为DataFrame ， name参数用于指定转换后的字段名
s = s.to_frame(name='列名')
【meta|【全面】pandas数据分析面试题（十一）汇总！】好了，今天的内容就先到这里了，明天见！