
哈喽 , 大家好 , 今天我们继续介绍pandas面试题 。
1、eval函数的用法
跟上篇文章说的assign函数的用法差不多 , eval函数可以通过如下方式新增列:
直接定义某列的数据值:
df1.eval('c=1')
2、文本格式转换:
字符全部变成小写
s.str.lower()
# 字符全部大写
s.str.upper()
# 每个单词首字母大写
s.str.title()
# 字符串第一个字母大写
s.str.capitalize()
# 大小写字母转换
s.str.swapcase()
3、给定DataFrame , 有列A B , A的值在1-100(含) , 对A列每10步长 , 求对应的B的和
df = pd.DataFrame({'A': [121111333435407999
'B': [121111333435407999
)
print(df)
df1 = df.groupby(pd.cut(df['A'
np.arange(0 101 10)))['B'
.sum()
print(df1)
4、一个全数值的DataFrame , 返回最大3个值的坐标
df = pd.DataFrame(np.random.random(size=(5 3)))
print(df)
df.unstack().sort_values()[-3:
.index.tolist()
5、可视化
import matplotlib.pyplot as plt
df = pd.DataFrame({\"xs\":[15281
\"ys\":[42196
)
plt.style.use('ggplot')
画出df的散点图:
df.plot.scatter(\"xs\" \"ys\" color = \"black\" marker = \"x\")
6、每连续4个月为一组 , 求最大值所在的日期
s.groupby(pd.Grouper(freq='4M')).idxmax()
7、创建2015-2016每月第三个星期四的序列
pd.date_range('2015-01-01' '2016-12-31' freq='WOM-3THU')
8、利用to_frame()实现Series转DataFrame」
s = pd.Series([0 1 2
)
# Series转为DataFrame , name参数用于指定转换后的字段名
s = s.to_frame(name='列名')
【meta|【全面】pandas数据分析面试题(十一)汇总!】好了 , 今天的内容就先到这里了 , 明天见!
- 12月13日消息|小米13系列手机明日开售售价4599元
- 红魔手机|又来一款无刘海无挖孔的第二代骁龙8真全面屏!红魔8 Pro辨识度拉满
- 南京酷科电子科技有限公司作为小米科技公司旗下的生态链企业之一|酷科65wgan充电器测试模块测试模块主要测试
- 最近我们经常遇到这样的购机需求:工作为主|价格真香表现全面的“工作站级设计本”!惠普战99测评
- 高大幕墙骨架结构选型成为当下大跨度幕墙系统面临的主要问题|幕墙精制钢型材,新时代下的幕墙新材料【西创系统】
- IBM|联盟IBM 日本找来2大高手攻关2nm工艺:最快2025年量产
- 短视频剪辑软件,小白也能轻松上手
- mcn|基于Electron框架全面重做:全新Linux版QQ开启公测
- 音频去除杂音剪辑方法简单好用
- 如何将pdf转换成word格式文件?
