一、前言
前几天在Python白银交流群【空翼】问了一个pandas
处理Excel
数据的问题,提问截图如下:
下图是他的原始数据部分截图:
看上去确实是两列,但是X列里边又暗藏玄机,如果只是单纯的针对这一列全部是数值型的数据进行操作,那么代码实现起来,确实不太难。【Jun.】给了两个代码,确实可以,分别是df=df[df["X"]>=0]
和df=df[~df["X"]<0]
。
如果只是想保留非负数的话,而且剔除值为X
的行,【Python进阶者】也给了一个答案,代码如下所示:
import pandas as pd
df = pd.read_excel('U.xlsx')
# print(df.head())
print(df["X"].value_counts())
print(df[(df.X == "X")].index.tolist())
data = df.drop(index=df[(df.X == "X")].index.tolist())
print(data.info())
data = data.reset_index(drop=True)
print(data["X"].value_counts())
df1 = data[data["X"] >= 0]
print(df1)
但是这些都不是粉丝想要的,他想实现的效果是,保留列中的空值、X
值和正数,而他自己的数据还并不是那么的工整,部分数据入下图所示,可以看到130-134行的情况。
后来他自己想到了一个办法,确实可以,代码如下所示。
可以满足要求!顺利地解决了粉丝的问题。其中有一行代码不太好理解,解析如下:
大家好,我是皮皮。这篇文章主要盘点了一个Pandas
处理的问题,文中针对该问题,给出了具体的解析和代码实现,帮助粉丝顺利解决了问题。
最后感谢粉丝【空翼】提问,感谢【Jun.】、【论草莓如何成为冻干莓】、【瑜亮老师】给出的思路和代码解析,感谢【Python进阶者】、【磐奚鸟】等人参与学习交流。
本文分享自 Python爬虫与数据挖掘 微信公众号,前往查看
如有侵权,请联系 cloudcommunity@tencent.com 删除。
本文参与 腾讯云自媒体同步曝光计划 ,欢迎热爱写作的你一起参与!