前几天在Python最强王者交流群【哎呦喂 是豆子~】问了一个Python
自动化办公的问题,一起来看看吧。
下图是他的原始数据和他想得到的目标数据,如下所示:
需要在标黄的两行里边进行相关操作。
上一篇文章我们针对少量数据进行了分类实现,这一篇文章我们一起来看看【隔壁😼山楂】大佬给出的pandas实现,实现多行数据的分类。多行数据,还涉及到多种系统,几十个漏洞详情,情况确实复杂了许多。
针对该问题,【隔壁😼山楂】提供了新的代码:
# 筛选或条件
dfc1 = df[df['是否提供误报证明'].eq('是')].groupby(['系统名称', '漏洞名称', '是否提供误报证明']).agg({'ip': 'unique'}).rename(columns={'ip': '已提供误报证明ip'}).reset_index()
dfc2 = df[df['是否提供无法整改证明'].eq('是')].groupby(['系统名称', '漏洞名称', '是否提供无法整改证明']).agg({'ip': 'unique'}).rename(columns={'ip': '已提供无法整改证明ip'}).reset_index()
res = dfc1.merge(dfc2, how='outer', on=['系统名称', '漏洞名称'])
res1 = res.set_index(['系统名称', '漏洞名称'])
# 筛选与条件
res2 = df[df['是否提供误报证明'].eq('否') & df['是否提供无法整改证明'].eq('否')].groupby(['系统名称', '漏洞名称']).agg({'ip': 'unique'}).rename(columns={'ip': '没有误报和无法整改证明的ip'})
# 结果合并
res = res1.join(res2, how='outer').fillna('')
# 将结果列表处理成字符串
ip_cols = res.columns[res.columns.str.contains('ip')]
res[ip_cols] = res[ip_cols].applymap(', '.join)
# 无ip的单元格用无填充
res[ip_cols] = res[ip_cols].where(res[ip_cols].ne(''), '无')
# 保存结果
res.to_excel('result.xlsx')
这个简单来说就是筛选三次,三次的结果进行合并,运行之后可以得到预期的效果图如下所示:
这个代码还是蛮有深度的,需要点实际进行消化,确实太强了!
大家好,我是皮皮。这篇文章主要盘点了一个Python
自动化办公实战的问题,文中针对该问题,给出了具体的解析和代码实现,帮助粉丝顺利解决了问题。
最后感谢粉丝【哎呦喂 是豆子~】提问,感谢【莫生气】、【隔壁😼山楂】给出的思路和代码解析,感谢【鶏啊鶏。】、【Ineverleft】等人参与学习交流。
本文分享自 Python爬虫与数据挖掘 微信公众号,前往查看
如有侵权,请联系 cloudcommunity@tencent.com 删除。
本文参与 腾讯云自媒体同步曝光计划 ,欢迎热爱写作的你一起参与!