前往小程序,Get更优阅读体验!
立即前往
发布
社区首页 >专栏 >盘点一个Python自动化办公实战实现数据汇总填充(方法五)

盘点一个Python自动化办公实战实现数据汇总填充(方法五)

作者头像
Python进阶者
发布2023-10-08 15:19:12
发布2023-10-08 15:19:12
16100
代码可运行
举报
运行总次数:0
代码可运行

一、前言

前几天在Python最强王者交流群【哎呦喂 是豆子~】问了一个Python自动化办公的问题,一起来看看吧。

下图是他的原始数据和他想得到的目标数据,如下所示:

需要在标黄的两行里边进行相关操作。

二、实现过程

上一篇文章我们针对少量数据进行了分类实现,这一篇文章我们一起来看看【隔壁😼山楂】大佬给出的pandas实现,实现多行数据的分类。多行数据,还涉及到多种系统,几十个漏洞详情,情况确实复杂了许多。

针对该问题,【隔壁😼山楂】提供了新的代码:

代码语言:javascript
代码运行次数:0
复制
# 筛选或条件
dfc1 = df[df['是否提供误报证明'].eq('是')].groupby(['系统名称', '漏洞名称', '是否提供误报证明']).agg({'ip': 'unique'}).rename(columns={'ip': '已提供误报证明ip'}).reset_index()
dfc2 = df[df['是否提供无法整改证明'].eq('是')].groupby(['系统名称', '漏洞名称', '是否提供无法整改证明']).agg({'ip': 'unique'}).rename(columns={'ip': '已提供无法整改证明ip'}).reset_index()
res = dfc1.merge(dfc2, how='outer', on=['系统名称', '漏洞名称'])
res1 = res.set_index(['系统名称', '漏洞名称'])
# 筛选与条件
res2 = df[df['是否提供误报证明'].eq('否') & df['是否提供无法整改证明'].eq('否')].groupby(['系统名称', '漏洞名称']).agg({'ip': 'unique'}).rename(columns={'ip': '没有误报和无法整改证明的ip'})
# 结果合并
res = res1.join(res2, how='outer').fillna('')
# 将结果列表处理成字符串
ip_cols = res.columns[res.columns.str.contains('ip')]
res[ip_cols] = res[ip_cols].applymap(', '.join)
# 无ip的单元格用无填充
res[ip_cols] = res[ip_cols].where(res[ip_cols].ne(''), '无')
# 保存结果
res.to_excel('result.xlsx')

这个简单来说就是筛选三次,三次的结果进行合并,运行之后可以得到预期的效果图如下所示:

这个代码还是蛮有深度的,需要点实际进行消化,确实太强了!

三、总结

大家好,我是皮皮。这篇文章主要盘点了一个Python自动化办公实战的问题,文中针对该问题,给出了具体的解析和代码实现,帮助粉丝顺利解决了问题。

最后感谢粉丝【哎呦喂 是豆子~】提问,感谢【莫生气】、【隔壁😼山楂】给出的思路和代码解析,感谢【鶏啊鶏。】、【Ineverleft】等人参与学习交流。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2023-10-05,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 Python爬虫与数据挖掘 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 一、前言
  • 二、实现过程
  • 三、总结
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档