首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >423世界读书日,知乎推荐+知识付费目录的统计2021.4.23

423世界读书日,知乎推荐+知识付费目录的统计2021.4.23

作者头像
用户7138673
发布2022-09-22 08:04:32
发布2022-09-22 08:04:32
3690
举报
文章被收录于专栏:大大的小数据大大的小数据

今天是423世界读书日。

有知乎推荐书目100本,有知识付费文件和地址名12万条目录。

统计每本书在目录中出现的次数。

简单认为,出现次数多的书籍推荐阅读。也可以对感兴趣的书籍要阅读前,看看知识付费中解读、听书的内容感兴趣再深入阅读。

推荐:人类简史、未来简史、非暴力沟通、被讨厌的勇气、少有人走的路、自私的基因、乡土中国、娱乐至死。

code:

读取CSV文件,循环遍历内容,用知乎推荐书名查找目录内容,将查询得的次数统计,写入文件。

代码语言:javascript
复制
with open('知识付费百度网盘目录2021.4.21.txt', 'r',encoding='utf-8')as g:
    data = g.read()

    with open('知乎推荐书目.csv', 'r',encoding='GBK')as f:
#    with open('2020.12.29豆瓣50页12万.csv', 'r',encoding='GBK')as f:
        reader = csv.reader(f)
        count = 0
        a = 1
        if a == True:
#        while count < 50:
            for row in reader:
                count += 1
                print(count)
    #            print(row[11])
                try:
                    书名 = str(row[0]).replace('\n', '').replace(' ', '')
                    全部书名 = re.findall(书名,data)
                    
    #                print(全部书名)
    #                print(len(全部书名))
                    #写入csv
                    with open('结果2021.4.23-测试2.csv', 'a+', newline = '\n',encoding='utf-8')as h:
                        w = csv.writer(h)
                        w.writerow([书名,len(全部书名)])
                except:
                    #写入csv
                    with open('结果2021.4.23-测试2.csv', 'a+', newline = '\n',encoding='utf-8')as h:
                        w = csv.writer(h)
                        w.writerow([书名,'错误'])
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-04-23,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 大大的小数据 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档