首页
学习
活动
专区
圈层
工具
发布

八佰:用Python看知乎 vs 豆瓣的战斗

(知乎、豆瓣对《八佰》评价的两极分化) 之前的国产电影《战狼2》、《流浪地球》等也曾出现过很大的争议,但都没有达到如此程度。 而且!...在开刚上映初,知乎的评分比这还低,在另一平台则是点映9.2、豆瓣8.3分。 《八佰在豆瓣的初始评分》 要不我们用Python爬爬评论看看差异吧?...爬取豆瓣 再来个词云 参考一款高颜值的词云包让我拍案叫绝 import stylecloud from IPython.display import Image  stylecloud.gen_stylecloud...fa-frown',size=400,                           output_name='八佰-知乎.png') Image(filename='八佰-知乎.png') 生成词云: 豆瓣...比如知乎的最高赞回答: 豆瓣的最热门短评: 你明白吧,双方陷入了一种 emmm 矫枉过正? 还是想体现出自己的大局观? 在看你就戳戳我! ?

68240
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    教你用python登陆豆瓣并爬取影评

    这是我的第二篇原创文章 在上篇文章爬取豆瓣电影top250后,想想既然爬了电影,干脆就连影评也爬了,这样可以看看人们评价的电影,再加上刚出不久的移动迷官3好像挺热的,干脆就爬他吧,爬完看看好不好看!...鼠标所点的就是我接下来要爬的网站,先看看他的response和请求头之类的信息,他的请求方式时get,response是一个网页结构,这就好办了,我们就可以用正则来匹配出所要的数据,正则还是个很好用的东西...2.用re+requests获取数据 获取信息 ?...3.模拟登陆豆瓣 首先需要看看登陆需要什么参数,这个参数是在豆瓣的登陆网址,先打开登陆,打开开发者工具(要不会看不到后面这个所需要的网页),填好信息点击登陆,然后点击这个login网页,往下拉就会看到From...若需要完整代码在我后台回复影评即可,若需要python相关的电子书也可以回复pdf获得,日后还会有更多福利发给你

    902100

    Python用16行代码就搞定了爬取豆瓣读书页面

    点击蓝字“python教程”关注我们哟!...我们一直说Python比较简单,代码体量没有别的程序那么大,对于初学者,尤其是零编程基础的初学者来说,感触没有那么明显,那么今天就让你见识一下:爬取豆瓣读书页面,Python用16行代码就搞定了!...首先我们先确定好要爬取的目标网页: 豆瓣读书下一个标签为小说的页面: 敲黑板!干货来了同志们!下面我将带领着大家用16行代码实现我们的这个爬虫。仅仅需要16行代码,看了不吃亏,看了不上当!...注意事项 01 对Python开发技术感兴趣的同学,欢迎加下方的交流群一起学习,相互讨论。...02 python交流学习扣扣群:934109170,多多交流问题,互帮互助,群里有不错的学习教程和开发工具。学习python有任何问题(学习方法,学习效率,如何就业),可以随时来咨询我 好啦!

    81620

    python评分卡代码_python爬虫书籍豆瓣评分

    如果你好奇我方如何将give me some credit数据集AUC达到0.929,可参考教程《python信用评分卡建模(附代码)》 《python信用评分卡建模(附代码)》中give me some...《python信用评分卡建模(附代码)》讲解Kmeans,等频分箱、等距分箱,卡方分箱,决策树分箱算法原理和python实现分箱代码。《python信用评分卡建模(附代码)》还告诉你如何选择分箱方法?...单个 bin 内的所有观测值的概率相同,因此用概率替换相当于将决策树决定的截止值内的观测值分组。 决策树分箱算法好处和缺点是: 好处 : 概率预测返回的决策树与目标单调相关。...目前流行Java,python或R多种语言构建评分卡自动化模型系统。如果数据量大,建立自动信用化评分系统并非易事,需要专业团队不断测试和更新。...基于Python的信用评分卡模型-give me some credit就为大家介绍到这里了, 参考资料:python金融风控评分卡模型和数据分析微专业课(加强版)> 版权声明:文章来自公众号(python

    1.7K60

    Python登录豆瓣并爬取影评

    , 用代码讲解下Cookie的会话状态管理(登录)功能。...而豆瓣口碑一直不错,有些书或者电影的推荐都很不错,所以我们今天来爬取下豆瓣的影评,然后生成词云,看看效果如何吧! 二、功能描述 我们使用requests库登录豆瓣,然后爬取影评,最后生成词云!...由上图我们可以看到,对于http客户端python官方文档也推荐我们使用requests库,实际工作中requests库也是使用的比较多的库。...1.分析豆瓣影评接口 首先在豆瓣中找到自己想要分析的电影,这里猪哥选择一部美国电影《荒野生存》,因为这部电影是猪哥心中之最,没有之一! ?...from=singlemessage&isappinstalled=0 当然也可以加入到猪哥的Python新手交流群中和大家一起学习,遇到问题也可以在群里提问!

    1.9K20

    12行Python暴力爬《黑豹》豆瓣短评

    今天,本文将带领小伙伴们通过12行简单的Python代码,初窥爬虫的秘境。 爬虫目标 本文采用requests + Xpath,爬取豆瓣电影《黑豹》部分短评内容。...通过tqdm模块实现了良好的交互 工具准备 chrome浏览器(分析HTTP请求、抓包) 安装Python 3及相关模块(requests、lxml、pandas、time、random、tqdm) requests...随机数生成工具,配合time使用 tqdm:交互好工具,显示程序运行进度 基本步骤 网络请求分析 网页内容解析 数据读取存储 涉及知识点 爬虫协议 http请求分析 requests请求 Xpath语法 Python...豆瓣短评页面请求分析 通过请求分析,我们找到了目标url为 'https://movie.douban.com/subject/6390825/comments?...作为简单demo,本文仅对前11页内容进行爬取) requests请求 通过requests模块发送一个get请求,用content方法获取byte型数据,并以utf-8重新编码;然后添加一个交互,判断是否成功获取到资源

    93660

    12行Python暴力爬《黑豹》豆瓣短评

    今天,本文将带领小伙伴们通过12行简单的Python代码,初窥爬虫的秘境。 爬虫目标 本文采用requests + Xpath,爬取豆瓣电影《黑豹》部分短评内容。...通过tqdm模块实现了良好的交互 工具准备 chrome浏览器(分析HTTP请求、抓包) 安装Python 3及相关模块(requests、lxml、pandas、time、random、tqdm) requests...随机数生成工具,配合time使用 tqdm:交互好工具,显示程序运行进度 基本步骤 网络请求分析 网页内容解析 数据读取存储 涉及知识点 爬虫协议 http请求分析 requests请求 Xpath语法 Python...豆瓣短评页面请求分析 通过请求分析,我们找到了目标url为 'https://movie.douban.com/subject/6390825/comments?...作为简单demo,本文仅对前11页内容进行爬取) requests请求 通过requests模块发送一个get请求,用content方法获取byte型数据,并以utf-8重新编码;然后添加一个交互,判断是否成功获取到资源

    71630

    python爬虫获取豆瓣电影TOP250

    在之前的博客中,小菌分享了几篇关于python爬虫的小程序,受到了许多小伙伴们的认可,小菌还是比较激动٩(๑>◡python方向的,很多的内容都是自己找资料自学的...同样本篇博客,小菌将继续分享实用的爬虫—获取豆瓣电影Top250的内容,并保存在MySQL数据库中。...关于豆瓣电影在百度百科上的描述,如下: 豆瓣电影提供最新的电影介绍及评论包括上映影片的影讯查询及购票服务。你可以记录想看、在看和看过的电影电视剧,顺便打分、写影评。...是不是心动了,嘿嘿~我们先根据网址https://movie.douban.com/top250来到豆瓣Top250的官网页面。 ? 我们发现该网页共有十页的数据!...可以看见我们的数据库中,存储着豆瓣电影Top250的数据,说明我们的爬虫程序成功了!那本次的分享也就到这里了,学到了的小伙伴们不要忘了点赞并关注小菌吖~点赞加关注,小白不迷路ヾ(๑╹◡╹)ノ"

    1.2K10
    领券