作者:solideogloria
来源:https://blog.yasking.org/a/python-and-selenium-qqvote.html
抽时间研究下QQ群投票信息的获取,比较适合(高频次/投票人数较多)的投票统计。不知道QQ群有没有API可以获取投票信息,反正找了一圈没发现。那就想想看怎么办
QQ客户端肯定是没办法了...自然而然的想到网页版也有群空间之类的地方,可以下载群文件,查看群相册什么的。去碰碰运气,然而只可以发起投票,不能获取投票的人名称什么的。比较难办,最后翻翻用手机看看,天无绝人之路,在投票页面可以复制投票地址。
类似这样的URL:
在浏览器中直接打开会出现"载入中,请稍后..."的字眼。这是因为没有登陆,没有权限
在这里登陆自己的QQ,再访问就可以了
此时的选项是不可点击的,因为网页检测你的浏览环境不是手机界面,并且是不可触摸的
在Chrome下很好解决,只需进入响应式模式即可,如果是火狐,则需要进入火狐后再次点击"加载触摸事件",就可以点击进入详情页
既然在浏览器端已经可以获取到这些数据,那么应该就可以使用python和selenium来获取数据
自然而然的想到如何让Chrome和Firefox来进入这种模式呢?
单单换UA和窗口尺寸是不行的,因为不会加载触摸事件。
Firefox driver我没有找到这样的操作,好在Chrome可以。主要代码如下:
这样获得的driver就可以正常浏览投票页面了
还有个值得注意的是当投票人数比较多的情况下,不会一次加载完成的。每当鼠标滚动到最下方,就会加载一些数据。我最开始本打算用selenium进行点击拖动来加载数据,后来查询到可以用js控制右侧的滚动条来实现
这里比较偷懒,尝试拖动三次,其实应该在首页获取投票人数,第一次加载100人,看看QQ的js,找到之后一次加载多少数据后,得到循环的次数...
其它的就没什么好说的了,先登录,然后访问投票页面。
完整的代码在这里:python-qqvote
只获取了投票第一项的数据,如果不知道投票选项,需要在投票首页的地方获取投票选项数量,比较懒...就这样吧
QQ投票页面的数据中只有用户昵称,比较可惜,不过可以在QQ群空间获取QQ号和昵称的对应关系。
获取QQ群成员的代码在这里:python-qun-people
参考:
https://sites.google.com/a/chromium.org/chromedriver/mobile-emulation
http://blog.csdn.net/winterto1990/article/details/48215941
题图:pexels,CC0 授权。
领取专属 10元无门槛券
私享最新 技术干货