折腾了好几天,终于算是有了最后的结果了,哈哈,暂时本人实现了滑动抖音视频,同时用很笨的方法躲过抖音的反爬,最后将抖音视频的链接保存下来。
大概就这些。
然后点击StartServer按钮启动服务。 4.配置模拟器信息 点击下面那个按钮。
然后根据我的模拟器信息,输入自己对应的版本信息等,最后点击Start Session,如果链接成功的话,会跳转到后面的界面。
链接成功界面
这就表明基本的连接已经成功了!!
接下来就是使用脚本来控制模拟器,同时获取视频连接。 刚开始试图使用网络抓包的形式获取视频链接,但是douyin做的反爬太强了,或者是我想的不够全面,很难从网络抓包中获取有用的信息。 最后想了一个办法,就是我窃取不来,我就想办法想你要,你主动给我,发现每个视频有个分享按钮,然后在访问分享的url确实可以访问视频,于是抓住了这次机会,就每次滑动屏幕,每次点击分享按钮,每次复制按钮,获取到分享信息后使用正则匹配到url和相对应的文案信息。 下面晒出我的代码,里边设计了一些简单的技巧,防止一些意外发生导致爬取停止。
Message: An unknown server-side error occurred while processing the command. Original error: Failed to execute touch even
我相信,能有爬取这些视频想法的人,应该基本的代码可以看懂,我就不多解释了。 下面贴出我的代码:https://github.com/caidhome/crawl_python
下面是整个爬取的示例,想插入视频但是好像不太方便,好麻烦就不插入了。
大概就这样就可以爬取链接了, 报错的文件内容如下:
下载视频就不写了,都能爬下来了,我想下载应该不难吧,根据自己的需求,自己写代码下载吧。
以上纯属学习使用,不可作商用,如有侵权,请及时留言。 有什么写错的地方请批评指正。
参考链接: https://www.jb51.net/article/204817.htm https://blog.csdn.net/weixin_43582101/article/details/89600007 https://blog.csdn.net/fei347795790/article/details/106192089/