本想做一下酷狗音乐的产品分析,分析学习一下酷狗是怎么做的产品迭代,但是手机乐园网站居然做了限制不让我复制酷狗的版本更新信息,所以我就只能把它给扒了,哈哈哈......
先介绍一下用的的python的一些库和资源:
BeautifulSoup:以 Python 风格的方式来对 HTML 或 XML 进行迭代,搜索和修改。
requests:人性化的HTTP请求库。
XlsxWriter:一个用于创建 Excel .xlsx 文件的 Python 模块。
NumPy:使用 Python 进行科学计算的基础包。
代码编写逻辑如下:
获取到网页数据-》对需要的数据进行拆分组合-》将需要的数据保存到excel
希望可以对需要做产品分析获取产品版本更新资料的朋友有用,所以将代码附上,下载地址在文章底部。
这里只展示主执行程序:
# -*- coding: utf-8 -*-
import html_downloader,html_parser,html_outputer
# 程序的入口
if __name__ == “__main__”:
#想获取APP版本更新的数据地址
baseUrl = “https://soft.shouji.com.cn/down/18684.html”
#下载网站数据
pageLoader = html_downloader.HtmlDownloader()
pageContent = pageLoader.get_page(baseUrl)
# 对下载数据进行拆分组合
pageParser = html_parser.HtmlParser()
versionNumResult = pageParser.parse(pageContent)
# 保存需要的数据到excel
pageOutputer = html_outputer.HtmlOutputer()
pageOutputer.save_to_excel(versionNumResult,’test1′)
获取到的结果展示:
遇到的问题:
感觉很久没有写代码了,写代码其实还是蛮有乐趣的,哈哈哈哈....现学现用python,花了快一天完成的上面的代码,虽然对于一些大佬来说是小意思没什么难度,但是自己折腾出来,感觉还是挺棒的。python附带的库资源真的蛮多的,比较灵活可以根据自己的需求选择对应的库,整体感觉还可以,有空可以在瞎折腾一下。
哈哈,周末快乐,刷电影去了。
下载地址:
https://github.com/henya/phoneLy.git
馄饨世界
用了这么久了,
也还没关注公众号
领取专属 10元无门槛券
私享最新 技术干货