作为电商行业来说,价格始终是一个比较重要的话题,尽早地了解价格的变动,对于运营也极为关键。而对于个人来说,就像加入购物车一样,对于想购买的商品可以同时对多个商家在售的同一个品加入购物车,这样想买的时候就可以在购物车里面进行比价,但是这个只能局限在个人的范围内,如果想要更多的人关注的话,加入购物车的操作就显然力不从心了,所以希望能得到如下效果的导航界面,并能实时刷新。
Power Query作为一款便捷的数据获取及整理的工具,对于网站的商品价格进行实时抓取也是作为体现其价值的一个方面。
以京东网站为例,在搜索栏输入“Power Query 实战”关键词后,可以得到一大堆的搜索结果,以新上市的《Power Query实战:Excel智能化数据清洗神器应用精讲》这本书为例,可以看到有众多的店铺在进行售卖。
这么多售卖的商品中,怎么才能第一时间同步得到价格的信息呢?现在通过Power BI中的PQ工具来实现。
1. 打开单个的商品链接,得到商品的链接地址
2. 在Power BI中使用从Web导入的方式。
3. 观察自动获取的数据信息
一个是表2,里面有价格可以直接获取;另外一个是HTML代码,以便于我们后期获取店铺名,商品标题等信息。
4. 分别获取价格,店铺名,商品标题
1)价格获取并整理
通过前面第3步骤的时候看到的,表2中就带有价格,直接通过定位到39.5的那个位置即可。同时为了批量获取价格,可以把这个步骤写成自定义函数,只需要商品链接作为唯一的参数即可。
中间的代码不需要看,都是Power BI智能解析所使用的公式,只需把原先的链接改成参数,做成自定义函数即可。
2)店铺名称
除了导入进来的表2,我们还导入了一个HTML代码的数据,其导入到Power Query后如下所显示。
可以通过这些代码中找到我们所需要的内容并进行整理。
a) 首先通过Lines.FromTex函数,把导入到进来的Text格式,根据行进行拆分
b) 随后通过List.Select在拆分后的列中通过关键词把所需要的内容给找到。
通过观察,可以得知包含的关键词为“dianpuname1”
c) 最后通过提取分隔符之间的内容,把所需要的信息整理出来。
也就简简单单地4,5步即可。
和之前获取价格时一样,把过程整理成自定义函数,方便后续批量处理。
3)标题名称
和上面获取店铺名称一样,但是关键词可通过观察,可以得到 “<title>”和“</title>”。
5. 导入所需要抓取的商品链接
如果数量少可以直接使用创建表的方式,如果数量多,也可以通过Excel导入的方式,这里因为数量少直接使用了创建表的方式。
6. 通过添加自定义列的方式把所需要的信息给一并抓取
7. 更改数据类型以便于更好地展现
如果有添加图片链接,可以把图像 URL;同时如果有超链接跳转的,也可以把链接字段改成Web URL
为了美观Web URL的链接,不需要详细列出链接地址,可以在URL图标这里进行设置,以达到美观的目的。
8. 上传到Power BI线上,并发布到Web(公共)上以便于共享。
最后可以通过各类方式进行刷新获得最新的价格。
以上一些Power Query的使用技巧,可以在《Power Query实战:Excel智能化数据清洗神器应用精讲》一书中的第13章和14章中都有类似函数应用的说明。
01. 本书有什么特点?
02. 如何通过本书了解,熟悉,理解,掌握一步步升级Power Query的能力?
了解:
通过第1章,从Power Quyer的菜单界面,函数,语法以及数据的引用初步了解。
熟悉:
通过2-3章,使用主要的数据获取功能来熟悉Power Query的操作。
通过4-7章,对比常用Excel函数操作的功能,更能快速上手。
理解:
通过8-13章,结合综合案例,对于工具及其函数的使用进一步地提升。
掌握:
通过14-15章,对各个函数的组合并实现自定义函数的创建,同时通过对接人工智能API,更进一步实现数据源的多样性。
03. 大咖推荐
在本书出版的同时,也得到了业内众多大咖的认可和推荐,希望能够让更多的人了解并喜欢。
04. 实图拍摄