例如,我有一个名为single_Word的列表,它由四个字符串组成:我想提取第一个单词(或者基本上是‘in’之前的任何字符串),这样它就可以返回以下输出:下面的代码显示了我打算做的事情:for text in single_Wordtwo_Word =“媒体新闻在线”、“汽车保险”、“技术电子邮件账户”、“<em
我需要刮的汽车排名从许多网站。我在网站上发现排名有困难,因为它们都有点不同。我的目标基本上是有一个脚本,将自动检测排名和检索我需要的数据(品牌+汽车模型在排名),在任何给定的汽车网站上,一个相当高的准确性。我用BeautifulSoup用Python做这件事。编辑:
要明确的是,我很难分析数据,而不是刮 it (见下面的评论)。