我正在尝试从Google下载一个新闻语料库(尝试做一些自然语言处理),使用通用的python源解析器。我对XML一无所知,我只是使用一个如何使用know解析器的示例。问题是,我无法从RSS提要中找到新闻的内容,而只是标题。
我目前试图使用的代码是:
import feedparser
url = 'http://news.google.com.br/news?pz=1&cf=all&ned=us&hl=en&output=rss'
# just some GNews feed - I'll use a specific search l
我是selenium/python的新手,这就是我的问题:我有一个简单的网站,里面有几条新闻。我试着写一个脚本,遍历所有新闻,打开每个新闻,做一些事情,然后返回到所有其他新闻。所有新闻都有相同的xpath,区别只有最后一个符号-我试着把这个符号作为变量,循环所有新闻,在每次访问新闻后递增我的变量:
x = len(driver.find_elements_by_class_name('cards-news-event'))
print (x)
for i in range(x):
driver.find_ele