我正在尝试构建一个机器人来从https://matcherino.com/tournaments/17147/overview中检索一个特定值,但是使用requests.get会弹出一个与站点不匹配的源代码它似乎拉出了聊天机器人的源代码,以便与网站的创建者交谈。matcherino.com')
r = s.get('https:&
我试图用下面的代码从网站的检查元素代码中获取所有链接。path=97.0.4692.71/'soup = BeautifulSoup(r.text, 'html.parser')
for link in soup.find_all然后,我通过打印它来检查soup是什么,并将它与在实际网站上查看元素和查看页面源后得到的代码进行比较。print(source)返回的代码与单击“查看页源”
我正在尝试解析Grooveshark中的歌曲,但我不知道如何访问JavaScript更新的源代码。当我使用URL时,我得到的是原始源,而不是由JavaScript更新的实况源,这意味着我不能访问一些新的ID数据。doc.DocumentNode.SelectSingleNode("//*[@id='now-playing-metadata']/a");
text = node.FirstChild.InnerText.