所以我刚刚开始使用Coursera在线课程"Python for Everybody“学习python,我有一个作业,我必须使用漂亮的汤来访问链接。我以前看到过这个问题,但当我尝试使用它时,它就是不起作用。我设法创建了一些东西,但它实际上并没有通过链接,而是停留在同一个页面上。如果可能的话,有没有人可以提供更好的材料来更好地了解这项任务?谢谢。position = int(pn)-1
html = urllib.request.urlopen(u
我正在尝试提取一个使用美丽汤的链接。 这是我的汤的摘录。我试图提取的是"href“之后的链接。然而,我一直在尝试的东西都不起作用。span></a><div class="action-menu-panel ab_dropdown" role="menu" tabindex="-1" > 我的想法是: for link in soup.find_all
我正在使用Beautiful 4解析一些html格式的文本,这些文本是从互联网上刮来的。有时,这篇文章只是指向某个网站的链接。BeautifulSoup is notbehind the URL, and feed that document to BeautifulSoup.我使用控制台监控脚本的活动
所以我可能只是在这里装傻,不了解python的基本机制,但我正在尝试浏览和爬行一个网页,然后获得一个新的链接并递归地继续。def go_to_next_page(soup, data, curr_link): # gather informationand append to data
new_link = "" # unless I find link with BeautifulSoup
我在beautifulSoup4 and Selenium webdriver中使用python2.7。现在,在我的webautomation脚本中,我将打开链接或URL并进入主页。现在,当我要转到一个新页面时,我需要从浏览器获取新的URL,因为我需要传递用于网页抓取的BeautifulSoup4。所以现在我关心的是如何以动态的方式获得这样的URL?
如果有建议,请多多指教!