我已经尝试修复这个网络爬行器有一段时间了,但是仍然不知道如何从findAll函数中解析出信息。我现在正在尝试网络搜索纳斯达克,纳斯达克上的每只股票都有一个股票信息表。表的第一部分,文本部分,在我的python上完美呈现。然而,当我尝试抓取表的数字端的信息时,我得到了这个:‘\r\n 120\r\n’。号码在里面,但我想不出怎么把它和其他信息分开。如果你感兴趣,这里是我的代码的其余部分。
from urllib.request import urlopen as ureq
from bs4 import BeautifulSoup as soup
my_url = 'https://w
我使用此子例程从特定类子节点中抓取文本 elements = WebDriverWait(self.driver, 10).until(EC.presence_of_all_elements_located((By.CLASS_NAME, "gamesRow")))
for a in elements:
self.formatBets(a.text) 在应用.text属性之后,转换后的字符串如下所示: May 05 1
NASHVILLE PREDATORS
-1�+150
o5�+110
-185
More +
4:08 PM
2 COLUMBUS BLUE J