我正在尝试使用splash为一个更复杂的站点获取在网页中读取的代码,但我甚至无法为这个简单的站点位置运行代码。我运行了docker,并在settings.py文件中将8050端口映射到0.0.0.0。更改Splash、Scrapy和Twisted的版本。Scrapy只能在Python 3.x上使用较新版本的Twisted,但Splash表示无法与Twisted > 16.2相媲美。parse(self, response):
for quote in respons
我正在使用xPath尝试从表的以下部分获取title文本:
<td class="title" title="if you were in a job and then one day, thet=3198695">1</a></span> <span><a href="showthread.php?t=3198695&page=4">4<
我对scrapy和XPath很陌生,但用Python编程已经有一段时间了。我希望使用scrapy从页面email、name of the person making the offer和phone中获取https://www.germanystartupjobs.com/job我的想法是首先在Job Overview中获取文本,或者至少在所有讨论各自任务的文本中使用ReGex来获取email、phone