我正在尝试用scrapy制作一个专门针对网络爬虫的爬虫,它会返回我的结果的一个对象。我被卡住了,可能会把事情搞得一团糟。更具体地说,对于上的每个子论坛(数学、物理等),我希望获得每个子论坛中所有线程的标题,并以一个对象结束,该对象具有论坛名称和论坛中所有线程的标题列表。我写的爬虫看起来像这样,但功能不像预期的那样: from scrapy.selec
我在php中有一个DOM网络爬虫,它工作得很好。它所做的就是从论坛站点中提取所提到的特定类语句,并在我的php页面中回显它们。因此,由于论坛站点有超过1000+的帖子,DOM解析器代码提取上限,并将错误打印为Fatal error: Maximum execution time of 30 seconds exceeded in