我想抓取一个网站,只支持张贴数据。我想在所有请求中发送post数据中的查询参数。如何做到这一点?
发布于 2013-07-12 22:46:45
可以使用scrapy的Request或FormRequest类发出POST请求。
此外,请考虑使用start_requests()
方法而不是start_urls
属性。
示例:
from scrapy.http import FormRequest
class myspiderSpider(Spider):
name = "myspider"
allowed_domains = ["www.example.com"]
def start_requests(self):
return [ FormRequest("http://www.example.com/login",
formdata={'someparam': 'foo', 'otherparam': 'bar'},
callback=self.parse) ]
希望这能有所帮助。
https://stackoverflow.com/questions/17625053
复制相似问题