我有一个爬虫的基本结构。现在我在一些php驱动的网站上发布了它,它就像一个护身符。不过,现在我想让它从ajax内容构建数据表。目前,我正在使用Mechanize for PYTHON和perl来构建我的爬虫。虽然机械化模块不执行AJAX。如何访问由异步ajax构建的内容?我知道有一种叫做Selenium的东西,一种真正的自动化浏览器。但这是我唯一
我在我的Python2.7目录中保存了mechanize。但是当我在Python shell中键入import mechanize时,我得到一条错误消息: File "<pyshell#0>", line 1, in <module>ImportError: No module named mechanize
我正在使用mechanize for python,并且我正在尝试在kijiji中搜索一个项目。最终,我的目标是让我的程序搜索一个项目,然后通过美汤检查是否有人为我的搜索词发布了新的广告,方法是搜索来自输入搜索词的html源,如果有新的广告出现,就给我发电子邮件,这样我就可以成为第一个响应的人。下面是我的代码,但我得到了一个错误:“没有控件匹配名称‘关键字”。我不确定我做错了什么。import <e