首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >问答首页 >使用Ruby on Rails进行屏幕抓取

使用Ruby on Rails进行屏幕抓取
EN

Stack Overflow用户
提问于 2009-11-02 02:12:20
回答 3查看 810关注 0票数 0

我是RoR的新手。我想开发一个rails应用程序,它可以从我的rails应用程序中搜索航班信息,从不同的航空公司网站(例如,亚洲航空公司和马来西亚航空公司)获取航班信息。在我的rails应用程序中显示这些结果。

我的搜索模块应该包括以下文本字段:

代码语言:javascript
运行
复制
From: Kuala Lumpur
To: Dubai
Departure Date:2/11/2009
Return date: 19/11/2009
Departure Time: 12:00
Number of tickets: 2

用户可以在我的网站上输入上面的信息

一个脚本应该搜索航班根据这些信息在不同的航空公司网站和

显示带有提供此航班的航空公司标签的结果。

可以使用"Scrapi“或"Scrubyt”

EN

回答 3

Stack Overflow用户

发布于 2009-11-02 03:54:29

有人能提供帮助吗?

找到了另一个快速致富的方案。或者至少不要依赖于屏幕抓取。

它有很大的可能出错。找到另一种方法来获得聚合的信息。使用API(如果存在)并将计划存储在数据库中(它们很少以周为单位进行更改)。将东西存储在本地可以为您的客户提供更快的速度,还可以提供更多的服务。

以下是屏幕抓取的几个潜在问题:

对您正在抓取的站点进行

  • 小更新可能会破坏您的工具。从你服务器的IP中抓取信息的尝试可以是denied.
  • Depending on
  • ,你甚至可能会被起诉。
票数 5
EN

Stack Overflow用户

发布于 2011-05-02 21:08:37

要开始抓取,您可以参考帖子-

http://rorguide.blogspot.com/2011/04/simple-ruby-screen-scraper-using.html (使用Mechanize,Hpricot和XPath的简单红宝石屏幕刮板)

http://rorguide.blogspot.com/2011/04/simple-ruby-screen-scraper-in-just-5.html (无需使用XPath,只需5行代码即可实现简单的Ruby屏幕抓取器)

这只是为了理解

票数 2
EN

Stack Overflow用户

发布于 2013-04-07 12:43:02

止咳watir-webdriver (gem)

DOM无法隐藏

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/1657859

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档