首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >尝试解析文件中的所有URL,在本例中为远程URL

尝试解析文件中的所有URL,在本例中为远程URL
EN

Stack Overflow用户
提问于 2012-03-20 09:39:26
回答 2查看 241关注 0票数 1

我正在尝试解析3个参数(这是可行的),并请求一个包含一堆txt和URL的文件。我试图将每个URL放入一个数组中,我尝试了一些正则表达式,但没有成功,也尝试了scan(URI.regexp)等.c,但看不出我做错了什么。

代码语言:javascript
运行
复制
#!/usr/bin/env ruby
require 'uri'
require 'open-uri'

HOST=ARGV[0]
ID=ARGV[1]
VERSION=ARGV[2]
MYLINKS = Array.new

file = open("http://#{HOST}/v1/dc/manifest/#{ID}/#{VERSION}").read

file.each_line do |line|
    #puts "doing #{line}" # this works..
    MYLINKS << URI.extract(line, ['http', 'https'])
end

PS:该文件是一个JSON文件。这一切都是在Bash脚本上进行的,但我正在将其迁移到Ruby。在Bash脚本中,我将文件下载到/tmp,然后使用awk/tr等进行解析。

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2012-03-21 08:15:31

使用像HTTParty这样的API客户端,您实际上不需要了解JSON,因为响应被解析成您可以提取的数据结构。您可以从一个简单的类开始:

代码语言:javascript
运行
复制
require 'httparty'

class MyApi
  include HTTParty
  format :json
end

然后,您可以执行以下操作:

代码语言:javascript
运行
复制
response = MyApi.get("http://#{HOST}/v1/dc/manifest/#{ID}/#{VERSION}")

响应将被解析为散列结构,您将能够以一种健壮的方式从其中提取URL。

如果您的API需要身份验证或发布数据,则很容易添加。gem本身中有several examples,所以您可以看到各种事情是如何完成的。

票数 0
EN

Stack Overflow用户

发布于 2012-03-20 12:27:12

您应该首先将常量MYLINKS替换为变量,例如my_links。这将允许您向my_links数组添加元素。Ruby将假定任何以大写字母开头的名称(例如MYLINKSMyLinks)都是常量。

代码语言:javascript
运行
复制
#!/usr/bin/env ruby
require 'uri'
require 'open-uri'

HOST=ARGV[0]
ID=ARGV[1]
VERSION=ARGV[2]
my_links = []

file.each_line do |line|
    my_links << URI.extract(line, ['http', 'https'])
end
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/9780347

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档