腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
我
不
能从
网
站上
抓取
特定
的
标题
、
、
我
正在使用scrapy从亚马逊网站
抓取
数据,当我使用选择器小工具显示路径时,它有title类,所以它不会提取该
标题
。相反,当我为一个类使用{.s-access-title}时,它就可以工作了。
我
不确定为什么选择器小工具显示了错误
的
路径。items = AmazonsItem() product_name = response.css('.s-access-title').extract()][1] 如果你看这张图片,
我
只选择了
标题
浏览 12
提问于2019-04-16
得票数 0
1
回答
如何从节点
的
自定义视图模式中删除
标题
字段
、
在
我
的
Drupal 8
网
站上
,
我
通过UI创建了一个自定义视图模式。
我
使用它来使用视图输出节点。 在视图结果中,
我
不
希望节点
的
标题
出现。UI (内容类型>管理显示)似乎没有给出隐藏
标题
的
选项。如何通过UI或自定义代码将
标题
隐藏在
特定
的
视图模式中?
浏览 0
提问于2015-10-22
得票数 6
2
回答
如何从外部网站重建图像预览?
、
、
、
、
类似于Facebook
的
用户界面,
我
正在尝试从外部链接
的
网站生成预览图像。因此,当用户输入他正在链接
的
url时,UI将默认地扫描该站点
的
img并
抓取
预览拇指。非常感谢!
浏览 1
提问于2011-01-02
得票数 5
回答已采纳
1
回答
nutch -如何
抓取
特定
类型
的
文件?
、
是否可以定义将被爬
网
的
特定
文件类型?是否可以定义“
我
只想
抓取
”,比如.doc文件?
浏览 0
提问于2012-01-23
得票数 0
1
回答
为什么
我
的
网
刮刀不
能从
美洲豹网
站上
抓取
数据?
、
、
、
、
我
正在写一个脚本,从美洲豹
的
官方网站- 上刮取产品细节。def puma_product_scraper(): prices = [] options = webdriver.ChromeOptionsPU
浏览 0
提问于2021-05-07
得票数 1
回答已采纳
2
回答
我
如何从Capybara
的
网页评论中获得一些信息?
、
接下来
的
另一个问题,
我
尝试使用
标题
作为唯一标识符,但最终发现它们在
我
使用
的
网
站上
不是唯一
的
。但是,每个页面的注释中都包含一个唯一
的
标识符。 使用Capybara,
我
如何访问网页上
的
评论?具体地说,是在第一个html之前
的
根部
的
注释。在其中,
我
至少可以使用水豚
抓取
包含注释
的
元素(即使
我
不能
抓取
注
浏览 2
提问于2011-10-13
得票数 1
回答已采纳
1
回答
Java -同时执行两个腐蚀循环
、
下面有两个用java编写
的
for循环。第一个
抓取
网
站上
所有新闻文章
的
标题
,第二个
抓取
同一
网
站上
同一篇新文章
的
所有链接。非常感谢您
的
帮助,谢谢。
浏览 1
提问于2016-09-23
得票数 2
回答已采纳
1
回答
使用非替换InnerHTML替换document.write
、
、
、
、
我
目前正在使用import.io在网上
抓取
信息。
我
正在从天气网
站上
抓取
数据,以显示统计项目在单个邮政编码上
的
不一致程度。document.write("<i>" + k + "</i>" + "<p>" + d.data[k] + "</p>");
我
的
问题是这个document.write擦除了
我
浏览 0
提问于2014-03-28
得票数 1
1
回答
使用cheerio和node.js从span获取文本
、
嗨,
我
正在试着在跨度内写一段文字,其中一个是“文本要得到”。
我
得到
的
div与class=“成员限制-节捕获-区域”使用cheerio和node.js,但我不
能从
跨度
的
文本。
我
有这个函数来得到div,
我
可以看到它里面确实有更多
的
元素,但是
我
不能得到文本。
浏览 16
提问于2020-04-22
得票数 1
5
回答
谷歌什么时候会重新
抓取
一个网站?
、
谷歌什么时候会重新
抓取
一个网站?为什么Google在Cache中有同一页面的两个版本?? forum.portal.edu.ro/index.php?
浏览 14
提问于2009-08-04
得票数 0
回答已采纳
1
回答
Ruby获取页面内容
、
我
有一个Ruby应用程序,
我
想要检测网
站上
是否安装了
特定
的
Javascript。在大多数网
站上
,使用以下代码来获取该页面的内容是没有问题
的
: user_agent = "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_7_0) AppleWebKitdoc = Nokogiri::HTML(open(url, 'User-Agent'=>user_agent, 'read_tim
浏览 1
提问于2016-12-29
得票数 0
2
回答
用于解析网站和搜索
特定
单词
的
工具
、
、
、
是否有一个工具可以帮助解析一个网站并寻找一个
特定
的
单词?不只是
我
的
页面,为此,
我
可以简单地使用CTRL+F快捷方式,但整个网站。
浏览 0
提问于2015-12-02
得票数 1
回答已采纳
1
回答
尝试下载图像时出错403,但不显示
、
当我试图对图像
的
Url做任何操作时,
我
得到了一个错误403 (无论是获取文件大小还是下载它),但是
我
在试图显示图像时没有任何错误。
我
希望
我
说得够清楚,但如果需要的话,这就是url提出问题
的
一个例子:
我
使用这段代码来获得文件大小,这个文件很好用,但在这个站点上不是这样
的
: public void getFileSize(stringthis, ex.Message, "Exception :", MessageBo
浏览 4
提问于2016-06-28
得票数 1
回答已采纳
2
回答
用Python从任何网站
抓取
链接
标题
的
一般方法是什么?
、
、
、
、
有没有一种用Python从任何网
站上
抓取
链接
标题
的
“通用”方法?例如,如果
我
使用以下代码:from bs4 import BeautifulSoup for title
浏览 8
提问于2017-01-11
得票数 2
3
回答
我
需要在复选框中添加
特定
节点
的
标题
。
、
我
希望在Webform上
的
Select中显示来自Content
的
特定
节点
的
标题
字段。从技术上讲,它不应该
抓取
该内容类型
的
所有节点
标题
,它应该只
抓取
特定
的
节点(
我
需要以某种方式标记),所以我想我需要创建一个词汇表,并以某种方式将其分配给节点,但是
我
不
希望能够使用这个分类法术语来获取这些节点
的
标题
浏览 0
提问于2013-12-16
得票数 3
3
回答
我
怎样才能停止一个粗糙
的
CrawlSpider,然后从它中断
的
地方恢复?
、
我
有一个
抓取
有一个非常大
的
URL列表
抓取
。
我
希望能够停止它,保存当前状态,并在以后恢复它,而不必重新开始。有没有办法在Scrapy框架中实现这一点?
浏览 0
提问于2011-09-06
得票数 13
回答已采纳
2
回答
不能在Slack移动网
站上
发布消息
我
从
我
的
手机网络浏览器(在Android 5.1上使用Chrome 48 )登录Slack,
我
看到:唯一能看到频道
的
方法是点击顶部
的
菜单按钮,这会带来这个菜单:然后点击“消息档案”,这让
浏览 0
提问于2016-02-20
得票数 4
1
回答
使用apache nutch对solr中
的
结构进行索引
、
、
、
、
在一个二手车销售商网
站上
有成千上万
的
汽车广告,这是一个典型
的
广告->
标题
,描述,汽车里程,电源简历(Hp),而不是整个页面,
我
使用nutch,因为它与solr有很好
的
集成,但nutch已经准备好
抓取
浏览 0
提问于2016-08-02
得票数 0
2
回答
自动添加今天
的
日期和时间到新
的
实体
标题
创建时?
、
当创建一个新
的
实体时,
我
希望能够自动地将今天
的
日期/时间添加到
特定
实体类型
的
标题
中。例如,如果
我
创建一个名为“”
的
实体,
我
希望将该实体
的
标题
实际保存为"My 020513 - 103501“(假设该实体是在2013年2月5日上午10:35:01创建
的
)。 这个是可能
的
吗?如果是这样,如何在Drupal 7
网
站上</em
浏览 0
提问于2013-02-06
得票数 0
1
回答
为两个不同
的
系统构建集成Api
、
、
有没有办法构建一个从不提供API
的
第三方系统读取数据
的
Api?
我
计划为家长建立一个应用程序,
我
不知道学校
的
学校管理系统是如何制作
的
,但我需要从它获得数据,有没有方法可以通过构建
我
的
自定义Api而
不
接触学校管理系统来获得数据?
浏览 23
提问于2020-10-22
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
如何让蜘蛛与用户了解我们的内容?
SEO优化:如何正确设置robots.txt协议文件?
新网站上线需要做的优化工作有哪些
一文学会nofollow标签的写法和作用,应该怎么加才好?
原来淘宝上的×G美女素材完全可以自己免费下载!
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券