腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(5025)
视频
沙龙
4
回答
如何使用jQuery从其他网站
抓取
内容
?
、
、
、
我正在用
PHP
做一个
新闻
网站项目,对于这个项目,我想使用jQuery/JavaScript从其他
新闻
网站获取
内容
。jQuery有没有从其他域名
抓取
内容
的功能?使用jQuery删除
内容
会占用大量的CPU吗? 在Stack Overflow中,我读到了jQuery.get()函数,是否可以使用此函数从其他站点
抓取
内容
?
浏览 3
提问于2012-02-22
得票数 2
回答已采纳
1
回答
如何限制Apache Nutch 2.3.1
抓取
故事
内容
而不是侧边栏
、
、
、
、
我得
抓取
一些
新闻
网站。我已经在Hadoop 2.7.4和Hbase集群上安装了apache Nutch 2.3.1。我必须通过solr 6.6.1提供搜索。在
抓取
一些网站后,我观察到Nutch
抓取
页面中的所有
内容
。在
新闻
网站中,有包含最新或热门
新闻
等
内容
的侧栏。这些侧栏
内容
会随着时间的推移而变化。有没有办法让Nutch
抓取
主要故事
内容
,并避免这样的侧栏。
浏览 1
提问于2017-11-08
得票数 0
3
回答
每天从另一个网站
抓取
内容
、
、
、
我正在创建一个网站,其中有一个“
新闻
”选项卡。我想在
新闻
选项卡上看到的是来自另一个
新闻
网站的更新
内容
。有没有办法
抓取
另一个网站上发布的纯文本,将其发布在我网站的
新闻
选项卡上,并在该网站发布新
内容
时自动更新?有没有人能把我推向正确的方向,这样我才能学会如何做到这一点?我知道HTML很好,但缺乏
PHP
和Javascript的技能。我需要学习什么才能做到这一点?
浏览 0
提问于2013-01-18
得票数 5
回答已采纳
1
回答
如何让我的网站自动将urls提交到facebook opengraph平台进行处理?
、
、
我经营着一个
新闻
网站,每年有几十万的浏览量。每当有新
内容
发布时(每个周日晚上),作者喜欢在facebook上发布新
内容
的链接。然而,据我所知,facebook每24小时才
抓取
一次网站。网站上的所有页面(特别是
新闻
文章本身)都使用完整的开放图形数据进行标记。facebook linter将始终正确显示嵌入的opengraph数据。然而,在它
抓取
新页面之前,它们不会在facebook上正确显示。整个网站都是动态
php
--谁能把我带到正确的方向?也许代码可以修改为在每篇<e
浏览 1
提问于2012-09-23
得票数 0
1
回答
高级
php
爬虫,网站后端
、
、
、
、
我的想法是,创建一个从其他来源聚合
内容
并将其显示在页面中的网站,谢谢
浏览 0
提问于2014-05-05
得票数 0
8
回答
智能推荐算法为什么会推荐假
新闻
?
近期,谷歌要推出一项“Google News Initiative”的项目,目的是清除线上以及突发
新闻
状况下的虚假
新闻
。那么,智能推荐算法是如何筛选假
新闻
的呢?为什么会存在推荐假
新闻
的情况?
浏览 909
提问于2018-03-21
1
回答
如何在j2ee中获取rss中的
新闻
内容
、
、
我正在开发一个网站,应该得到其他网站的
新闻
内容
,类似于。但不需要重定向到主持人那里去阅读
新闻
内容
。 现在的问题是,我不知道什么是最好的方式得到的
内容
完全。我知道,我可以使用RSS提要为每个网站,但它只有一个简短的描述,每个
新闻
,而不是整个故事。我也读过这样的相关问题:,,但都没有解决我的问题。现在我想问的是,如果有必要直接访问这些网站,从不同的网站获取整个
新闻
内容
的最好方法是什么?对不起,因为我的英语不太好,如果我的问题不够清楚,我可以提前解释,谢谢。
浏览 5
提问于2014-08-14
得票数 1
回答已采纳
1
回答
如何在木偶剧中获取iframe
内容
或链接?
、
、
、
、
我正在开发React Native上的一个
新闻
应用程序。为此,我在木偶剧上做了一个
新闻
采集器。问题出在iframe中。我拿不到。我尝试评估页面并使用querySelector。它找不到它。我该怎么办?我只想获得iframe
内容
或链接来显示它。在那里,我需要取一个电报iframe。我已经成功地
抓取
它的标题,
内容
,文章照片等。所以,我只需要的代码为iframe
抓取
。
浏览 14
提问于2021-06-05
得票数 0
回答已采纳
1
回答
如何
抓取
一个详细信息不在检查页面上的网站?
、
、
我有一个网站,我需要
抓取
。 https://www.dawn.com 我的目标是
抓取
所有带有关键字“巴基斯坦”的
新闻
内容
。 到目前为止,如果我有URL,我只能
抓取
内容
。
浏览 16
提问于2020-09-30
得票数 0
1
回答
Google
新闻
站点地图语法
、
、
我已经使用Joomla的Xmap组件为我的网站提交了Google
新闻
站点地图,我今天收到了如下通知http://www.thepeshawar.com/index.
php</e
浏览 4
提问于2012-12-08
得票数 4
回答已采纳
1
回答
为iphone应用程序自动创建带有“刮”
内容
的页面
、
、
、
到目前为止,我已经为意大利足球
新闻
网站()制作了HTML。 我的webapp有一个选项卡,您可以根据主题选择
新闻
,我成功地做到了这一点,这要感谢(),它是我用来从网站上
抓取
新闻
的工具。现在,,这是一个问题,:如果我单击带有图片和
新闻
的简短摘要的链接,就会明显地加载
新闻
的外部页面。但这不是我想要的:我想要的是,当我点击
新闻
时,它应该以某种方式创建一个页面,其中的
新闻
内容
会再次从该
新闻
的页面中刮出(我只需要图片和
浏览 1
提问于2013-01-01
得票数 1
2
回答
如何在帖子中查找图片
、
、
我从来没有做过这样的事情,所以我真的不确定我需要在
PHP
中使用什么工具来实现这一点。我正在做一个“最近的
新闻
项目”(只是标题)的列表,它将显示在网站的一侧,并希望能够查找
新闻
帖子中的第一张图片(我假设这与查找img标记和加载src有关,但我不确定如何做到这一点。
新闻
帖子存储在一个MySQL数据库中,并被提取到一个变量$newsPost中。 谢谢你的帮助。
浏览 1
提问于2010-06-24
得票数 0
回答已采纳
1
回答
新闻
如网页索引,但没有出现在SERP中。
、
、
嗯,我有一些爬虫可以从不同的
新闻
机构网站上
抓取
新闻
,然后自动发布到我自己的网站上,问题是我的页面会在谷歌上找到索引,但即使我搜索的是完全相同的单词,它也不会出现。或者,从根本上说,
抓取
另一个网站并将其
内容
作为自己的
内容
发布是没有用的吗?
浏览 0
提问于2013-08-13
得票数 0
回答已采纳
1
回答
在cron作业中打开和写入文件
、
我用Hostinger在我的网站上设置了一个cron作业,用来
抓取
新闻
内容
并将信息转储到文本文件中。这不是我想要的cron输出,而是运行脚本的副产品。
PHP
Warning: fopen(..failed to open stream: No such file or directory in /home/u189772133/public_h
浏览 1
提问于2017-09-10
得票数 1
回答已采纳
2
回答
在内存中浏览网页
、
他们是否有办法在没有任何浏览器的情况下,在
抓取
html之后执行网页javascript的加载事件。即我需要
抓取
网页
内容
通过javascript呈现例如bbc
新闻
网页的视频在页面加载后通过javacscript呈现,我对
抓取
视频链接和镜头描述感兴趣。
浏览 0
提问于2012-06-27
得票数 1
2
回答
Web
抓取
特定
内容
、
、
、
我正在尝试从购物网站中
抓取
内容
,然后将其保存在我的数据库中的表产品中。
抓取
这些
内容
需要知道每个站点的DOM结构。不仅是DOM结构,还包括菜单中的类别层次结构。有一个类似的解决方案来处理
新闻
,比如Readability,它查找<p>标签和图像的序列。由于
新闻
网站与简单结构的相似性,使得
新闻
更容易发布,
浏览 5
提问于2013-09-01
得票数 2
回答已采纳
3
回答
代码点火器中如何生成
新闻
节目的超链接
、
我创建了一个
新闻
面板,在其中我们使用下面的代码来显示
新闻
:$query = $this->db->get('news'); {在正确的地方,所有的数据都会被
抓取
并运行良好, 但是我们试过了,当我们点击“<
浏览 9
提问于2015-06-15
得票数 0
回答已采纳
1
回答
建立多个雄辩的关系&有一个从句
、
、
、
现在我有了
新闻
类别、
新闻
和
新闻
图像表格结构,如: 我想列个清单如下: 我是如何用雄辩的关系( whereHas或Has )来制作这样的列表的? PS:有时
新闻
没有图像
浏览 2
提问于2014-05-22
得票数 0
1
回答
将大量异构数据收集到结构化数据集中
、
、
、
、
我一直在评估网络
抓取
的科学。我使用的框架是Python/Scrapy。我相信可能还有更多。我的问题更多地围绕着基础知识。假设我必须
抓取
新闻
内容
。因此,我
抓取
一个页面,然后编写选择器来提取
内容
、图像、作者、发布日期、子描述、评论等。 问题是,我如何优化它,使其可扩展到大量数据源。例如,可能有数千个
新闻
站点,每个站点都有自己的html/页面结构,因此我不可避免地需要为每个站点编写一个
抓取
逻辑。虽然这是可能的,但这将需要一个庞大的资源团队
浏览 2
提问于2014-09-19
得票数 2
3
回答
带有webview项目的listview是否适用于
新闻
应用程序?
、
我正在构建一个应用程序,
抓取
某个网站,并在列表视图中呈现最新的
新闻
,html格式与图像,标题和摘要。当用户单击一行时,将显示
新闻
文章。它的工作原理有点像CNet应用和类似的
新闻
应用。我对
抓取
部分没有问题,但我对如何管理摘要列表有疑问。 我最初的想法是有一个列表视图,其中每个项目都是一个webview。列表视图由填充了
抓取
的html
内容
的自定义ArrayAdapter填充。
浏览 5
提问于2011-06-20
得票数 2
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
PHP使用Curl实现模拟登录及抓取数据功能示例
Python数据抓取(3)—抓取标题、时间及链接
Python按关键字抓取新浪新闻
PHP实现远程抓取网站图片并保存在文件中
《PHP扩展及核心》
热门
标签
更多标签
云服务器
ICP备案
对象存储
即时通信 IM
实时音视频
活动推荐
运营活动
广告
关闭
领券