腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
设置Utf8不适用于
php
中的阿拉伯文本
、
、
我正在尝试用阿拉伯语
抓取
网页
,一切正常,除了当我回显文本时,我得到的是一个
乱码
文本,即使我已经将标题设置为UTF-8<?
php
我得到的是这段
乱码
浏览 4
提问于2015-08-09
得票数 1
1
回答
网页
乱码
(编码?)从
PHP
中下载时
、
、
、
、
我正在尝试从
PHP
内下载此页面()。但是,当我写出文件并查看它时,内容是
乱码
/损坏的。但是,来自同一站点的不同页面的下载没有问题()。下面是我的
PHP
代码:file_put_contents('/temp/out.html', fopen("http://www.360.ru/", 'r')); file_put_contents('/temp/out2&
浏览 3
提问于2013-07-25
得票数 0
2
回答
用
PHP
抓取
网页
、
、
、
、
我有一个
网页
,我想要提取所有跨度和锚标签值从一个表中的ticker。像这个LPCL,11.06等,我尝试了curl和
php
dom文档。它不起作用。
浏览 1
提问于2014-01-23
得票数 0
1
回答
如果我中途取消了“拉远程更改”,会发生什么情况?
、
、
它已经
抓取
更改15分钟了(“
抓取
更改”仍在旋转),...for通常需要5-30秒。我不知道是不是出了什么问题。我的网络速度是完美无缺的。 如果我取消了,我会破坏什么吗?(弄个
乱码
)有发生过这种事吗?
浏览 7
提问于2016-08-15
得票数 2
回答已采纳
3
回答
如何让网络爬虫在后台
抓取
网页
?
、
我目前正在开发一个网络爬虫在
PHP
中,它仍然是一个简单的,但我想知道的是,我怎样才能使我的爬虫在后台爬行页面,而不使用我的带宽,我必须使用一些cron作业,我想它自动存储在数据库中的数据。
php
ini_set('max_execution_time*>(.*)<\/a>"
浏览 2
提问于2015-08-06
得票数 0
2
回答
如何阻止在Drupal网站上的
抓取
?
、
但是,由于Drupal类和ID非常一致,人们可以很容易地
抓取
站点。 还有其他技术可以让网站的
抓取
变得更难吗?我不确定“
抓取
”是否是官方术语,但我指的是人们编写脚本的过程,即“
抓取
”一个网站并分析其中的部分,以便提取数据并将其存储在自己的数据库中。
浏览 2
提问于2015-03-23
得票数 0
回答已采纳
1
回答
如何从url中获取丰富的内容(比如不和谐)?
我想用
php
或javascript来做。示例:
浏览 4
提问于2020-10-04
得票数 0
回答已采纳
1
回答
无法使用Python请求/ urllib模块读取印地语/Devanagari
、
、
、
、
我正在尝试
抓取
这个包含印地语数据的NREGA Website。这个结构很容易被刮掉。但是当我使用request/urllib来获取html代码时,印地语文本被转换成了一些
乱码
。requests.get(URL).text 站点中的‘1पीएस’被解析为‘1 \xe0\xa4\xaa\xe0\xa5\x80 \xe0\xa4\x8f\xe0\xa4\xb8’,在我尝试导出到csv时显示为
乱码
浏览 16
提问于2020-09-21
得票数 0
回答已采纳
1
回答
验证来自cURL的完整响应
、
、
有时,当使用多个并发连接和
抓取
我的
PHP
脚本中的cURL时,会返回不完整的
网页
。curl_getinfo()中有没有一些值可以让我知道一个
网页
是100%被
抓取
还是只有90%被
抓取
?
浏览 0
提问于2013-04-12
得票数 0
回答已采纳
2
回答
如何结合使用unicode和enlive进行web
抓取
、
我正在尝试
抓取
一些需要unicode支持的网站。例如,我试图获取这本书的标题,但它返回的是
乱码
: java.net.URL. enlive/html-resource尝试
抓取
一个阿拉伯语站点的结果是?
浏览 0
提问于2012-05-18
得票数 1
回答已采纳
1
回答
Facebook Feed (使用
PHP
的RSS)
、
我如何在我的网站上使用
PHP
实现这一点? 我需要学习什么才能实现它?
浏览 1
提问于2010-11-02
得票数 0
回答已采纳
3
回答
将
php
页面转换为java代码
、
我有一个
网页
,即
php
页面,它是一个表格。我想把这个页面带到java中,即在java页面中,我想使用.
php
页面的网址显示此表单。这是可能的吗?如果是的话,是如何实现的?有问题的澄清: 我有一个java
网页
。在这个
网页
上,我想要一个Iframe或任何类似的东西,它将显示一个使用
php
url的
php
表单,并执行保存操作。
浏览 1
提问于2012-07-02
得票数 0
回答已采纳
2
回答
Python
抓取
包含
PHP
的页面源代码
、
我知道如何
抓取
源代码HTML,但不知道
PHP
,有没有可能用内置的函数?
浏览 0
提问于2013-02-25
得票数 0
回答已采纳
3
回答
从许多不同网站上
抓取
数据的最好方法
、
、
此数据不是以任何标准格式(XML、RSS等)提供的并且必须从HTML中
抓取
。我需要
抓取
这些数据,并将其存储在数据库中以备将来参考。理想情况下,
抓取
例程将在循环的基础上运行,并且只将新记录存储在数据库中。对于我来说,应该有一种方法可以在这些网站上轻松地检测到旧记录中的新记录。有什么建议吗?
浏览 0
提问于2012-09-04
得票数 0
1
回答
Google Chrome Bug -
网页
无法正确显示
、
、
网页
在我的google chrome浏览器中显示不正确。按钮中的文本不会显示。有时,文本显示为
乱码
。
浏览 8
提问于2012-05-24
得票数 0
2
回答
在XPATH中使用XHTML文档的名称空间是必需的吗
、
、
、
、
我正在
抓取
一些
网页
的一些特定部分的
网页
。我使用
php
,curl和xpath来获取页面的一部分。但是人们建议我应该使用XHTML文档的namespaces才能使XPATHs工作。实际上,我正在使用Tidy将
网页
转换为XHTML。我真的需要名称空间吗?如果需要,在哪种情况下需要,因为在从wikipedia中
抓取
内容时,相同的代码without namespaces工作得很好。此外,即使在修改我的
php
代码以包含namespaces之后,该代码也不适用于某些urls。你可以看
浏览 0
提问于2011-05-31
得票数 0
回答已采纳
1
回答
由于混淆了两个请求的响应而获取下载提示
、
我的页面中有4个iframe,当我向下滚动我的
网页
时,它们的src会发生变化。我越快越频繁地滚动src的更改。如果我滚动得足够快,我会在FF中得到一个下载提示。下载的文件包含
乱码
文本,后跟http响应头,然后是更
乱码
的文本。在IE上也会发生这种情况,而不是得到下载提示,而是在我的一个iframe中得到
乱码
文本。 客户端或服务端的bug在哪里,我该如何修复呢?
浏览 1
提问于2008-11-11
得票数 1
1
回答
如何在web浏览器的页面源代码中查看html实体代码
、
我通过
php
cURL
抓取
/提取了一个远程
网页
。为此,我必须查看
php
脚本的页面源代码。问题是在远程页面中,一些文本在<pre></pre>标记内。因此,我可以看到换行或其他html实体代码,我想要
抓取
该
网页
的一部分。 例如,如果您看到的页面源代码,就可以看到TODAY'S SHARE MARKET下的数据显示在<pre></pre>标记下。
浏览 3
提问于2017-03-19
得票数 0
2
回答
在
php
中编码字符串
、
、
得到的结果是:我认为字符串一进入数据库就会
乱码
浏览 1
提问于2012-09-12
得票数 0
1
回答
视频流文件的安全链接
、
我有
PHP
脚本生成的网址到这个视频文件。此url在我的HTML中用作Windows media player的嵌入式代码中的mediasource。一切都很好。但指向此文件的链接是公开的。我能用
php
解决这个问题吗?
浏览 0
提问于2011-08-13
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
网页视频抓取插件-免费网页视频抓取插件
如何抓取网页中的表格
理解网页数据抓取的原理
如何用java实现抓取网页图片
网页抓取常见的问题有哪些?
热门
标签
更多标签
云服务器
ICP备案
对象存储
即时通信 IM
实时音视频
活动推荐
运营活动
广告
关闭
领券