腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
bs4无法正确打开本地存储
的
html
页面
、
当我试图解析本地存储
的
网页副本时,漂亮
的
汤返回给我胡言乱语。我不明白为什么,因为当我将requests和bs4模块一起用于抓取任务时,我从未遇到过这个问题。这是我
的
代码from bs4 import BeautifulSoup as BS url_2 = r'/Users/davidferreira/Documents/coding_2/ak_
screen
_
scraping
/bmr
浏览 18
提问于2017-03-14
得票数 0
回答已采纳
1
回答
如何使用javascript创建站点地图
、
、
我正在寻找关于如何创建一个javascript
的
文件,它将遵循页面上
的
所有链接,或网站,并创建它们
的
地图或列表。或者,如果有更好
的
方法来做到这一点,那也是很好
的
。我只是想获得一个全面的列表上
的
所有网页
的
网站上
的
3000+页面。我也不知道该在这个问题上加上什么标签,所以在这方面的提示会很酷。
浏览 0
提问于2012-07-19
得票数 0
1
回答
用Jsoup提取句子
的
屏幕抓取
、
、
我想做一些屏幕抓取,在做了一些研究后,似乎JSoup是这个任务
的
最佳工具。我希望能够提取网页上
的
所有句子,例如,考虑到这个维基百科页面,,我希望能够将该页面上
的
所有句子都打印到控制台上。不过,我仍然不熟悉JSoup
的
工作原理,所以如果有人能帮我解决这个问题,我会非常感激
的
。谢谢!
浏览 3
提问于2013-12-30
得票数 0
回答已采纳
2
回答
在外部网站嵌入内容
、
我是新
的
Drupal (和SE),并正在寻找一种方法嵌入Drupal 7内容
的
外部网站。D6有相应
的
模块(网络小部件和嵌入小部件)。我如何在D7中做到这一点?谢谢!
浏览 0
提问于2011-03-28
得票数 5
回答已采纳
1
回答
我必须进行类型转换,但他们
的
示例不需要(Jsoup文档类型)
、
简单
的
问题,这是
来自
的
示例 + "<body><p>Parsed
HTML
</p></body></
html
>"; Document d
浏览 0
提问于2013-04-13
得票数 0
回答已采纳
2
回答
提取维基百科文章
的
介绍部分,由python编写
、
我想摘录一篇维基百科文章
的
介绍部分(忽略所有其他内容,包括表格、图片和其他部分)。我查看了文章
的
html
源代码,但我没有看到包装这部分
的
任何特殊标签。 有人能给我一个快速
的
解决方案吗?
浏览 2
提问于2010-11-28
得票数 3
回答已采纳
1
回答
如何从HTTP网站收集(获取和解析)所需
的
信息/数据?
、
、
、
我有一个问题,在过去
的
两个星期里一直没能解决。我需要一些帮助。实际上,我想从HTTP网站获取和使用一些有用
的
数据。这个网站实际上包含了事故,事件和所有关于它们
的
信息。我想从网站上得到这个信息。我将在我
的
Android应用程序中使用它。我已经问过这个问题了,但还是不能解决。有人告诉我,您必须从JSON获取这些数据。我以前没有这样做过。如果这是唯一
的
解决方案,那么我该怎么做呢?如果有任何其他简单
的
方法,那么请给我。throw new IOException("Error conne
浏览 5
提问于2013-06-04
得票数 0
回答已采纳
1
回答
将一列中
的
数据拆分为R中
的
不同列
、
、
、
“我已经在R中进行了抓取,但遇到了将数据分成不同列
的
问题。我无法编写第8:10列
的
代码(代码
的
最后一行)。以下是代码。”__reviewTitle--2GO9Z") %>%
scraping
_data[,8] <- str_extract(<em
浏览 15
提问于2020-04-29
得票数 2
回答已采纳
2
回答
在Codeigniter中从类创建对象
、
、
以下代码
来自
,代码运行良好。Q1。下面的例子就是这样做
的
吗?如果是这样的话,你能给我解释/指导我如何做
的
详细
的
教程或解释吗? if ( !"
scraping
"]["
html
"] = $this->
scraping
-> getWebHtml("http://www.example.com/"
浏览 0
提问于2009-10-03
得票数 3
回答已采纳
1
回答
如何在这个网页上删除R
的
网页?
、
我对R很陌生,我正在努力学习网络抓取。我基本上需要从本网站中提取文档。 理想情况下,数据需要分为三列:年份、日期和INTRODUCTORYSTATEMENT_CONTENT。有人能帮忙编写代码吗?
浏览 0
提问于2019-04-04
得票数 2
1
回答
执行Django视图后未重定向到其他网页
、
、
我有一个视图-用户在输入中键入一些数据(在
scraping
.
html
),数据受到行动和分数应显示在下一个网页(scrapingscore.
html
)。我
的
问题是,点击提交按钮后,网站“抓取”正在刷新,什么也没有发生,只有文本字段
的
输入消失。我
的
观点是: rootlink = 'https://www.transfermarkt.pl' link = 'http
浏览 0
提问于2020-03-11
得票数 0
1
回答
不同环境下
的
不同搜索结果
、
、
、
、
我正在学习数据科学,当我做一个问题时,我遇到了一个奇怪
的
观察。问题是使用python在Beautiful主页上打印字符串“Soup”
的
出现次数。奇怪
的
是,在iPython笔记本和Python中出现
的
次数不同,当我在网页上进行手动搜索时,结果完全不同。Python中
的
In Pandas手动正如您所看到
的
,结果在所有环境中都是不同
的
,
浏览 6
提问于2016-06-17
得票数 1
回答已采纳
1
回答
如何从晦涩难懂
的
Windows 7程序中抓取数据?
、
、
我
的
任务是从一个专门为小型慈善机构编写
的
软件中抓取数据。我附上了一个截图(带有模糊
的
识别信息)如下: ? 数据采用表格格式,包含
的
信息太多,无法包含在单个屏幕截图中。
浏览 20
提问于2020-11-28
得票数 0
回答已采纳
1
回答
使用Python进行with抓取(初学者)
、
我正在做“用Python自动化无聊
的
任务”这本书中
的
webscraping教程
的
第一个例子。该项目包括在命令行上键入搜索词,并让我
的
计算机自动打开浏览器,在新选项卡中显示所有排名靠前
的
搜索结果<h3 class="r"> 注意:仅供参考,这是书中看到
的
完整程序。 # lucky.py - Opens several Goo
浏览 0
提问于2016-10-17
得票数 2
1
回答
Python Web-
scraping
charmap问题,在IDLE而不是ATOM IDE中工作正常?为什么?
、
、
、
、
同时执行
来自
python
的
简单url读取请求。我在我
的
Atom IDE中遇到了以下问题,当我在idle中工作时,我没有收到错误,可能
的
原因是什么。下面是代码。from urllib.request import urlopen
html
= urlopen("https://morvanzhou.github.io/static/
scraping
/basic-structure.
html
").read
浏览 31
提问于2018-09-26
得票数 0
1
回答
如何在预先存在
的
应用程序中插入文本?
、
、
很抱歉这个模糊
的
标题...我在这个项目中工作,我需要检索一些格式
的
数据字符串,例如"123456789",一旦我得到它,我需要将该字符串插入到一个预先存在
的
应用程序中(从该应用程序中,我无法控制它,也不能通过任何其他方式修改它或通过任何其他方式进行接口预先存在
的
程序是一个win32桌面应用程序(使用嵌入式远程登录控制台)。 我是通过JS检索数据
的
,所以如果我需要使用另一种语言插入数据,这是没有问题
的
。任何建议都会很有帮助。我缺乏图形用户界面编程
的
经验
浏览 1
提问于2020-05-22
得票数 0
2
回答
会话挖掘处理
我对R
的
数据挖掘非常陌生,而且我一直只在大学相关
的
问题上使用它,很抱歉,我有点像nooby。如前所述,我正试图从一个网站上抓取短信。为此,我使用了以下命令:p_text <-
scraping
_jst %>%text <-
html
_text() 现在我有了文本对象中
的
所有段落。由于大多数这些文件都
浏览 0
提问于2017-05-21
得票数 1
回答已采纳
2
回答
如何在MDBottomNavigation
的
底部导航项之间插入行?
、
、
我正在使用kivymd框架,并希望插入行之间
的
每个底部项目的底部导航。代码
来自
https://kivymd.readthedocs.io/en/latest/components/bottom-navigation/index.
html
。 谢谢!2' icon: 'language-cpp' MDLabel:
浏览 18
提问于2020-06-11
得票数 0
回答已采纳
1
回答
Python -多线程按顺序运行。
、
、
我不明白为什么这个进程是按顺序运行
的
。(max_workers=3)for i in range(100): executor = pool.submit(
scraping
浏览 2
提问于2019-11-28
得票数 1
回答已采纳
1
回答
如何以编程方式读取Javascript生成
的
DOM?
、
、
、
我可以使用Firebug或其他调试器检查任何Javascript生成
的
DOM。Firebug还允许我以交互方式将任何元素生成
的
innerHTML复制到剪贴板上,这样我就可以将其保存到磁盘上。这样
的
工具/插件应该能够读取Javascript生成
的
DOM,并以编程方式将其保存到磁盘。
浏览 1
提问于2012-01-07
得票数 1
回答已采纳
点击加载更多
相关
资讯
C语言编程版五子棋小游戏
C语言编程小游戏:小球碰撞
web前端问题整理
谈谈 App Shell与Skeleton Screen 实现
认识浏览器的对象树
热门
标签
更多标签
云服务器
对象存储
ICP备案
云点播
实时音视频
活动推荐
运营活动
广告
关闭
领券