腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
美
汤
网络
抓取
复杂
的
html
数据
、
、
、
好
的
,我正在为我
的
大学编程课程做一个自我指导
的
学期项目。我
的
计划是从
的
不同部分
抓取
数据
等,将它们保存在
数据
库中,然后使用discord机器人从该
数据
库中提取
数据
。然而,我遇到了网站本身
的
问题。。正如你所看到
的
,使用重复
的
div和body标签导航是相当
复杂
和困难
的
,而且我非常确定它是动态创建
的
。我
的</e
浏览 6
提问于2020-03-16
得票数 1
回答已采纳
1
回答
从
复杂
网站
抓取
数据
(隐藏内容)
、
、
我刚刚开始从
网络
抓取
,不幸
的
是,我面临一个展示:我想要拉一些财务
数据
,但它似乎是相当
复杂
的
网站(动态内容等)。 到目前为止,我已经用了
美
汤
来完成这件事。但是,我甚至找不到桌子。
浏览 0
提问于2018-06-18
得票数 0
回答已采纳
2
回答
可以在Google App Engine上使用Python lxml吗?
、
、
、
(或者我必须使用
美
汤
?) 我已经开始使用
美
汤
了,但它似乎很慢。我刚刚开始使用“屏幕
抓取
”其他网站
的
数据
来创建某种“混搭”
的
想法。
浏览 1
提问于2009-12-13
得票数 11
回答已采纳
1
回答
有没有可能用漂亮
的
汤
刮出一个“动态网页”?
、
、
、
我现在开始用漂亮
的
汤
来
抓取
网站,我想我已经掌握了基本
的
知识,虽然我缺乏网页
的
理论知识,但我会尽我最大
的
努力来表达我
的
问题。我所说
的
动态网页是这样
的
:一个网站,它
的
HTML
会根据用户
的
动作而改变,在我
的
例子中,它是可折叠
的
表格。我想获得一些"div“标签中
的
数据
,但是当你加载页面时,
数据</em
浏览 1
提问于2016-11-22
得票数 4
2
回答
Python 3 web
抓取
选项
、
我是Python
的
新手,所以很抱歉这是一个新手问题。我想知道这个论坛上有没有人有使用python3进行
网络
抓取
的
好选择。谢谢,威尔
浏览 1
提问于2011-08-11
得票数 5
3
回答
如何使用Python
的
请求
抓取
超市营养
数据
?
、
、
我想从这个页面上
抓取
营养
数据
:。但是当我使用浏览器检查页面时,响应
的
文本与我看到
的
HTML
不匹配。所以我不能用
美
汤
搜索它。 我该如何解决这个问题呢
浏览 14
提问于2018-02-28
得票数 0
1
回答
Python中
的
Web
抓取
、
、
我需要学习高级python编程技能才能使用python进行web
抓取
吗?或者,我应该看一些关于
网络
抓取
的
教程,同时学习使用python。我对python没有任何经验,因为我是Laravel开发人员,这是我第一次在web
抓取
中做这样
的
工作。
浏览 0
提问于2019-11-04
得票数 -1
2
回答
如果我只能为python选择一个
html
抓取
库,我应该选择哪一个呢?
、
、
、
我需要做很多
html
解析/
抓取
/search引擎/crawling。可以在lxml中进行索引吗?
浏览 1
提问于2011-06-06
得票数 1
回答已采纳
1
回答
通过传递incapsula安全性- python
、
我试图从whoscored.com
抓取
足球
数据
,该网站有一个面向
网络
的
安全封装体,它不让我
抓取
。最初,我试图提供user_agent,并更改了标题,然后它就起作用了,但这只适用于第一页。由于我需要爬行网站
的
其他部分,它一直阻止我请求网站。由于阻塞时间一直在增加,它现在变得越来越疲惫。我需要用于研究
的
数据
。我已经看过了所有关于这个话题
的
老问题。但这无济于事。 工具。a
浏览 3
提问于2019-03-29
得票数 0
3
回答
Python Web
抓取
-必需库及其实现方法
我在寻找一些真正
的
帮助。我想要使用Python进行web
抓取
,我需要它,因为我想导入一些
数据
库,我们如何在Python中做到这一点。我们需要什么样
的
库?
浏览 2
提问于2016-02-11
得票数 0
2
回答
美
汤
动态内容
的
网络
抓取
、
、
、
为了训练我
的
python技能,我试图从"Arbeitsagentur“()
的
网络
存在中取消特定给定任务
的
空缺作业数量。geckodriver/geckodriver.exe", options=options)soup = BeautifulSoup(driver.page_source, '
html
.parser,但它不包括被查询
的
信息。计算和插入
的
。因为我不是一个web开发人员,所以我
浏览 9
提问于2022-05-31
得票数 1
回答已采纳
1
回答
处理URL
的
速度更快Python
、
、
、
、
我需要从网上
抓取
各种网址,显示拍卖实时价格
数据
的
HTML
。我已经有一个预先组装
的
URL列表来检查,目前,有一个工作脚本。问题是处理时间不是很长(每个URL大约1.5-2秒)。我将selenium与chrome驱动程序一起使用,并将无头运行作为提高速度
的
一种选择。最大
的
问题(也是我为什么使用selenium
的
原因)是我使用
的
站点有严格
的
登录安全性(CSRF令牌和验证码)。我不想尝试和寻找周围
的
登录。相
浏览 0
提问于2017-10-30
得票数 0
1
回答
Python
美
汤
抓取
数据
、
我对
美
汤
还很陌生。我有一个这样
的
表单 <span>In den Warenkorb</span>
浏览 0
提问于2017-10-24
得票数 0
1
回答
在python中从字符串中删除特殊字符
、
、
我正在使用
美
汤
来
抓取
一些
html
/xhtml网页,如下所示:soup = BeautifulSoup(response.text)但是,我
的
输出显示了几个我想要过滤掉
的
特殊字符(例如)。我想我遗漏了一些关于解码
的
东西。 你能告诉我这里可能遗漏了什么吗?谢谢。
浏览 3
提问于2017-07-07
得票数 1
回答已采纳
1
回答
在当前状态下对当前页面进行its
抓取
、
在使用
美
汤
之前,我已经通过一个
html
请求进行了
网络
抓取
。 但是现在我不想要维基百科
的
数据
,我想要
的
是用户修改后
的
数据
。例如,特斯拉网站有这个功能https://www.tesla.com/en_gb/models/design#battery,在那里你可以个性化你
的
车。用python/c#编写一个脚本,它可以从我当前打开
的</em
浏览 10
提问于2020-03-25
得票数 0
回答已采纳
1
回答
Python :
抓取
不返回任何
Html
的
网站
、
、
、
、
所以我遇到了一个问题,当我向网站发送一个请求,然后使用
html
.fromstring(site.content),它
抓取
了一些页面,但是,有些页面只是打印出来,<Element
html
at 0x7f6359db3368另外,我还不想使用像
美
汤
或Scapy这样
的
东西。
浏览 1
提问于2016-10-20
得票数 1
5
回答
为了
抓取
屏幕,以编程方式登录网站
的
最佳方式是什么?(最好是在Python中)
、
什么是最好
的
工具,可以让这一切尽可能简单?我更喜欢某种类型
的
Python库,因为我想精通Python,但我对任何建议都持开放态度。
浏览 2
提问于2009-05-07
得票数 2
1
回答
文本到语音
的
特定页面元素?
、
、
、
我想转换像这样
的
网页,让程序对注释进行过滤,而不是包含"permalink,source“或不相关
的
页面元素。
浏览 0
提问于2015-11-05
得票数 3
1
回答
Python3漂亮
的
汤
模块'NoneType‘错误
、
、
、
、
我刚接触
美
汤
模块,我有一个问题。我
的
代码很简单。最重要
的
是,我试图从上
抓取
的
网站,我正在试图
抓取
价格。(大数字二(2)和更多)import urllib page = urllib.request.urlo
浏览 69
提问于2018-06-03
得票数 1
回答已采纳
2
回答
一个网站有没有可能在刮
的
时候隐藏部分美丽
的
汤
汁呢?
、
、
我遇到了一个问题,当我试图刮一个网站与python包美丽
的
汤
。不知何故,除了我感兴趣
的
那部分之外,我从它得到了一切。我正在尝试从这个网站
的
抓取
实时
数据
。我真的得到了除了实时
数据
之外
的
每一个部分,我认为它以某种方式连接到了与
数据
相同
的
容器中
的
脚本块。Firefox和Chrome可以很容易地检查这一部分,但
美
汤
不知何故不了解这一点。感谢您
的
每一条建议
浏览 15
提问于2017-12-21
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Python网络爬虫:抓取网页数据的实战
IPIDEA大盘点,借助网络爬虫抓取数据的作用?
爬虫抓取网络数据时经常遇到的六种问题
汤华臻:用“大数据”做好网络时代的调查研究
微模块化数据中心如何简化复杂的网络路由?
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券