腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
从
网
站上
抓取
特定
栏目
时
,
数据
框
为
空
、
、
我想尝试
抓取
CNBC Nasdaq 100
网
站中的一些
特定
列(公司详细信息列),特别是Adobe股票,以下是我的代码片段 # Importing Libraries from bs4 import BeautifulSoupsymbol=ADBE&tab=profile") 所以,我很想在
数据
帧中获得结果,这样我就可以更改为CSV文件,但我的代码一直显示
空
的
数据
帧结果,下面是显示的错误 ?
浏览 18
提问于2020-04-21
得票数 0
回答已采纳
1
回答
如何在两个
数据
帧之间比较
特定
列中的值,以检查较新的
数据
帧列中是否有新值?
、
、
我不断地
从
网
站上
提取新
数据
,我的目标是将上次提取
数据
时
特定
列中的
数据
与新提取的
数据
进行比较。如果有新的行(通过比较每列中的
数据
来识别,例如,每个
数据
框
中的name列),则将与新名称关联的行移动到新
抓取
的
数据
框
中的
数据
的顶部(原因是我正在
抓取
的网
站上
的
数据
没有
从</em
浏览 0
提问于2021-05-17
得票数 1
2
回答
如何在网站
抓取
中搜索任何网站
、
、
、
、
我正在从事一个使用DOM解析
从
网站
抓取
数据
的项目。它可以使用页面url
从
特定
网站提取
数据
。如何将php变量传递到网站搜索
框
并在该网
站上
进行搜索?
浏览 1
提问于2016-03-07
得票数 0
1
回答
返回空列表的HTML表刮取技术
、
、
、
当我运行代码
时
,当我
从
html表中
抓取
数据
时
,在这个
特定
的网
站上
,我已经成功地使用了。competition-stats/2016-team-ranking/"read_html %>%html_table() 返回的只是一个
空
列表
浏览 0
提问于2016-05-12
得票数 1
回答已采纳
1
回答
PYTHON:如何使用BeautifulSoup将表解析
为
pandas
数据
帧
、
、
、
、
我正在尝试
从
疾控中心网
站上
抓取
最近7天新冠肺炎报告病例的
数据
。我试着通过名称,id,类来查找这个表,它总是以类型返回。当我打印
抓取
的
数据
时
,我也无法在html中手动定位表格。不知道我到底做错了什么。导入
数据
后,我需要填充pandas
数据
框
以供稍后用于绘图,并将
数据
表导出
为
csv。
浏览 1
提问于2020-10-18
得票数 1
1
回答
如何使用solr的DIH deltaimport导入nutch导出的mysql
数据
、
、
、
我想使用solr的DIH deltaimport来导入nutch导出的mysql
数据
,但是nutch的mysql
数据
没有时间戳字段。我尝试
从
Mysql导入的原因是,我想将
抓取
数据
合并到其他url管理表中。爬
网
数据
中的"modifiedTime“字段
为
bigInt而不是timeStamp,并且始终
为
空
。
浏览 0
提问于2013-12-07
得票数 0
1
回答
Tempus Dominus日期选择器,如果日期
为
空
,则格式不起作用
我在Bootstrap4/ ASP.net MVC Core2
网
站上
使用Tempus Dominus日期时间选择器。 locale: 'en-gb&
浏览 30
提问于2020-02-12
得票数 1
1
回答
使用R表内容进行网络
抓取
、
刚开始网络
抓取
。我正试图
从
网
站上
抓取
特定
的
数据
。我需要缩短船在2020年和2021年航行的距离。上面的代码给了我这个网站。现在,我试着用 html_nodes( css = "_1hFrZ") %>%但它会返回一个
空
的。_1hFrZ是网站中的td类。当我使用html_text()
时
浏览 4
提问于2022-03-11
得票数 0
回答已采纳
4
回答
从
受密码保护的站点读取信息
在R教程中,我一直在使用readLines()
从
网
站上
抓取
信息。我现在希望
从
我自己的网站提取
数据
(特别是awstats
数据
),但是该域是受密码保护的。有没有办法传递我需要的
特定
awstats
数据
的url和用户名和密码。 谢谢。
浏览 0
提问于2011-03-24
得票数 13
回答已采纳
3
回答
将列值设置
为
固定长度
、
我有一个熊猫
数据
框
,有一个叫做“postalcode”的列,只有4个数字(比如1234)。 然而,当我
从
网
站上
抓取
时
,邮政编码一栏有时会得到4个以上的数字,比如123456789。将列的值长度设置
为
仅为“postalcode”列选择前4位的最佳方法是什么? City PostalcodeB 234567890... ....
浏览 25
提问于2020-11-30
得票数 0
回答已采纳
1
回答
使用scrapy删除
空
数据
、
、
、
、
我使用scrapy
从
某个网
站上
抓取
数据
,但
抓取
的
数据
中充满了我不想要的
空
值,因此为了清理我提取的
数据
,我更改了pipeline.py脚本。当我提取一个或两个值
时
,它就起作用了,它就像一个咒语。但是,当我提取多个值
时
,由于每个提取行上至少有一个
空
值,因此算法最终删除了几乎所有的
数据
。有没有办法阻止这种情况的发生?下面是我用来删除
空
数据
的代码 cla
浏览 44
提问于2020-04-27
得票数 0
1
回答
爬行器不会在
数据
进入页面后进行解析
、
、
我正在尝试
抓取
亚马逊的网
站上
的产品,在实现了一个正常的
抓取
过程后,我试图给程序增加一些“复杂性”。 我的想法是,
从
.txt接收
特定
的关键字。有了这些关键字,我使用搜索栏来获取匹配它们的产品,并
抓取
数据
。它工作得很好。问题是,根据关键字,例如,笔记本电脑和鞋子,解析器需要不同的工作方式,因为鞋子有不同的尺寸,颜色等,所以我需要从“鞋子”产品中
抓取
的
数据
与
从
“笔记本电脑”产品中需要的
数据
不同。这就是我所
浏览 0
提问于2018-12-27
得票数 0
1
回答
使用BeautifulSoup
从
HTML文件中删除元素
、
、
我对网络
抓取
的世界非常陌生,我正在尝试从一个网
站上
抓取
鞋子的名字。当我在网
站上
使用inspect
时
,有一个div标签,基本上整个网页都在里面,但当我打印出html代码
时
,div标签完全是
空
的!html_file, 'lxml') findShoeNames() 当我调用我的函数和print(soup)
时
,div标记看起来
浏览 41
提问于2021-09-23
得票数 1
回答已采纳
1
回答
使用BeautifulSoup
抓取
的
数据
与源代码不匹配
、
、
、
我是网络
抓取
的新手。我已经看过一些关于如何使用漂亮的汤来
抓取
网站的教程。作为练习,我想从一个房地产网
站上
提取
数据
。我想要
抓取
的
特定
页面是这个:我遇到的第一个问题是,使用经典的漂亮汤代码
抓取
的
数据
与网页的源代码不匹配。URL)soup = BeautifulSoup(htm
浏览 4
提问于2021-05-02
得票数 1
1
回答
css3在理解盒子大小方面需要帮助。
我在网
站上
发现了以下内容:我不知道什么意思的
栏目
不会并排出现?听起来,这里所期望的是,两列之间的分界线将会消失,或者类似的东西--我不确定。我有此示例代码可供实验: 我根本没有看到
浏览 3
提问于2013-08-28
得票数 0
回答已采纳
9
回答
BeautifulSoup和Scrapy crawler有什么区别?
、
、
、
我想做一个网站,显示亚马逊和易趣产品价格的比较。其中哪一个会工作得更好?为什么?我对BeautifulSoup比较熟悉,但对Scrapy crawler不太熟悉。
浏览 323
提问于2013-10-30
得票数 146
回答已采纳
1
回答
从
网站中提取语义
数据
的可扩展解决方案?
、
、
、
假设我的磁盘上有很多(相当大的)网站,这些网站是
从
Common Crawl
抓取
或
抓取
的。我没有关于HTML结构的先验知识,假设每个页面的结构不同(通常是这样)。我想从它们中提取一些语义信息(预先知道),比如带有元
数据
(日期、作者、标签、评论等)的文章/帖子。 一种简单的方法是
为
每个网站编写一个简单的解析器,考虑到高质量的解析库,它应该足够简单。如果您知道有什么更好的方法来获取此类
数据
(在
特定
主题上;而不是手动
抓取
/公共爬
网<
浏览 11
提问于2017-01-11
得票数 0
1
回答
从
特定
语言中
抓取
带有rtweet的rtweet会导致
数据
框
为
空
、
、
我刚刚发现了rtweet,我想从一种
特定
的语言获取一些rtweet。我还尝试重新创建我找到的示例(例如,这个示例:),但我不能这样做,因为我总是得到
空
的
数据
帧。 我很高兴有这样的建议:)
浏览 7
提问于2020-05-10
得票数 0
1
回答
从
酒店网
站上
抓取
的BeautifulSoup没有退货
、
、
、
我在试着从不同的酒店网
站上
搜集酒店
数据
。我可以成功地
从
Bookings.com这样的网
站上
获取信息,但我很难获得
特定
酒店网站(不是大规模预订网站)的任何输出。下面的代码适用于批量预订站点,但是当我更改URL和我试图
抓取
的div类名
时
,我没有得到任何输出。我是不是
为
我想要的信息选择了错误的div类,或者我不能
抓取
这些类型的网站?
浏览 23
提问于2021-04-28
得票数 1
回答已采纳
1
回答
抓取
:获取启动url以
抓取
amazon视频信息的问题
、
我刚开始
网
刮。我想做的是
从
亚马逊网
站上
抓取
所有亚马逊的电影。我去了亚马逊网站www.amazon.com。 我在搜索
框
的左侧选择了amazon视频,然后输入“视频”并进行搜索。我有很多电影的单子。web
为
https://www.amazon.com/s/ref=nb_sb_noss_1?url=search-alias%3Dinstant-video&field-keywords=video&rh=n%3A2858778011%2C
浏览 0
提问于2018-01-26
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
SEO收录技巧:提升新站收录的方法
微视网媒:如何规划网站改版方案,注意事项是什么?
SEO优化:如何正确设置robots.txt协议文件?
Excel爬虫功能:爬取网站中多页数据
视觉工控机助力在机器视觉领域中抓取深框曲轴的方案
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券