腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
VBA
web
抓取
问题
-
如何
使用
html
结构
浏览
特定
的
web
(
href
/
child
/ )
、
、
、
尊敬
的
VBA
同事们,大家好:) Sub login() Const URL$ = "https://kwm.kromi.de/cgi-bin/kwm?
HTML
=frontend/login.htm" Set我需要更深入地点击一些东西,但是网页
的
结构
对我<em
浏览 25
提问于2021-09-16
得票数 0
回答已采纳
2
回答
如何
使用
Ui路径选择网页中
的
元素-而不是通过鼠标单击
、
我是UIpath
的
新手,我过去有过
使用
VBA
和selenium
web
驱动程序进行
web
抓取
的
经验。 所以我想用下面的元素点击一个按钮。> <a
href
="#" id="toggle2" class="btn btn-primary" style="float:right;"> 通常,我可以在
VBA
中
使用
seleniu
浏览 36
提问于2020-09-23
得票数 0
1
回答
从404错误
抓取
URL中
的
数据-
抓取
、
、
我试图从一个网页上
抓取
数据,但我得到了一个404错误
的
网址如下。但是,我需要从
浏览
器中获取404链接中
的
数据。/www.uscho.com/scoreboard/division-i-men/20172018/composite-schedule/" read_
html
() %>%
html
_nodes("td:nth-
child<
浏览 3
提问于2018-05-28
得票数 0
2
回答
我
如何
知道哪个
浏览
器被用来在Scrapy框架中爬行?
、
、
、
、
我
的
背景是: 正如你所知道
的
,Chrome,Firefox,Safari上
的
网站
HTML
结构
是非常不同
的
。因此,当我
使用
CSS-Selector从
HTML
结构
中获取元素标记中
的
数据时,有时这个标记已经在Chrome
浏览
器中有了,而另一个则没有。因此,我只想专注于一个
浏览
器,以减少我
的
工作量。当我
使用
Scrapy框架从urls
抓取</e
浏览 0
提问于2018-12-05
得票数 0
回答已采纳
2
回答
抓取
链接/
Href
CSS
、
、
、
下面的代码
抓取
了LinkedIn上用户
的
姓名、公司和位置。代码需要LinkedIn
的
登录凭据,如果您对此持怀疑态度,可以
使用
假帐户。
浏览 0
提问于2020-11-18
得票数 0
2
回答
漂亮
的
汤在获取链接方面有什么不同之处?
、
、
、
、
为什么通过查找以<a
href
="开头
的
字符串
的
所有实例来获取beautiful soup内容并提取所有链接是不明智
的
。如果不能
使用
beautiful soup,还有什么其他方法可以提取链接?
浏览 1
提问于2015-01-02
得票数 0
1
回答
HTML
的
内部工作?
、
HTML
是
如何
工作
的
?它会被解析、编译然后执行吗?它会被转换成像C,C++,Python,‘`Java’这样
的
高级语言,然后编译并执行C代码吗?如果是这样的话,为什么我们不能保持一个非常接近架构代码
的
代码,因为编译和解析具有n^3复杂性,可以由虚拟机解释。 如果不是这样,那么它是
如何
工作
的
。
浏览
器是
如何
工作
的
?
浏览 1
提问于2012-06-26
得票数 1
回答已采纳
2
回答
数据挖掘,用于收集网站
的
详细信息并放入CSV或SQL中
他们是一页一页
的
,没有ID。至少,我可以在哪里学到这一点?谢谢。
浏览 9
提问于2011-03-26
得票数 0
回答已采纳
0
回答
使用
Cheerio
抓取
时,文本不可见
、
、
、
所以我一直在网上搜索Cheerio,我能够找到我正在寻找
的
特定
HTML
元素,但由于某种原因,文本不在那里。例如,在我
的
web
浏览
器中,当我检查元素时,我看到了<a
href
= "#" data-bind="text: MovieName, attr: {
href
: DetailsUrl }">Why Him但是,当我在
抓取
的
同时打印出对象时,我看到,<a
浏览 3
提问于2017-01-09
得票数 1
回答已采纳
2
回答
从TripAdvisor
抓取
数据
的
任何建议
、
、
我们目前正在研究一个NLP项目,需要一个从tripadvisor.com中提取
的
语料库。我们期望输出为两种类型:注释和该评论
的
评级。我
的
问题
是: 是否有任何完整
的
工具就是为了这个目的?我
的
意思是为tripadvisor.com编写
的
程序?任何其他有关数据(评论/评
浏览 6
提问于2013-01-16
得票数 3
1
回答
在
VBA
中用Edge替换IE位
、
为了为IE11
的
最终“消失”做准备,我一直在尝试找出
如何
替换我
的
代码
的
几个部分。一种是启动IE并
使用
该
浏览
器
抓取
一些页面。在Edge中有没有等效
的
方法来做下面的事情?我没有看到像“Microsoft Internet Objects”和IE11那样添加对边缘库
的
引用
的
方法。Dim ie As InternetExplorerMedium: Set ie = New InternetExplorerMedium
浏览 0
提问于2021-05-21
得票数 1
1
回答
手动启动
浏览
器会话,并将会话控制权交给selenium进行自动化和处理?
、
、
、
、
是否可以将用户打开
的
浏览
器
的
控制权传递给selenium webdriver?例如,假设我正在
浏览
一个站点(手动),并且喜欢一个
特定
的
页面www.facebook.com,我决定
抓取
它。我怎样才能把这个页面的控制权交给我
的
chrome
web
驱动程序,让selenium做我需要
的
任何
抓取
工作呢?我不介意换个
浏览
器,我用
的
是Mac。我能够弄清楚
如何
浏览 1
提问于2018-04-23
得票数 0
1
回答
使用
bs4和requests
抓取
起始页面
、
、
、
我正在尝试从中
抓取
搜索结果,我已经
使用
bs4和requests
抓取
了所有准备好
的
结果。我在能够
抓取
结果后遇到了一个
问题
。我无法进入搜索结果
的
下一页。
使用
web
浏览
开发人员工具找不到链接。当我检查这个元素时,这就是它所显示
的
,<a
href
="javascript:;" class="numbers_st" onclick="m
浏览 0
提问于2017-07-06
得票数 0
1
回答
httpRequest和JavaScript
、
、
、
我有一个关于excel
VBA
HTTP请求和JavaScript
的
问题
。我不知道
如何
让正确
的
网站回来,因为到目前为止似乎什么都没有起作用。
浏览 18
提问于2018-01-26
得票数 1
2
回答
Python -尝试
使用
Scrapy从
web
抓取
中获取URL (
href
、
、
、
我正在尝试
使用
web
抓取
从网页中获取URL或
href
,特别是
使用
Scrapy。但是,当I response.xpath('XPATH').extract()
href
链接时,它返回一个空列表。
HTML
页面
结构
为: ?我尝试获取
的
特定
HTML
元素
href
是:<a
href
="#2020-38970" class=&quo
浏览 27
提问于2020-06-11
得票数 0
回答已采纳
1
回答
无法
使用
python路径从选项卡中提取数据
、
、
您好,我正在尝试从页面的选项卡中提取数据我在试着提取位置我
使用
下面的python代码和path(
使用
google chrome inspect)。projects/1311034023/priva-the-invincible-and-reusable-camera-privacy-s/description') test_pagetree=
html
.fromstring
浏览 2
提问于2016-02-20
得票数 0
1
回答
如何
使用
VBA
/selenium/chrome找到
href
属性?
、
、
、
、
我对
web
抓取
相当陌生,我开始
使用
Chrome在
VBA
/Excel中
使用
Selenium。我
的
目标元素是菜单项。 For Each mnu In mnus 'getting the
href
浏览 0
提问于2020-02-10
得票数 0
回答已采纳
4
回答
请帮我定义一个perl正则表达式
、
、
我试着爬行每一次在网页上。(知道部分是固定
的
),所以我写了正则表达式(可以让你发笑): ~m#<div class="
浏览 0
提问于2012-05-18
得票数 1
回答已采纳
4
回答
如何
自动导航到需要身份验证
的
网站?
、
、
、
这就是我想要实现
的
目标。我想写一个脚本,它将导航到一个网站,要求我被认证为我自己,比如Facebook,Live Spaces,Twitter或任何其他网站,然后让该脚本在网站
的
某个页面上搜索某些信息。我在过去用Windows.Forms WebBrowser控件做过类似的事情,它是IE
的
一个成熟
的
实现,可以通过代码控制,一旦你通过身份验证,它将存储你得到
的
任何cookie,但它修改起来非常不友好,我希望
使用
一种脚本语言来代替也许在网络上有一些关于这方面的好
的
教程? 谢
浏览 1
提问于2010-04-08
得票数 1
1
回答
我不能用bs4提取帖子
的
instagram标签
、
、
、
、
我想
使用
BeautifoulSoup4从
特定
的
帖子(给定url)中提取hashtag。首先,我
使用
请求获取页面,并尝试
使用
find_all()获取每个哈希标记,但似乎存在一个隐藏
的
问题
。utm_source=ig_
web
_copy_link' soup = bs(r.content,'
html
.parser') items = soup.find_all(
浏览 1
提问于2020-06-25
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
利用Python和Repl.it进行网页信息爬取
提升页面渲染速度的4个CSS技巧
Web前端,认识css,css规格,伪类和伪元素的用法,代码详解!
教你分分钟学会用python爬虫框架Scrapy爬取心目中的女神
一个浏览器自动化操作的.Net开源库
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券