开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

我想从有隐藏api的网站上抓取数据，但sendinf表单数据也不起作用

隐藏API是指网站中未公开或未文档化的API接口，通常用于网站内部或特定合作伙伴之间的数据交互。从隐藏API的网站上抓取数据需要一些技巧和工具。

首先，要找到隐藏API的网站，可以通过查看网页源代码、网络抓包工具或者使用开发者工具来寻找。隐藏API通常以不易识别的方式嵌入在网页中，可能是通过JavaScript代码、AJAX请求或者其他方式实现。

一旦找到隐藏API，可以使用以下方法来抓取数据：

直接发送HTTP请求：使用编程语言中的HTTP库，如Python的requests库、JavaScript的axios库等，构造请求并发送到隐藏API的URL上。需要注意的是，可能需要在请求头中添加一些特定的参数或者Cookie信息，以模拟正常的请求。
解析网页内容：如果隐藏API的数据是通过网页展示的，可以使用HTML解析库，如Python的BeautifulSoup库、JavaScript的cheerio库等，解析网页内容并提取所需数据。
模拟用户行为：有些隐藏API可能需要模拟用户的操作才能触发，例如点击按钮、填写表单等。可以使用自动化测试工具，如Selenium、Puppeteer等，模拟用户行为并获取隐藏API的数据。

需要注意的是，从隐藏API的网站上抓取数据可能涉及到法律和道德问题，应该遵守网站的使用条款和相关法律法规。在进行数据抓取时，应该尊重网站的隐私政策和数据使用规定，避免对网站造成过大的负担或滥用数据。

关于发送表单数据不起作用的问题，可能是由于表单数据的格式、参数或者请求方式不正确导致的。可以通过以下方法来解决：

检查表单数据格式：确保表单数据的格式正确，包括参数名、参数值、编码方式等。可以使用开发者工具查看网页中表单的HTML代码，确认表单数据的格式。
检查请求方式：确认隐藏API接口的请求方式，通常为GET或POST请求。使用相应的请求方式发送表单数据。
检查请求参数：确认隐藏API接口所需的参数，并将表单数据正确地添加到请求中。可以使用开发者工具查看网络请求的参数，或者查看网站的API文档。
检查请求头和Cookie：有些隐藏API可能需要在请求头中添加特定的参数或者在Cookie中携带认证信息。可以使用开发者工具查看网络请求的请求头和Cookie信息，将其添加到请求中。

总结起来，从隐藏API的网站上抓取数据需要找到隐藏API的位置，并使用合适的工具和技术来发送请求和解析数据。同时，需要遵守相关法律法规和网站的规定，尊重隐私和数据使用规定。

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

不懂代码也能爬取数据？试试这几个工具

题图：by watercolor.illustrations from Instagram 前天，有个同学加我微信来咨询我： “猴哥，我想抓取近期 5000 条新闻数据，但我是文科生，不会写代码，请问该怎么办...从而有一些同学有这样的误区，想从网络上抓取数据就一定要学 Python，一定要去写代码。其实不然，猴哥介绍几个能快速获取网上数据的工具。...八爪鱼提供一些常见抓取网站的模板，使用模板就能快速抓取数据。如果想抓取没有模板的网站，官网也提供非常详细的图文教程和视频教程。...集搜客也是一款容易上手的可视化采集数据工具。同样能抓取动态网页，也支持可以抓取手机网站上的数据，还支持抓取在指数图表上悬浮显示的数据。集搜客是以浏览器插件形式抓取数据。...虽然具有前面所述的有点，但缺点也有，无法多线程采集数据，出现浏览器卡顿也在所难免。网站：https://www.gooseeker.com/ 5.Scrapinghub ?

4.3K4 1

针对Steam平台的攻击分析

网站具有以下特征： 1、假冒网站会对真网站的每一个细节进行仿造 2、有安全证书并支持https 3、发出使用cookies的警告 4、提供一些到原始网站的链接（单击时这些链接不起作用） ? ?...在样本中，用户名和密码使用post方法通过另一个域上的api进行传输。 ? 通过使用原始服务对输入的数据进行验证，输入错误的登录名和密码时，会向用户显示一条错误消息： ?...其他方式除了使用html和css创建登录窗口外，攻击者还采用了一种古老的技巧：在单独的窗口中使用一个假的表单，但地址值为空。...虽然窗口显示方式不同，但工作原理同上，表单验证输入的数据，如果登录名和密码匹配，则提示受害者输入双因素授权码。 ? 如何防范防范此类诈骗的主要方法与识别钓鱼网站的方法没有本质区别。...5、如果一切看起来正常，但仍有可疑之处，请使用WHOIS检查域名注册信息，真正的公司不会在短时间内注册域名，也不会隐藏他们的联系方式。

2.3K2 0

Scrapy中的parse命令：灵活处理CSV数据的多功能工具

概述 Scrapy是一个用Python编写的开源框架，它可以快速地从网站上抓取数据。Scrapy提供了许多强大的功能，其中之一就是parse命令，它可以让你灵活地处理CSV数据。...Spider类是Scrapy的核心组件，它负责从网站上抓取数据并提取所需的信息。在Spider类中，你需要定义一个start_urls属性，它是一个包含要抓取的网页URL的列表。...案例为了更好地理解和使用parse命令，我们来看一个具体的案例。假设我们想从亿牛云网站上抓取代理IP的信息，并保存为CSV格式。...结语通过本文，你应该对Scrapy中的parse命令有了一个基本的了解，以及它如何灵活地处理CSV数据。你可以尝试运行上面的代码，并查看输出文件中的结果。...你也可以根据自己的需求修改代码，或者探索更多的Scrapy功能。希望你能享受Scrapy带来的乐趣和便利！

3542 0

记一次挖洞之旅所引发的撕X大战

在今年八月份，我在迪堡大学的学生电子服务网站上发现了一个带有隐藏输入点（Hidden Inputs，即）的表单。...隐藏表单一般我们在使用隐藏输入点时，我们会假设没人会去打开审查器并检查你的网页源码，然后用它来提交某种格式化的数据。在Mozilla给出的使用场景中，甚至还会用它来发送类似令牌和凭证之类的安全数据。...基于这种假设，开发人员几乎不会对隐藏输入点的数据进行过滤。...但这名管理员却表示他们没有权限答应我这件事情，所以我可能要等到下次跟学校高层见面才能知道结果了。跟学校高层的会面安排在8月30号，他们想从我这里了解整个事情的经过。...但如果我坚持要公布细节的话，那他们就要好好考虑一下了。但我告诉他们，你们系统有漏洞这是板上钉钉的事实，这并不是我的错，而且你们的系统此前可能已经被入侵多次了，而学生们的信息可能也早就泄露出去了。

5936 0

从编程小白到全栈开发：数据 (1)

数据收集有很多种不同形式，比较典型的有：设计一些网页表单，让用户填写该表单在代码中埋点，当代码执行到指定的埋点位置，即向服务器发送相应数据对接第三方系统API、硬件传感器等，由第三方主动推送、或由己方拉取数据...编写数据爬虫，选取固定格式或无视格式的从其他网站上抓取数据手动收集数据，整理成比较规整的结构，比如csv，excel文件等没记错的话，在之前的文章中我们其实已经涉及到了一些如何将前端的数据发送到服务端的知识...不过这种单纯的文件形式，在数据查询和数据操作上的能力还是非常弱的，比如我想从我硬盘上一堆文件中，得知文件内容中含有“一斤代码”四个字的文件的总字数，这个需求要通过纯文件的方式来实现，恐怕是比较难的。...像上面提到的MySQL，Oracle，SQL Server，DB 2，PostgreSQL等都是关系型数据库；而非关系型数据库近年来也呈飞速发展态势，比如著名的有MongoDB，Redis，CouchDB...今天就讲这么多吧，给大家一个比较笼统的概念，虽然笼统，但总比完全没有概念好，哈哈~祝大家学习愉快。 DT时代，数据就是生产力！欢迎关注一斤代码的系列课程《从编程小白到全栈开发》

4313 0

《Learning Scrapy》（中文版）第5章快速构建爬虫一个具有登录功能的爬虫使用JSON APIs和AJAX页面的爬虫在响应间传递参数一个加速30倍的项目爬虫可以抓取Excel文件的爬虫总结

INFO: Spider closed (closespider_itemcount) 这是一个简单的登录示例，演示了基本的登录机制。大多数网站可能有更复杂的机制，但Scrapy也处理的很好。...例如，如果你访问http://localhost:9312/dynamic/nonce，你会看到一个和之前一样的网页，但如果你使用Chrome开发者工具，你会发现这个页面的表单有一个叫做nonce的隐藏字段...他有许多有用的功能如formname和formnumber，它可以帮助你当页面有多个表单时，选择特定的表单。它最大的功能是，一字不差地包含了表单中所有的隐藏字段。...当你就要为XPath和其他方法变得抓狂时，不妨停下来思考一下：我现在抓取网页的方法是最简单的吗？如果你可以从索引页中提取相同的信息，就可以避免抓取每一个列表页，这样就可以节省大量的工作。...通过抓取100个索引页，我们得到3000个项，但只有100个请求而不是3000个。在真实的Gumtree网站上，索引页的描述比列表页的完整描述要短。这是可行的，或者是更推荐的。

4K8 0

用爬虫解决问题

使用Java进行网络爬虫开发是一种常见的做法，它可以帮助你从网站上自动抓取信息。...下面我将简要介绍如何使用Java编写一个基本的爬虫来解决数据抓取问题。 1. 确定需求与目标在开始编写代码之前，首先明确你的需求：你想从哪个网站抓取什么数据？需要处理动态加载的内容吗？...需要遵守网站的robots.txt协议吗？了解这些有助于设计合理的爬虫策略。 2. 选择合适的库 Jsoup：适合于简单的静态网页抓取和解析HTML内容。它提供了非常方便的API来提取和操作数据。...HtmlUnit：能够模拟浏览器行为，支持JavaScript执行，适用于抓取动态内容的网站。...通过上述步骤，你可以开始使用Java构建自己的爬虫程序。随着需求的复杂化，可能还需要考虑多线程爬取、数据存储、反爬虫策略应对等问题。不断学习和实践，你将能够开发出更加强大和高效的爬虫解决方案。

1051 0

现在学习编程是学习JAVA好还是python好？

首先必须明确一点，Java和Python双方都有各自适合和发展的领域，所以别人常问我学习什么语言好，或者让我在两种语言进行比较好坏，编程语言只有适不适合，不存在好坏，你想从事什么工作就去学习什么语言。...他也可以作为一门和Java类似的后端语言，用来开发网站。豆瓣网最早的那几个版本就是用纯Python来进行开发的。Python语言的学习成本很低，语法简洁，非常容易上手。但这却不意味着能学好学精。...因为Python语言的简洁易用，并且他的底层一些API库可以直接支持人工智能AI的开发，所以用Python开发AI基本就是首选。...所以如果你想从事人工智能大数据方面的工作学习Python确实是一个很不错的选择。最后我还是想说，语言没有好与不好，只有适合与不适合，想清楚自己想要从事的职业工作，再学习一门适合你工作的语言。...⊙看看你对队列的了解有多少？ ⊙面试题68（加深你对栈的理解_让你知道什么是栈） ⊙来测试一下你对数据结构中的栈和队列的了解有多少？

1.6K2 0

Headless Testing入坑指南

为什么要使用Headless Testing Headless Testing有下面的优势：比真实浏览器更快抓取数据更加方便便于构建自动化测试脚本轻松模拟多个浏览器 ●比真实浏览器更快由于无头测试不需要启动浏览器的...●抓取数据更加方便如果没有无头测试工具的话，在抓取页面数据时，你需要打开一个浏览器，输入页面地址，找到指定的页面数据。而有了无头测试工具之后，这一切操作都可以自动化完成。...因为你可以利用无头测试工具提供的命令行+api来自动化地替代大量的简单重复操作，如输入页面地址、刷新页面、表单提交、确认显示数据是否正确等等。...如果有了无头测试则可以轻松通过api和配置项来控制当前浏览器的属性。此外，你也可以通过脚本进行并发测试。...通过无头测试，您可以生成网站的截图和pdf文件，从网站上抓取内容，自动提交表单，并模拟键盘输入。当与无头浏览器结合使用时，它允许你在完全成熟的浏览器中做任何你可以做的事情，而不需要浏览器。

1.8K5 0

更巧妙的表单设计与登陆访问

但是，对于用户来说，在一个网站上注册却是痛苦的，这也变向导致了企业的用户流失。最近我一个朋友移民了，向我吐槽说他必须要填很多表格才能完成这一切，说真的，我也有过相似经历，对此也非常烦闷。...以下是我对改善注册表单的几点建议： 1 、登录表单最佳实践 “设置密码在一定程度上不会增加多少安全性，但登录失败，却会让你付出代价。”...——尔森·诺曼首先，我们不可能记住自己所使用过的每一个密码，所以大约82%的人都会在一个普通的网站上忘记了密码。其次，我们的需求在不断变化，我们今天使用的网页或应用可能很快就不再对我们有吸引力。...——Luke Wroblewski 我曾就职于不同的企业，对此我也做了类似的观察：每从一个表单中减少一栏，转化率就会相应增加。毕竟填写表单对用户来说是耗时耗力的。...而事实也确实如此，繁琐的表单给客户的第一体验就很糟糕。如果我们以用户和用户参与度为核心，而不是相关信息，我相信我们可以为用户提供更好的体验。

1K4 0

从黑客那里保护公司网站的12个技巧

通常您的网站开放运行如同无需锁门但依然安全开放的办公室一样：因为大多数人不会仅仅步入并访问您的办公室就洞察到您所有的数据信息。偶尔您会发现有不怀好意的人进入并偷走你的数据。...事实上，甚至一些免费的插件，例如Acunetix WP Security的插件，也可以通过隐藏网站CMS的身份来提供额外的保护。...使用加密的SSL协议来传输网站和数据库之间用户的个人信息。在没有适当权限的情况下这可以防止在传输和访问中读取信息。 10.删除表单自动填充。...当您为网站上的表单启用自动填充时，您可能会受到来自任何被盗用户的计算机或手机的攻击。您绝不应将您的网站暴露，从而被因懈怠而被盗用的合法用户所攻击。 11.经常备份。...12.你无法隐藏你的代码。您可以也许会购买到据说能隐藏您网页上的代码的软件，但它根本不起作用。浏览器需要访问您的代码以便呈现您的网站页面，因此有简单的方法可以绕过网页“加密”。

7840 0

能用CSS实现的就不用麻烦JavaScript

——Atwood定律虽然万物都可以是JavaScript，但某种程度css的运行效率会比JavaScript高，所以笔者认为:能用CSS实现的就不用麻烦JavaScript。...随着scroll-behavior属性的新增，我们可以使用一行CSS代码来处理网站上的平滑滚动！浏览器支持约为75％，兼容性还是挺不错的。...-07-18 上午9.15.50.gif] 利用 CSS 的 content 属性 attr 抓取资料想必大家都想到了伪元素 after ，但是文字怎么获得呢，又不能用 JavaScript 。...CSS 的伪元素是个很強大的东西，我们可以利用他做很多运用，通常为了做一些效果， content:" " 多半会留空，但其实可以在里面写上 attr 抓资料哦！...CSS实现的功能，有兴趣的同学继续研究一下更多不依赖JavaScript完成的CSS功能。

1.4K1 1

Python3网络爬虫(十一)：爬虫黑科技之让你的爬虫程序更像人类用户的行为(代理IP池等)

在互联网上进行自动数据采集（抓取）这件事和互联网存在的时间差不多一样长。今天大众好像更倾向于用“网络数据采集”，有时会把网络数据采集程序称为网络机器人（bots）。...最常用的方法是写一个自动化程序向网络服务器请求数据（通常是用 HTML 表单或其他网页文件），然后对数据进行解析，提取需要的信息。 ...2.5 爬虫如何避开蜜罐虽然在进行网络数据采集时用 CSS 属性区分有用信息和无用信息会很容易（比如，通过读取 id和 class 标签获取信息），但这么做有时也会出问题。...这种手段不仅可以应用在网站的表单上，还可以应用在链接、图片、文件，以及一些可以被机器人读取，但普通用户在浏览器上却看不到的任何内容上面。...我只是实现了，构建代理IP池和检查IP是否可用，如果你感兴趣也可以将获取的IP放入到数据库中，不过我没这样做，因为感觉免费获取的代理IP，失效很快，随用随取就行。

2.8K7 1

Python3网络爬虫(十一)：爬虫黑科技之让你的爬虫程序更像人类用户的行为(代理IP池等)

在互联网上进行自动数据采集（抓取）这件事和互联网存在的时间差不多一样长。今天大众好像更倾向于用“网络数据采集”，有时会把网络数据采集程序称为网络机器人（bots）。...2.3 正常的访问速度有一些防护措施完备的网站可能会阻止你快速地提交表单，或者快速地与网站进行交互。即使没有这些安全措施，用一个比普通人快很多的速度从一个网站下载大量信息也可能让自己被网站封杀。...2.5 爬虫如何避开蜜罐虽然在进行网络数据采集时用 CSS 属性区分有用信息和无用信息会很容易（比如，通过读取 id和 class 标签获取信息），但这么做有时也会出问题。...这种手段不仅可以应用在网站的表单上，还可以应用在链接、图片、文件，以及一些可以被机器人读取，但普通用户在浏览器上却看不到的任何内容上面。...我只是实现了，构建代理IP池和检查IP是否可用，如果你感兴趣也可以将获取的IP放入到数据库中，不过我没这样做，因为感觉免费获取的代理IP，失效很快，随用随取就行。

1.9K3 0

🧭 Web Scraper 学习导航

常见网页的类型结合我的数据爬取经验和读者反馈，我一般把网页分为三大类型：单页、分页列表和筛选表单。 1.单页单页是最常见的网页类型。我们日常阅读的文章，推文的详情页都可以归于这种类型。...教程里我费了较大的笔墨去讲解 Web Scraper 如何爬取不同分页类型网站的数据，因为内容较多，我放在本文的下一节详细介绍。 3.筛选表单表单类型的网页在 PC 网站上比较常见。...没错，Web Scraper 也支持基础的正则表达式，用来筛选和过滤爬取的文本，我也写了一篇文章介绍正则表达式，如果爬取过程中使用它，可以节省不少数据清洗的时间。...（充钱就能不限速） Web Scraper 的缺点只支持文本数据抓取：图片短视频等多媒体数据无法批量抓取不支持范围抓取：例如一个网页有 1000 条数据，默认是全量抓取的，无法配置抓取范围。...想停止抓取，只能断网模拟数据加载完毕的情况不支持复杂网页抓取：对于那些加了复杂交互、酷炫的特效和反人类的反爬虫网页，Web Scraper 无能为力（其实这种网页写 python 爬虫也挺头疼）导出数据乱序

1.7K4 1

Elementui实战知识点随记

表单验证对于复杂数据，类似于对象里面包含数组，每个数组又包含多个对象，表单验证我查看了网上很多资料都说Elementui不支持，实际上，经过我官网的查看，是有解决办法的，地址如下 https://element.eleme.cn...，这个亏我吃了两次，定义了个对象在data中，如下，bonus是select中需要添加的数据，userCode是默认值，如果不加默认值这个属性，哪怕在select中定义了，动态加载时也赋值了也是没用的，...vue受限于javascript动态赋值的基础必须是data中定义好属性当组件绑定一个对象的属性，发现组件点击变化没反应，十有八九就是没有定义数据了 form: { userCode: '',...bonus:[] } 1.3. el-input标签中不能使用@keyup.enter 有时候我们绑定不了事件到Elementui的组件，官网给出了解决办法 https://cn.vuejs.org/v2...我遇到Loading样式修改的问题，我想把Loading的转圈圈图标隐藏掉，发现直接改css样式不起作用，如果去掉scoped的确可以，可是其他用到的地方也会同样影响到，所以网上找到一个最好的办法，深度定制

8443 0

HTML 5.2 新特性

在HTML 5.2中，有许多添加和删除的属性，所有这些都可以在官方的HTML 5.2变更履历页面上看到。在本文中，我将介绍一些我认为会影响我开发的变化。...数据来源自caniuse.com 在iframe中的使用支付请求API（Payment Request API）新的支付请求API是替代结账表单的一种原生方法。...它旨在是为用户提供一种标准化的、一致的支付方式，通过将支付信息的处理方式转移到浏览器上，而不是在每个网站上进行单独的结帐表单。...虽然跨多个页面重复的内容可以放在header、section或任何其他元素中，但元素是为特定页面的特定和惟一的内容保留的。...我们知道，有好多种利用CSS来隐藏元素的方法。但是，多余的元素必须使用hidden属性进行隐藏。

7495 0

在 JavaScript 中以编程方式设置文件输入

在幕后，浏览器在用户磁盘上保留了文件的内部引用，但这并不对 DOM 可见，也不应更改。但你可以通过在输入元素上编程设置文件属性来修改文件。...]; // 不起作用以上尝试也不会生效，因为 files 对象是 FileList 接口的一种类型，它不是内部数组，而是类似数组的对象。...我的方法在寻找答案时，我在 Stackoverflow 上得到了一堆不赞同的回答和否定。有一个答案告诉 PHP 用户，如果有解决方法，它最终会被 Chrome 构建者禁用。...= ['我的文件内容'];const myFileName = 'my_file.txt';const myFile = new File(myFileContent, myFileName);// 创建数据传输对象...，我需要更改表单中文件输入字段的文件内容，但我无法访问代码。

1800 0

为了方便查询疫苗批号，我用了一个周末做了个小程序

我又去微信里看了看确实有几个批次号查询的小程序，但大多数据就停留在18年不再向后更新了。...其实如果只是自己使用只要抓取2018年以后的数据就行了再早的疫苗到现在基本都已经是过期状态了，但为了保证数据的完整性我还是抓取从2007至今的所有数据，并写好了定时任务每天3点去检查是否有新数据出现。...保证之后程序会一直有新的数据。抓取数据后就是做一个REST风格接口，接收疫苗号为后续的小程序查询做准备。...看了一下小程序示例只要你做过vue或react项目就没有学习成本，像网络请求、数据存储小程序也都帮你封装好了。整体程序分为了三个页面： 1....首页面为表单页面，方便输入疫苗的批次号，这里的输入信息支持模糊查询，只要输入大于4位的批次号即可。 2. 查询列表页面，因为不同厂商的疫苗可能会使用同一个批次号名。所以这里会列出多份数据。

9666 0

“秒杀”心得

发现表单中需要填写的是：一些固定信息、一些隐藏域（HiddenField）、图片验证码。隐藏域中需要提交一些如：当时秒杀活动Id、用户Id等的信息。这些信息只要在网站中多分析一下就能得出。...所以只要在临近活动开始的前2分钟获取并录入验证码就行了。这样，所有的数据都准备好了，接下来就是如何让程序自动填写数据并提交到网站上。这是重点，也是难点。...我试了一下在WPF应用程序中直接使用WPF自带的浏览器控件，并研究它的API。...其次，分析网站的提交页面中的表单，发现有很多的隐藏域是一连串随机的数字，没有任何规律，估计这些数据是每次活动都不一样的，所以再使用第一版中静态的模拟页面提交数据的方法不行了，必须使用动态的页面，把这些随机的数据都保留下来...总结这次秒杀器编写的过程，让我的一个心结给解了。一直以来，就想完全控制网页客户端程序的运行：大四在电信的时候，老总让我给领导刷票；再后来有要人给我给论坛自动提交数据。

2.6K9 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭