在Instagram改变了API进程后，如何使用Python和Selenium来抓取Instagram？我找不到所有的条目，只能找到12个

文章/答案/技术大牛

发布

1回答

javascript、python、selenium、web-scraping、instagram

我正在尝试使用Python和Selenium来抓取Instagram。目标是获得所有帖子的网址，评论的数量，喜欢的数量等。我能够抓取一些数据，但由于某种原因，页面显示的最新条目不超过12个。我想不出一种方法来显示所有其他条目。我甚至试着向下滚动，然后阅读页面，但只给出了12个。我检查了源码，但无法找到

浏览 9提问于2020-04-07得票数 0

2回答

如何正确地使用BS4进行搜索？

python、html、web-scraping、beautifulsoup

我仍然在学习python，并认为一个好的项目是制作一个Instagram刮板。首先，我想试着刮一下凯莉·詹纳斯的个人资料，我想我会用BS4搜索，但后来我遇到了一个问题。import requests profile_image = soup.find('img&#

浏览 6提问于2022-01-13得票数 0

回答已采纳

1回答

Instagram与app的个人集成

facebook-graph-api、instagram、instagram-api

我正在尝试将instagram整合到我的应用程序中。然而，instagram api页面上说，个人使用的api是不推荐的，他们链接到的facebook图形api表示，它只能用于企业。如果您对涉及Instagram登录的消费者(非企业)用例感兴趣，请参考开发人员站点获得以前的API权限。帮助企业在

浏览 1提问于2018-06-17得票数 1

回答已采纳

25回答

Instagram如何从用户名中获取我的用户名？

instagram-api

我正在使用JSON在我的网站中嵌入我的图像提要，URL需要我的用户id，这样我就可以检索这个提要。那么，我在哪里可以找到/获取我的用户id呢？

浏览 8提问于2012-08-03得票数 138

回答已采纳

3回答

Instagram基本显示API分页

facebook、api、facebook-graph-api、instagram、instagram-graph-api

是否对使用Instagram基本显示API获得的媒体结果使用分页？我读过以下文档，但它们没有任何使用分页的示例：提亚

浏览 4提问于2020-01-19得票数 4

回答已采纳

3回答

如何处理速率限制请求的api？

node.js、architecture、api-design、throttling

仅仅因为后端受限制，您就不能真正等待返回响应，直到利率限制允许您继续进行api调用。我能想到几种情况：使用了很多apis：非常讨厌.还有很多麻烦要处理。假设您使用的是amazon，那么现在您必须创建、验证和验证10个帐户。甚至不可能在

浏览 2提问于2018-02-27得票数 5

3回答

使用Python中的BeautifulSoup从HTML文本中的嵌套元素中获取文本

python、html、web-scraping、beautifulsoup

我试图提取每天都在比赛的球队，以及每支球队阵容中活跃和不活跃的球员。我试图抓取的页面的网址是：。我一直在使用BeautifulSoup来尝试获取这些数据，并尝试了一些方法来获取数据，但我似乎无法提取<div class="lan

浏览 0提问于2019-11-15得票数 1

回答已采纳

9回答

OAuth授权代码和隐式工作流之间有什么区别？什么时候使用每一种？

oauth、oauth-2.0

关于这两件事，我有几个问题。当服务器可以直接发出访问令牌时，我看不出为什么会在一个工作流中添加额外的步骤(令牌的交换授权代码)。不同的网站表示，当客户端应用程序能够保证凭证的安全时，就会使用授权代码流。为什么？

浏览 10提问于2013-05-01得票数 195

回答已采纳

3回答

在使用Selenium* GeckoDriver和Firefox时，是否有可能减少内存和内存消耗*

python、selenium、selenium-webdriver、memory-management、webdriver

我使用Selenium和Firefox webdriver和python从网站上抓取数据。但是在代码中，我需要访问这个网站超过10k次，并且它消耗了大量的RAM来做到这一点。我之所以这样问，是因为当我启动脚本时，我需要手动登录网站(双因素身份验证，代码不在下面显示)，如果我关闭浏览器会话，我将需要再次登录网站。

浏览 4提问于2019-01-04得票数 2

回答已采纳

2回答

这段Python代码是使用多线程的安全方法吗

python、multithreading、python-3.x

我使用的一个图形应用程序有一个嵌入式Python解释器-它的工作方式与任何其他Python解释器完全相同，只是有一些特殊的对象。基本上，我正在尝试使用Python下载一堆图像，并进行其他网络和磁盘I/O。如果我在没有多线程的情况下这样做，我的应用程序将冻结(即视频退出播放)，直到下载完成。为了解决这个问题，我尝试使用多线程。但是，我不

浏览 3提问于2015-05-19得票数 0

2回答

在Django Social Auth管道中收集额外的用户数据

django、django-socialauth

我使用Django Social (v0.7.22)通过Facebook注册用户，这是正常的。其他自定义函数基于，并使用</em

浏览 3提问于2013-04-11得票数 5

回答已采纳

2回答

如何访问所有国家的安卓游戏商店？

android、proxy、google-play、google-play-services、web-testing

我正在做宏，从google商店提取android应用程序信息。我的客户要求世界上所有的android应用程序的细节。我呆在印度，因为我不能访问其他国家的应用程序。我用硒来刮。

浏览 4提问于2016-06-24得票数 1

9回答

Python，安全，沙箱

python、sandbox

我想做一个网站，人们可以上传他们的Python脚本。当然，我想执行这些脚本。这些脚本应该会做一些有趣的工作。问题是，人们可能会上传脚本，这可能会损害我的服务器，我想阻止这种情况。在不损害我的系统的情况下运行任意脚本的选项是什么--实际上根本看不到我的系统？谢谢

浏览 1提问于2010-09-11得票数 17

1回答

Python Web抓取Intranet在登录后无法继续

python-3.x、web-scraping、beautifulsoup、urllib、python-requests-html

为此，我使用python Web scraping来获取特定列的I列表，然后将它们设置为on或off。而且这个内部网网站只有在我给出特定的用户名和密码认证后才能工作。问题：问题是我无法登录到web门户，然后使用web抓取导航到我需要的页面。我得到的只是“查看源代码”html脚本的一部分作为输出。即使我直接抓取我想要的导航网页

浏览 33提问于2020-10-27得票数 0

回答已采纳

8回答

scrapy可以用来从使用AJAX的网站抓取动态内容吗？

javascript、python、ajax、screen-scraping、scrapy

我最近一直在学习Python，并且正在尝试构建一个网络刮板。它一点也不花哨；它的唯一目的是从投注网站获取数据，并将这些数据放入Excel中。现在我对动态网页内容的体验很低

浏览 8提问于2011-12-18得票数 156

回答已采纳

2回答

Python:访问外部进程信息

python、python-2.7、process、automation、ui-automation

我正在努力弄清楚如何使用Python来管理流程，尽管C++可能会更好地管理这个过程。我使用的是Python2.7，Ubuntu14.04是我的操作系统。我想要达到的目标：我的目的是创建一个脚本来管理其他软件，类似Selenium对

浏览 5提问于2014-09-11得票数 8

8回答

Python、PowerShell或其他？

python、powershell、scripting

PowerShell和其他脚本环境的优点是什么？我们想标准化我们的脚本，目前使用bat和cmd文件作为标准。我认为Python是比这些更好的选择，但我也在研究PowerShell和其他脚本工具。脚本将用于触发进程，如wget等，以调用web服务，或其他需要以特定顺序使用特定参数运行的应用程序/工具。我们主要使用Windows堆栈，但将来很可能需要支持Unix。

浏览 1提问于2009-12-03得票数 32

回答已采纳

34回答

使用Python的Selenium* - Geckodriver可执行文件需要在路径中。*

python、selenium、firefox、selenium-firefoxdriver、geckodriver

我对编程很陌生，大约两个月前就开始使用Python了，我正在研究Sweigart用Python文本自动处理无聊的东西。我正在使用，并且已经安装了Selenium模块和Firefox浏览器。每当我尝试运行webdriver函数时，我都会得到以下内容：browser = webdriver.Firefox()Exceptionre

浏览 64提问于2016-10-23得票数 619

回答已采纳

2回答

需要从website...web查询中提取数据吗？宏？

macros、web-scraping、screen-scraping、imacros、excel-web-query

我有一个每个DOT #的列表(部门转换。)在乡下。我想知道这些公司的保险生效日期。点击“查看HTML格式的报告”，然后在底部你会看到“有效/未决的保险”。我想从该页面中提取“生效日期”，并将其粘贴到电子表格中我已经知道的DOT #X旁边。在我的列表中的数千个DOT #中，不是所有的都会在这个网站上提交申请，如果这会有所不同的话。这可以通过宏或Excel Web查询来完成吗？我知道

浏览 2提问于2013-03-08得票数 0

回答已采纳

14回答

Android：“AVD Pixel_2_API_30的模拟器进程已经结束。”MacBook Pro M1 (苹果硅)

android、android-studio、android-emulator、apple-silicon

我很难在我的MacBook Pro M1 (苹果硅)上启动安卓仿真器。当我尝试启动一个模拟器(API 30，CPU/ABI arm64)时，我会得到以下错误：“AVD Pixel_2_API_30的模拟器进程已经终止。”我使用的是Android Studio的2020.3.1 Beta 5。

浏览 19提问于2021-07-09得票数 43

回答已采纳

点击加载更多