学爬虫需要学算法嘛_学算法需要学什么_学算法需要学代码 - 腾讯云开发者社区

我最近对后量子密码学非常感兴趣，特别是基于点阵的密码学。在这篇文章中，没有一种量子算法能比传统的计算机更好地解决点阵问题。然而，有一些算法理论上可以解决格点问题，尽管速度很慢。我想自己研究这些算法中的一个或多个，以帮助我更好地理解格密码学和一般格。那么，什么是最有效的格问题求解算法，为什么它是如此有效？

浏览 0提问于2019-06-21得票数 1

回答已采纳

1回答

如何看待过去30多天的历史？

、

似乎在谷歌网站管理员工具中，我只能看到大约一个半月的爬虫历史为我的网站。我的网站已经验证了几个月了。分析学有着比这更广泛的历史。我是不是做错了什么，就是网站管理员的工具是怎样的？

浏览 0提问于2011-11-17得票数 2

回答已采纳

2回答

私钥加密和对称加密有区别吗？

我经常看到这些术语可以互换使用，但这是对的吗？是否有不使用对称加密的私钥算法？

浏览 0提问于2016-11-19得票数 1

回答已采纳

1回答

密码学未来的发展方向是什么？更大的数目/更快的搜索，或者新的方法，例如，保理？

、、

我正在上密码学的课程，我很重视任何评论。这不是太技术性的问题，而是更多关于密码学的方向或策略的问题。我的问题是，例如，公钥密码学“只是”一个处理大整数的困难的问题吗？我可以理解，分解两个大素数的乘积是很费时的。是否有一种基本的信念，即可能开发新的保理方法，这将导致打破一些密码，或推动数字大小的要求越来越高？还是行业专业人士更倾向于更快、更大的数字处理能力，作为最有可能的未来？

浏览 0提问于2013-01-02得票数 2

4回答

我正在编写一个网络爬虫，最终目标是创建爬虫所走路径的地图。虽然我不知道其他爬虫以多快的速度抓取页面，但我的爬虫每分钟大约有2000页。爬虫使用递归回溯算法，我将其深度限制为15。此外，为了防止爬虫无休止地修改页面，它将访问过的每个页面的url存储在一个列表中，并检查该列表中是否有下一个候选url。 for href in tempUrl: ... if href not in urls: collect(href,parent,depth+1) 当这种方法被拉下大约300,000页时，它似乎成了一个问题。在这一点上，爬虫的平均速度是每分钟500页。所以我的

浏览 0提问于2011-06-29得票数 4

回答已采纳

2回答

计算复杂度和时间复杂度有什么区别？

计算复杂性似乎在密码学论文中得到了广泛的应用。我所指的时间复杂性是计算复杂性理论中的一个。这两件事是一样的吗？

浏览 0提问于2019-08-23得票数 1

回答已采纳

1回答

基于格的密码学实用吗？

、

格型密码学在“实用”环境中的可行性有多大？有人说，基于格的密码学将是一个后量子密码体制，但它是可行的吗？

浏览 0提问于2018-08-19得票数 14

回答已采纳

2回答

生物信息学数据结构

参与生物信息学的人应该知道哪些数据结构？我想每个人都应该知道列表、散列、平衡树等等，但我希望有特定于域的数据结构。有专门讨论这个问题的书吗？谢谢，卢西恩

浏览 0提问于2010-11-30得票数 -1

1回答

Google爬虫屏幕大小

、、

假设一个我有两种类型的图像(A和AAA(更重))为同一网站:取决于屏幕的大小，它将显示一幅或另一幅。现在我想知道什么图片(A或AAA)加载谷歌爬虫时，它访问我的网站。换句话说:谷歌爬虫有“屏幕大小”吗？我想，如果它加载A图像，那么页面速度会比加载AAA图像更好。

浏览 0提问于2013-07-09得票数 4

回答已采纳

1回答

量子计算及其威胁

、、、

因为量子计算机有成为下一代超级计算机的潜力。这会使密码学过时吗？

浏览 0提问于2015-10-30得票数 -1

2回答

“非对称密钥密码体制”“非对称密码学”术语有什么区别？

、

“非对称密码学”和“非对称密钥密码体制”术语有什么区别？

浏览 0提问于2019-08-26得票数 1

回答已采纳

1回答

统计术语：“算法”是“模型”的同义词吗？

、、、

我有个术语问题。在统计学中，“算法”是“模型”的同义词吗？例如，当我拟合一个带有变量的广义线性模型，并为特定目的调整模型参数时，我是否可以报告我“开发了一个算法”，或者这是一个错误的陈述？如果是的话，我所做的最好的描述是什么？开发了模型/安装了模型/建立了模型.？

浏览 7提问于2022-08-24得票数 1

1回答

什么是加密密钥？

、、

在希伯来语中，有一个术语tzophen (צופן)，意思是密码。还有一个术语"maphtech hatzpana“(מפתחהצפנה)，意思是”加密密钥“。什么是加密密钥？据我所知，密码是利用字符来获得有意义的信息的问题，所以需要什么“密钥”才能做到这一点？这可能是希伯来语的说法是错误的，意思是“加密密钥”。

浏览 0提问于2022-05-16得票数 0

1回答

“量子安全”算法与当前的“安全”密码算法(前量子算法)有什么根本区别？

我最近读到，正在开发用于加密/散列的“量子安全”算法。据推测，这些算法将与目前使用的“非量子安全”算法(RSA、DH、AES、ChaCha20、Poly1305、SHA3 2/SHA3 3等)有着根本的区别。哪些基本差异使算法成为“量子安全”？在非量子计算机中，量子安全算法是否更加脆弱？

浏览 0提问于2021-07-22得票数 4

回答已采纳

2回答

块密码用于公钥密码吗？

我读过关于块密码的文章，大多数文章都说它们被用于对称密钥加密。它们是否也被用于公钥密码学？如果不是，pkc的替代用途是什么？谢谢,

浏览 0提问于2013-06-04得票数 5

1回答

我有一些加密的文本(数据)，我不知道使用哪种算法或加密类型。

、

我有一些加密的文本(数据)，我不知道使用哪种算法或加密类型。有没有软件可以检查解密文本(数据)的所有可能性？

浏览 0提问于2010-11-17得票数 0

1回答

对称密码的块大小会影响密码本身的安全性吗？

、、、

128位块在后量子密码学中会有一些安全含义吗？

浏览 0提问于2019-05-05得票数 3

1回答

活体检测视频接口，上传视频认证的时候为何偶尔没有结果返回（返回的结果为空）？请问这是什么原因导致的？

、

请描述您的问题 [附加信息]

浏览 447提问于2018-09-21

1回答

当前加密的量子安全风险

、

量子计算机将决定传统加密技术的命运。其中，受到最大打击的将是99 %的应用程序使用的RSA算法--任何安全传输和存储通信数据或软件更新的加密标准。对于不可避免的问题，有什么解决办法？

浏览 0提问于2018-06-19得票数 0

1回答

如何使用对称密钥算法解密使用随机数加密的密文？

、、、、

我们使用真正的随机数生成器作为密钥的来源进行加密。我无法理解的是:在对称密钥算法的情况下，这个密码文本是如何解密的，因为我们需要相同的随机数来解密密码文本。我能猜测的是：这个随机数是否用作会话密钥，并使用任何非对称密钥算法传输？ PRNG和真正的随机数生成器是否用作种子？

浏览 0提问于2018-08-27得票数 1

2回答

从节点云中查找几何(形状)

、、、、

我正在编写一些代码，这些代码需要识别一些基于节点云的相当基本的几何学。我感兴趣的是：板(简单有界平面) 圆柱体(两个节点环) 半汽缸(arc+line+arc+line) 圆顶(n*loop+top节点) 我试着搜索“节点云中的几何图形”，“从节点中获取几何学”，但是我找不到一个很好的参考。这上面大概有一整块地，有人能给我指路吗？我已经开始编码了，但我想重新发明方向盘.

浏览 4提问于2013-04-24得票数 3

回答已采纳

1回答

哪种谷歌云加密是可逆的？

、、、

这并不完全是一个编码问题，因为加密代码将取决于所选择的类型。众所周知，Google有不同的加密方式，比如对称加密(AES-256和Galais)和非对称加密(椭圆曲线和RSA)。此外，KMS (密钥管理服务)可以使用KEK (密钥加密密钥)加密数据。还有散列，比如base64： import base64 base64.b64encode(b'data to be encoded') 也许我搞砸了加密，所以我才问。那么，这些加密中的哪一个可以逆转呢？我研究过Google文档，但没有发现。提前谢谢。

浏览 17提问于2022-10-05得票数 0

回答已采纳

1回答

解释混沌密码学

、、、

我将冒险学习混沌密码学。然而，我发现很难向那些对密码学有一定了解的人解释混沌密码学的含义。我也不能向那些不知道什么是密码学的人解释--在一个更基本的层面上。你能帮我解释一下混沌密码学吗？

浏览 0提问于2018-12-10得票数 3

3回答

对象与句柄匹配的软件模式

、、

我一直在想办法解决这个问题，但我没有找到任何使我信服的解决办法。我正在编程一个爬虫，我有一个下载任务，每个url从一个url列表。此外，根据站点url和我想要获取的信息，在不同的模式下解析不同的html文档。因此，我的问题是如何将每个任务与其适当的解析连接起来。这些想法是：创建一个巨大的“if”，检查下载类型，并关联一个解析。(避免了，因为“if”随着每个新的不同站点添加到爬虫中而在增长) 使用多态性，为每个不同的站点创建一个不同的下载任务，并与我想获取的信息类型相关，然后使用一个链接其解析的后操作。(每一个新的解析器都会增加复杂性) 因此，我正在寻找某种软件模式或想法，比

浏览 5提问于2014-07-06得票数 0

1回答

数字证书、详尽的用途和参考资料集

、、、

就安全性的细节而言，我是一个新手，是concerned.can，有人列出了数字证书的所有可能用途？它被用于SSL，签名和其他什么？此外，是否有一本好的参考书或文章可以全面了解证书？

浏览 0提问于2019-11-06得票数 -3

1回答

聚类算法，其结果不受数据置换和引导扰动的影响

、、、、

我想知道，在文献中是否有一种聚类算法，其输出(分区、树状图、软赋值等)不变性：数据点中的排列(通常许多层次聚集聚类不是这样) 由于引导特征而引起的扰动我很高兴在文献中找到这样一个算法的切入点！准确地说，我知道聚类的公理式，例如Kleinberg的不可能性定理()或聚类分类法()的开始，但他们似乎没有考虑过这两项属性。

浏览 4提问于2015-01-21得票数 0

回答已采纳

2回答

暴力攻击是否使用创建密文的程序？

我读过几篇关于蛮力密码分析攻击的文章，但没有一篇明确地说明每一次尝试运行的是什么算法，以及使用什么标准来声明一次尝试的成功或失败。如果要尝试每一种可能的键值，那么输入这些密钥的是什么呢？对密文块的暴力攻击意味着密码分析人员将密码视为黑匣子。密码分析人员有块盒吗?他们能驱动黑匣子吗？例如，假设有人使用一个GUI应用程序，该应用程序以文件和密码作为输入，并生成加密文件作为输出。目的是让接收方使用加密的文件和密码作为输出获得明文文件。这个GUI应用程序是由密码分析师的蛮力应用程序以某种方式驱动来尝试每一个可能的密码吗？大多数GUI程序不够快，无法在合理的时间内运行数十亿次。更重要的是，大多数加密都

浏览 0提问于2014-09-27得票数 1

3回答

从非常基础到非常高级的密码学书籍

、

从很久以前，我就想学习密码学，我想成为这方面的专家。我想学习大多数的密码学算法(散列、加密、解密和破解)。在学习了这些概念之后，我想用Java实现一些算法。(即使有JCE API，但我也有兴趣创建一种)。请按顺序给我提供书单。学习加密概念的书籍(理论)实现加密概念的书籍(实用)。

浏览 0提问于2011-09-10得票数 5

回答已采纳

2回答

量子密码算法实现

后量子密码是一种基于物理性质而不是数学的密码学，它有许多算法和实现，如NTRU、McEliece、SIDH等。等但是后量子密码和量子密码有区别，我想知道其中的一些算法，也想知道它们是否有实现，例如在Github上或者其他类似的东西上谢谢

浏览 0提问于2020-05-21得票数 2

回答已采纳

2回答

密码与DES或AES这样的密码算法有什么关系？

、、

看上去我这里有个术语问题。在密码学中，我们有流密码和块密码。我理解他们的区别。我们还有像AES (Rijndael)这样的密码算法。我的困惑是密码算法和密码是如何相互连接的。从根本上说，他们看起来像是在做类似的事情(加密和解密)。 AES等是分组密码的“特例”吗？分组密码是其中之一是AES的一系列算法吗？

浏览 0提问于2018-11-04得票数 4

回答已采纳

4回答

构建web爬虫

、、

我目前正在开发一个内置网络爬虫的自定义搜索引擎。由于某种原因，我不喜欢多线程，因此到目前为止，我的索引器是以单线程的方式编写的。现在，我在构建爬虫时遇到了一个小难题。有人能建议一下，先抓取1个页面再索引，还是先抓取1000+页面和缓存，然后再索引，哪个更好？

浏览 2提问于2009-05-14得票数 1

2回答

后量子密码在IoT器件中的可用性

我的问题很简单。我可以在IoT设备(如RaspberryPi、Arduino等)中使用量子后加密/解密算法吗?或者在量子逻辑中硬件基础结构应该服从吗？

浏览 0提问于2020-01-09得票数 0

回答已采纳

3回答

网络爬虫的更新间隔是多少？

、

我目前正在做我自己的网络爬虫，我想知道… 网络爬虫再次访问相同站点的合适间隔是多少？你应该每天重温一次吗？每小时一次？我真的不know...has任何人在这件事上的一些经验？也许有人能给我指个方向？

浏览 0提问于2010-07-10得票数 1

回答已采纳

1回答

什么是后量子密码？

、

后量子密码学是假定攻击者有一台大型量子计算机的密码学；即使在这种情况下，后量子密码系统也力求保持安全。后量子密码学就像基于格的密码一样，即使量子计算机是可用的，也被设计成安全的。我脑海中闪现的问题是：我们如何定义后量子密码？是什么规范使得它不可能被打破？后量子密码能使它在很长一段时间内不可能被打破吗？

浏览 0提问于2018-09-04得票数 3

回答已采纳

2回答

自动对比度和亮度(用于OCR)

、、、、

你知道这是否可能吗？

浏览 0提问于2011-05-04得票数 2

1回答

W2012 R2 AD证书服务sha算法

、、、

因此，在配置了脱机根CA和带有SHA512的联机AD subordiante CA之后不久，就可以进行将来的校对。我们发现一个瘦客户端供应商(teradici with View 6)只支持SHA1和SHA256。我无法找到任何方法来配置模板，以便将SHA256与任何CSP一起使用。但是，我尝试了"certutil -setreg ca\csp\CNGHashAlgorithm 256“，这使得生成的每个新证书的签名无效。除了重做整个PKI之外，有没有人有任何我可以追求的想法或途径？谢谢。

浏览 0提问于2015-01-29得票数 2

2回答

为什么选择LCG作为c++ rand()函数？

、

C++ rand()函数是一个线性一致性生成器(LCG)。我的问题是：为什么选择这个算法？优点和缺点是什么？这对密码学有好处吗？

浏览 0提问于2019-05-08得票数 4

3回答

如何检测文本文档之间的重复，并返回副本的相似度？

、、

我正在写一个爬虫从一些网站获取内容，但内容可以重复，我想避免这种情况。因此，我需要一个函数可以在两个文本之间返回相同的百分比来检测两个内容--可能是重复的示例：课文1：“我在写爬虫给” 课文2：“我正在写一个文本爬行器来获取” 比较函数将文本2作为同一文本返回1乘5/8%(5为文本的字数2相同的文本1(按词序比较)，8为文本2的总单词2)。如果删除“一些文本”，那么文本2与相同的文本1(我需要检测情况).How我可以这样做吗？

浏览 2提问于2014-04-14得票数 5

1回答

PGP的必要组件

、

我在一次面试中遇到了这个问题。我被问到: PGP加密的两个主要组成部分是什么？我当时想的是私人钥匙和公共钥匙，但我不确定。在谷歌上搜索这个问题也没有帮助。有什么想法吗？

浏览 0提问于2014-12-13得票数 1

1回答

轻量级非对称加密算法

、、、

我是一名嵌入式系统研究人员，也是密码领域的新手。实际上，我需要知道是否有任何轻量级的非对称加密算法，特别是考虑到密钥生成所需的时间。我发现NTRU被认为是最轻量级的非对称密码系统之一，对吗？

浏览 0提问于2015-12-15得票数 4

1回答

如何将DpapiSymmetricCryptoProvider与加密块一起使用？

、、、

我正在使用密码学应用程序块。并配置DpapiSymmetricCryptoProvider。但是没有存储密钥文件的选项。那么，它将从哪里获得密钥，以及在负载平衡中，我们将如何处理它？谢谢，Girish

浏览 0提问于2011-04-14得票数 0

回答已采纳

1回答

密码学推荐书籍:理论与实现

、

从数学家到安全工程师等密码学专家介绍他们认为对这一领域感兴趣的人有用或有指导意义的书籍和教科书是个好主意。我认为一种很好的回答方式是这样的：一、理论、分析、算法、复杂性. 二、设计、实现、代码编写(用C/C++、Java、.)、三.历史、发展、未来可能性、. 感谢所有投稿人分享你们的知识。

浏览 0提问于2012-08-15得票数 3

回答已采纳

1回答

为什么在密钥长度超过一定长度的情况下使用加密会受到限制？

我正在编写一个java程序来加密使用256位AES加密的消息，但我得到了illegal key size error，我读到我必须使用一些JCE无限强的权限策略文件来加密/解密密钥为256位或更长的消息，但我不明白为什么使用密钥大小有限制？为什么在Java中默认禁用256位加密？使用256位密钥加密/解密文件是犯罪吗？

浏览 0提问于2014-11-28得票数 21

回答已采纳

1回答

网页更新检测算法

、、

首先，我不是在寻找代码，只是简单地讨论了关于主题所说内容的方法。我最近在想，检测(尽可能快)网站页面变化的最好方法是什么，假设我有10万个网站，每个网站的页面数量都是未知的，爬虫真的需要偶尔访问每一个网站吗？

浏览 0提问于2012-04-21得票数 2

回答已采纳

1回答

估计事件时间戳之间的时间延迟

、、

我有两个设备(在本例中是计算机)，每个设备都具有本地时钟和时间戳数字事件的能力，即它们可以检测和时间戳输入数字转换，并产生和时间戳输出数字事件。我的目标是找出这两个设备的时钟之间的偏移量。我有两种物理机制来实现这种同步:我在随机(但精确地有时间戳)从一个设备发送一个数字脉冲到另一个设备，而且我有一个外部源，它发送正在记录的脉冲，并在这两个设备上加盖时间戳。有一种可能，一个设备开始记录更早，甚至跳过一些事件。示例：记录时间戳设备1：0,100,125,200,275,300 装置2：1000,1025,1100,1175,1200,1450 这种情况下的时间延迟是900 (设备1上的事件

浏览 8提问于2015-04-03得票数 0

1回答

什么时候O(n^2)算法比O(n)算法更可取？

、

我可以想到使用O(n^2)算法而不是O(n)算法的两种情况：由于大O表示法只描述渐近复杂度，所以当n较小时，O(n^2)算法的精确复杂度实际上可能小于O(n)算法。如果O(n)算法比O(n^2)算法需要更多的内存空间，并且内存有限，那么O(n^2)算法将是首选。还有其他情况支持O(n^2)算法吗？

浏览 2提问于2014-05-05得票数 1

2回答

疯狂的网络爬行？

我一直在监控我公司网站上的活动，比如点击了哪些链接等等。网络爬虫在我们的网站上变得疯狂起来。我认为这是一个问题，我们应该在我们的产品清单上指定一个NOFOLLOW。像MSN和GoogleBot这样的爬虫从我的数据中产生了大约90%的流量。有大约200个与网站的互动，即。大约每隔2分钟，就会有人查看产品或访问“联系我们”页面。爬虫们只是不停地跳来跳去，在“家居装饰”区寻找鱼饵之类的东西。爬虫似乎还专注于我们将钓鱼用作描述性标签的搜索词"spin n glow“。但它已经搜索了超过360万次“自旋n发光”！基本上，我在问这是正常的吗？从字面上看，平均每秒有超过2次点击。总是有一个爬虫

浏览 1提问于2014-07-01得票数 0

1回答