在将来,当Quora更大时,由于当前缺少的主题(如羚羊解剖)的存在,羚羊主题将获得更高的indegree,但是在适当策划的主题层级中,其indegree将总是保持低于例如动物。...This is the first hint of the topic hierarchy that has beenbuilt by the Quora community....在这样做时,我们将发现更多的层次结构的证据,最终在Quora的顶级活动“中心”的可视化。...鉴于Quora多元化进入新的知识领域,对这一骨干网的需求尤其迫切。然而,正如我们已经看到的,一个庞大的,可扩展的主题层次结构自然地从Quora社区的标签中出现,相关和详细的主题信息。
作者:郭小发 前言 这次比赛的题目是 Quora 公司举办的线上实际问题比赛。Quora 给出两个问题,然后参赛者判断这两个问题是否是重复的问题,即判断两个问题的意思是否一致。...Quora 公司本身用了一个 Random Forest 模型来判断问题是否重复。 这次题目需要用到自然语言处理(natural language processing) NLP 的知识。...题目地址:https://www.kaggle.com/c/quora-question-pairs#description 这个训练数据有大致 40W 条记录,而测试数据有 240W 之多,其中有很大一部分是为了防止参赛者人工标注而用电脑自动生成的题目
例如,流行的Quora电子邮件摘要包括已选择并为您推荐的故事集合。 这是一个不同的learning-to-rank模型,针对不同的目标函数进行了优化。...这是Quora的一个问题,因为我们要确保来自回答特定问题的用户的所有力量都是共享的,并且集中在正确的地方。 将具有问题并希望将其添加到站点的用户指向预先存在的答案也很重要。...在Quora,我们使用ML技术来推断用户专业知识。为了训练这些模型,我们有几个重要的特征。...在Quora,我们有几个模型可以检测与内容质量相关的不同问题。 这些分类器的输出在大多数情况下不直接用于对内容做出决定,而是用作将这些问题/答案反馈到审核队列中的方式,然后手动审查。...Models Quora已经尝试了许多不同的模型来解决上述不同的用例。 有些时候,我们使用开源的实现,但是许多其他实现,我们最终用了更高效或灵活的内部版本。
--想知道quora的网络是怎么连接的吗? By Don van der Drift Introduction 主题在Quora的知识生态系统中扮演着几个关键角色。...主题形成了Quora的知识语料库的重要组织骨干。 这个骨干将只会变得更加重要,因为语料库会继续增长。早期,Quora的硅谷根基允许它迅速成为关于创业和关于创业的问题的一个伟大的平台。...A schematicrepresentation of "following" relationships on Quora....Quora's Diversification 作为我们调查的第一步,我们想要获得Quora扩展到新的知识领域的定量意义。换句话说,目前有多少主题有着大量的内容,这个数字会如何随时间变化?...这些主题之间的关系不能仅仅通过查看这一个问题来推导,但我们有动机询问是否他们可以从Quora的整个问题语料库推断。换句话说,通过用主题标记问题,Quora社区是否有机地创建主题层次结构?
比赛介绍 Quora平台,简单的来说就是美国版的知乎。...最近Quora拿出25,000美元作为奖金,举办了一场Kaggle比赛:Quora Insincere Questions Classification。那么什么是虚假问题呢?
By Shankar Iyer Introduction 当一个答案被添加到Quora时,存在着将它分发给跟随作者的人的各种机制。...然而,通过用户网络跟踪upvote的传播为我们提供了一个有价值的观点,Quora如何作为一个产品,连接人们想要的知识。...换句话说,我们希望知识能够在Quora网络最远的地方为好奇的人们带来价值,并且理想情况下,我们希望这种情况尽可能高效地发生。...下面,我们将讨论关于如何在Quora网络中分发和发现答案的几个问题。在实践中,答案如何通过Quora网络传播?它从作者得到有多远,它多快到达那里?这些动态如何依赖于回答者及其上升者的特征?...数据团队注意到,在Quora社区中也有这些问题的兴趣(例如,一个upvote是如何在Quora上的主题和关注者之间传播的),所以我们决定探索我们的第二个(和过期的)博客文章。
在Quora,随着时间的推移,人们识别回答者谁生产了高品质的内容,并跟随他们。每当这种情况发生时,从读者到作者的网络距离缩短,这是生态系统应该具有的行为标志。...这只是Quora生态系统的机体功能的又一个信号。 即使在小世界网络中,典型的路径长度随着网络的增长而上升;它只是很慢。...这可能有很多原因,从2013年初反馈如何运作到人们加入Quora那段时间的趋势。我们没有深入挖掘这一点,因为2013年的队列在一天后永久超过了2012年,因为2014年的队列表现相当出色。...特别是,我们已经了解了答案如何通过Quora用户网络。...这部分是由于Quora的整体增长;平均来说,只有就平均而言,有更多的用户途径导致几年前的答案更远离回答者。然而,这也可能部分是由于用于向潜在感兴趣的读者分发内容的机制的持续改进。
自从我一年前加入Quora,我一直在谈论在这里的所有的非常有趣的关于机器学习的挑战。然而,当我上周参加并在MLConf发言时,我很惊讶,许多和我谈过的人仍然没有听说我们在做什么。...在Quora我们在关心什么? Quora的使命是“分享和增长世界的知识”。 我们相信,有很多知识仍然在人们的头脑,我们想把它带到互联网中,然后提供一种方式,一种不仅有效率,而且有吸引力的方式。...使Quora独特的事情之一是我们关心三个正交维度:相关性,需求和质量。 我们关心相关性,因为我们想确保每个人都能获得他们最感兴趣的知识。我们关心需求,因为我们想确保许多人的问题都能得到好答案。...数据 您可以将Quora视为知识库,有主题的兴趣网络和社交网络之间的混合。这创建了一个非常丰富的数据和数据之间关系的生态系统,我们可以在我们的机器学习方法中使用。 看看下面的图表。
在Quora,我们已经使用机器学习方法一段时间了。我们不断提出新的方法,并对现有方法进行大的改进。...我们实际上首先需要确定在Quora中“好”的答案的定义。想出这个定义的一个好方法是看看Quora认为“有用的答案”。您将阅读有关“真实”,“可重用”,“提供解释”或“格式良好”的答案。...一个这样非常重要的情况是Quora Feed。 Quora Feed基本上是任何登录用户在登录产品时将看到的主页。...另一方面,Quora在用户之间也有明确的连接。 您在“社交网络”上的操作也应影响排名。 最后,Quora的故事有时可能涉及正在进行的趋势事件。...正因为如此,在Quora创建这样的个性化排名有着许多不同的特征。
【新智元导读】前天深度学习代表人物Yann LeCun在Quora答题,新智元第一时间跟进,LeCun表示他最看好深度学习的对抗式网络,引发从业者王天树回忆起当年他做合成时的疑惑。...从昨天开始,深度学习的元老之一Yann LeCun,乐总在quora上hold了一个session。
i < max, count(start=0)): yield 2**index 更多关于生成器的内容,请见: 一文搞懂python迭代器和生成器 注:本文翻译自Tony Flury在Quora
Quora 的流量涉及大量阅读而非写入,一直致力于优化读和数据量而非写。...1.3 一维数据集中的稀疏数据 Quora 在缓存方面经常遇到的另一个问题是:稀疏一维数据集。如可能需要查询数据库,看某问题是否需重定向到另一问题(如同一个问题被重新发布,就可能发生这种情况)。...绝大多问题不需要重定向,所以 Quora 只会获取几个“重定向”,而大量“不重定向”。 当他们只是缓存了 question_id ,缓存中就会填满不用,只有几个重定向。...作为分片项目的一部分,已对 MySQL 中最大的表进行分片,这是在 MySQL 在 Quora 的分片中记录 此表是基于自增列范围进行分片的,与基于时间的分片接近,因为自增列值随时间增加 大多数查询访问最近的分片
难怪 Quora 在 2010 年代会有如此迅猛的增长。 然而,今天的 Quora 几乎与那些乌托邦的理想无关。...Quora 的“合作伙伴”并不是唯一被招募来完成这项任务的人——Quora 还吸引到从 Reddit 提取问题并发布到 Quora 页面的机器人。这些都不是 Quora 社区想要的问题。...忠诚的 Quora 用户试图举报有偏见的、恐同的和淫秽的内容,但却没有得到 Quora 足够的支持。 然后,AI 来了。...Quora 的帮助中心声明:“到目前为止,我们不使用 Quora 上的答案、帖子或评论来训练用于在 Quora 上生成内容的 LLM,但这在未来可能会发生变化。”...我想知道,如果有人愿意问的话,那么 Quora 将如何回答“为什么 Quora 会走向衰落”这个问题。
“如何通俗解释「为什么数据库难以拓展」”,这个问题来自Quora,题主还补充说自己有一些数据库的基本知识,但依然不理解为什么扩展数据库如此困难。伯乐在线编译摘编了这个问答贴的两个热门回复。
自从Facebook的创始人Adam D'Angelo开始效力于这个大量使用了PHP的网站,我就一直在想他要用Python而不是PHP来创造Quora所遇到的技术挑战。...Adam D'Angelo,Quora创始人: 我们非常确定我们不会用PHP。Facebook因为历史遗留原因而使用PHP,并不是因为它是最好的选择。...Charlie Cheever,Quora的一个创建者 给Adam的答案补充几件事情: Python有一堆相当好的提供了良好的调试器和重载的框架(Django,Pylons和其他一些),这些大部分都被很好的支持并且也变得越来越好...这真是太好了,因为Quora中涉及到大量的客户端和服务端之间的不加载页面的交互。 Python代码往往可读性很强,因为我们希望能在网站上和一帮人工作,这变得非常重要。...英文原文: https://www.quora.com/Why-did-Quora-choose-Python-for-its-development 译者: cmsl *声明:推送内容及图片来源于网络
【新智元导读】曾在 Endeca, Google, LinkedIn 负责机器学习项目的 Daniel Tunkelang 在 Quora 上发表了给非专业人士看的关于机器学习的相关知识。...原文地址:https://www.forbes.com/sites/quora/2017/09/06/ten-things-everyone-should-know-about-machine-learning
AI 科技评论按:实际上,号称「美版知乎」的 Quora 也已经大量引入了机器学习技术,而 Quora 的工程师们则喜欢把自己研究机器学习、产出技术方案的过程戏称为「炼丹」,如今他们也想对外分享他们的经验和成果...日前,他们发出了该系列博客的第一篇——《使用 Alchemy 做特征工程》(「Feature Engineering at Quora with Alchemy」),作者为 Quora 的两位工程师 Kornél...现在,Quora 的重点便是通过问答来实现这些目标:读者在网站上寻找相关的内容,提问者寻找有用的答案,而我们就是从他们的提问中提取出正确问题的答复者。...随着 Quora 网站上机器学习工程师数量日益增多,用来支持产品中各类应用程序的独一无二的特征工程框架的数量也在增多。...via: https://engineering.quora.com/Feature-Engineering-at-Quora-with-Alchemy
2 Quora光速崛起的“法宝” 除了Facebook,每一天,Quora团队也可能发布其产品的40到50个新版本。 他们采用一种特殊的实践,可以自动发送要部署到生产环境的任何新代码。...Quora团队是如何在不牺牲质量和可靠性的情况下,比其他团队更频繁地部署软件的(事实上,这种差别是数量级的)? 我们为什么要如此频繁地发布软件?...3 快速行动的其他“神器” 今天,Quora的团队并不是唯一一个强调快速迭代的重要性的团队。
大数据文摘投稿作品 来源:Quora 编译:群青 机器学习算法那么多,一个问题的解决往往可能有好多算法的选择。 这些算法有什么特点呢?特定的场景需要选择哪一算法呢?...我们为大家翻译了Quora上大牛们最喜欢的机器学习算法,一起欣赏。...Xavier Amatriain,前ML研究人员,目前在Quora带领工程师 我喜欢简单而灵活的算法。如果一定要选一个,我最喜欢集成(Ensemble)算法,我个人认为它是“大师级别”。...相关报道: https://www.quora.com/What-is-your-favorite-machine-learning-algorithm-1?
大数据文摘投稿作品 来源:Quora 编译:群青 机器学习算法那么多,一个问题的解决往往可能有好多算法的选择。 这些算法有什么特点呢?特定的场景需要选择哪一算法呢?...我们为大家翻译了Quora上大牛们最喜欢的机器学习算法,一起欣赏。...Xavier Amatriain,前ML研究人员,目前在Quora带领工程师 ? 我喜欢简单而灵活的算法。如果一定要选一个,我最喜欢集成(Ensemble)算法,我个人认为它是“大师级别”。
领取专属 10元无门槛券
手把手带您无忧上云