首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

每周学点大数据 | No.76 众包算法实践——认识 AMT

王 :现在我们就以一个具体的众包平台为例,谈谈如何使用众包平台。...大多数时候,我们见到的众包平台都是以网站为表现形式的,在这里我们就以一个非常著名的众包平台——Amazon 的Mechanical Turk 为例,了解如何使用众包平台完成任务和发布任务。...Mechanical Turk 是 Amazon Web Service(AWS)的组成部分之一,是一个非常典型的众包平台,它的网址是 https://www.mturk.com/mturk/welcome...小可迫不及待地打开电脑,输入了刚才的网址。 ? 小可 :是一个英文网站。 Mr. 王 :没错,这就是 Amazon Mechanical Turk,一个非常典型的众包平台。...根据任务的标题我们可以推测出,它会给出一个购物小票的照片,这些照片往往是不太规整、字体较小或者字迹比较模糊的,总而言之,让计算机去处理这样的问题会遇到一些困难。

1.7K90

实地探访河南AI村:给人工智能贴标的新“富士康工人”

在几年前河南富士康工厂(生产苹果产品)和电子工厂而闻名,现在,河南的城镇现在拥有办公室工作人员,他们正在进行艰苦乏味的输入工作,让计算机变得聪明。...在推动中国经济发展的制造工厂中,河南人民也发现自己拥有不断增长的劳动密集型数据标签公司这种边缘产业,这些公司为算法提供和处理大量数据。...该数据库依赖于亚马逊的Mechanical Turk,后者将劳动密集型工作外包,例如照片标记的工作以几美分/一张的报酬交给互联网用户去做。...但是,随着世界各地的企业越来越多地转向从无人驾驶汽车到医疗诊断等行业的人工智能应用,ImageNet和Mechanical Turk被证明是不够用的。 你认为我们会让没有生命的东西控制人类吗?...亚马逊土耳其机器人(Amazon Mechanical Turk)的任务是由任何想赚外快的注册用户来完成的,而不是那些周一到周五都有固定工资的员工。 外包意味着这些业务现在在国内遍地开花。

60630
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    ImageNet这八年:李飞飞和被她改变的AI世界

    “在我看来,这与其他人所作的事情非常不同。”Jia Deng说,“我明确感觉到这会改变视觉研究领域的运行方式,但我不知道具体如何改变。”...△ 亚马逊Mechanical Turk的图像分类界面 Mechanical Turk本身也面临一些障碍,很多工作都要由李飞飞的博士生Jia Deng和Olga Russakofsky来解决。...李飞飞的团队最终针对Mechanical Turk参与者的行为开发了一批统计模型,确保数据集中只包含正确的图片。 即便是在找到Mechanical Turk后,仍然花了两年半时间才完成这个数据集。...像谷歌、Facebook和Amazon这样的互联网公司已经开始基于数以百万计的图像、声音片段和文本创造自己的内部数据集,在自己平台上分享。...甚至创业公司也开始收集自己的数据集——做视频理解的AI初创公司TwentyBN就用Amazon Mechanical Turk收集Turk在视频表演上简单的手势动作视频。

    1.7K60

    芬兰为人工智能找到了新的廉价劳动力——监狱囚犯

    该公司宣称自己致力于为世界各地的公司建立一个综合数据库,以帮助企业找到潜在的合作商。这些数据的收集、索引和分析来自数百万在线数据源,包括商业登记处、公司网站、新闻媒体、社交媒体、开放API等。...如果这些文章用英文写的那就很容易了,可以交给 Amazon Mechanical Turk 平台上的人完成。 ?...Turk是一个众包市场,接受任务的人需完成图片和产品分类,翻译文本,将语音或者图片转录成文本等工作。平均在每小时2美元左右。但Turk平台上的参与者以母语为英语的美国人为主。...工资与向Mechanical Turk所完成的任务支付的金额相当。 目前有约100名囚犯进行数据分类的工作,每天工作几个小时。 Vainu和CSA根据任务数量已经签订了年度合同。...Roberts)认为,虽然这些工作往往是死记硬背和重复性的, 但Amazon Mechanical Turk 平台的工作者,他们也拿着和芬兰监狱劳工一样的工资。

    64430

    资源 | Facebook开源人工智能框架ParlAI:可轻松训练评估对话模型

    该框架的目标是为研究者提供: 一个用于训练和测试对话模型的统一框架 一次性在许多数据集上进行多任务训练 无缝集成 Amazon Mechanical Turk,以便数据收集和人工评估 这第一个版本支持超过...Turk,在与人类的实时对话上训练和评估 只需简单的设置,就可以连接 Mechanical Turk 上的人类与你的对话代理 允许比较不同研究组的 Turk 实验 能够引导一个可与人类交互的对话模型的数据集配置...在 Amazon Mechanical Turk 网站上,该 HIT 标题以搜索结果的形式呈现,并且出现在该 HIT 被提及的任何地方。...在 Amazon Mechanical Turk 网站上,该 HIT 描述出现在搜索结果的扩展视图中,并且也会出现在该 HIT 和分配(assignment)屏幕上。...hit_keywords:描述该 HIT 的一个或多个词或短语,用逗号隔开。在 Amazon Mechanical Turk 网站上,这些词被用于搜索 HIT。

    1.6K80

    AI 技术讲座精选:迁移学习——让机器学习投资回报率加倍

    这对今天的商业有什么样的指导意义呢? 目前,研究人员正在借助机器学习(ML)来挖掘计算机让人不可思议的潜力。 这项研究非常激动人心,对吧? 只是,其中的大多数研究仍处于初级阶段。...本篇文章中,我将会向大家介绍一种能够降低成本的方法,也就是迁移学习技术。 作为 Google 的最新研究成果,迁移学习技术相当实用。 监督学习101 监督学习是一种用已标记数据训练预测算法的技术。...开始时用 ImageNet 中1400万标签数据的子集训练算法。该过程会训练算法识别图像特征。 借助 Amazon 的土耳其机器人网站(Mechanical Turk)生成训练数据。...拍摄50,000张食物图像,通过 Mechanical Turk 雇佣员工来标记肉眼可见的菜品成分。然后训练机器学习算法,使其分辨出以下特征:盘子、食物的一部分、边缘等。...为人工智能开发者提供信息和技术交流的平台;为人工智能创业者提供行业数据及智能应用的商业场景;为行业提供人工智能化的技术商业应用。请快快关注我们吧!

    59440

    DevOps工具介绍连载(19)——Amazon Web Services

    Amazon RDS 支持 MySQL、Oracle、Microsoft SQL Server 或 PostgreSQL 等关系型数据库。用户无需本地维护数据库,由Amazon RDS为用户管理。...人工服务类: AMT (Amazon Mechanical Turk)机械的土耳其人:“机械的土耳其人”一词来源:这个名字源自于臭名远扬的能下象棋的“自动装置”,它是匈牙利男爵沃尔夫冈·冯·肯佩伦(Wolfgang...虽然计算技术不断发展,但仍有很多事情人类做的比计算机更有效,比如确定照片或视频中的对象,执行重复数据的删除,抄录音频资料或研究数据的细节。...例如假设程序员在写一个应用软件程序,其中有一个步骤是识别数字照片中的建筑物——这个任务会让电脑为难,但由人去做却很容易。这位程序员在用AMT服务时,可以编写几行简单的源代码,从而获取必要的情报。...假使这个过程倒过来,由电脑程序要求人完成这个任务并返回结果,那又会如何呢?Mechanical Turk就是这么做的,它把人的行为和判断变成了软件程序中的功能。

    3.8K30

    百万廉价劳动力支撑起的人工智能······

    机器的奴隶:庞大的数据标记劳动力 亚马逊劳务外包平台Amazon Mechanical Turk(以下简称”AMT“)上活跃着的50万注册用户。在那里,用户可以领到零星的劳务单子,并借此获得报酬。...这些分布在全球各地的人们,昼夜交替,对数据进行手工输入分类,区分出下一张照片中是否有“狗”,辨别语句中的“bass”到底是低音还是鲈鱼。这些任务并不需要特别的工作技能,只需要花费时间,随时待命。...Milland说,“我的家人会为我准备食物,让我可以边工作边进食。我的手腕之前得过腱鞘囊肿,而且非常严重,我的胳膊也有重复性劳损。但,这就是工作。”...“人们常羡慕在家工作的人,但是你不能告诉他们今天看了一天的ISIS的图片,到处都是人头。” Milland说自己常常需要标记含有色情内容的图片或者视频。...亚马逊、苹果、Facebook、谷歌、IBM、微软等等,要么有自己的劳务众包平台,要么会使用第三方的服务,其中两个最大平台的就是AMT以及CrowdFlower。

    38920

    2019人工智能用户体验设计指南:技术、场景、设计

    本文在微软、谷歌、adobe的AI设计经验基础上,结合了我的亲身实践经验,重新梳理、更新,总结而成。...Amazon有一个众包市场, Mechanical Turk(MTurk),可使个人和企业轻松地将其流程和工作外包给可以执行这些任务的分布式劳动力。就是一个典型的AI管理者模式。...- 设计模式指南 - 模式1 - 探索大数据,提取规律 从大数据中分类、提取,提供灵感、输入建议等。 关于灵感,我们不能从无到有创造出一些东西。...比如adobe的Lightroom产品中,AI可以在照片中发现人物,从而主动对照片进行分组和标记,从而可以快速搜索目标。...系统有可能会出错,需要有个明确的指示,告知用户,让用户理解。

    99320

    Facebook开源AI对话研究平台ParlAI ,解决人机对话最常见5类问题

    ParlAI 还连接到 Amazon Mechanical Turk ,这样研究人员就可以无缝地收集新的数据。...ParlAI 选取了一些可重复的研究,为 AI 社区灌输着更健康的理念。FAIR 团队希望在未来建立自己的排行榜,以推动整个生态的进步。...并且,这一平台与Mechanical Turk是相互融合的,可用于数据收集、训练和评估,这也使得ParlAI 中的bots能够直接与人对话。...我们期待在将来的版本中添加新的任务和智能体。 Mechanical Turk 与人类的对话是构建聊天机器人的训练过程的重要组成部分。...这就是为什么ParlAI支持与Mechanical Turk进行数据收集,培训和评估的融合。这也使研究组的 Turk 实验有了参照物,这在历史上是困难的。

    1.5K50

    谷歌NeurIPS 2018论文:GAN生成3D模型,图像自带逼真效果

    为了让VON学习如何生成自己的形状,该团队训练了一个生成对抗网络(GAN),试图在上述三维形状数据集上区分生成样本和真实样本。纹理生成被“降级”到另一个基于GAN的神经网络。...此外,他们还向亚马逊的Mechanical Turk上展示了200对由VON和最先进的模型生成的图像,被试者的任务是在每对图像中选择更加真实的结果。 VON的性能表现非常突出。...与其它AI模型相比,它的Fréchet初始距离最低。Mechanical Turk被试者更喜欢VON生成的图像,比例高达74%至85%。...研究人员将专注于更加精细化的建模,以更高的分辨率生成形状和图像,将纹理分解为光照和外观,并合成自然场景。...AI模型,可以对脑癌进行合成扫描; 今年8月,卡内基梅隆大学(Carnegie Mellon)的一个研究小组展示了如何利用人工智能将一个人录制下来的动作和面部表情在转移到另一张照片或视频中的目标对象;

    3.3K20

    试试Google的新生成模型

    为了让 VON 系统学习如何生成自己的形状,该团队在上述三维形状数据集上训练了一个生成式对抗网络(GAN) 。而纹理生成被归类了到另一个基于 GAN 的神经网络。...此外,他们还向亚马逊 Mechanical Turk 上的五名测试者展示了由 VON 和其他最先进模型生成的 200 对图像,这些受试者需要在这些图像中选择更真实的结果。 VON 的表现非常出色。...它与所有 AI 模型相比具有最低的 FID 值,并且 Mechanical Turk 的受访者表示更喜欢 VON 生成的 74% 到 85%的图像。...Google 的 DeepMind 子公司在 10 月推出了一个基于 GAN 的系统,以此创建出令人信服的食物、风景、肖像和动物照片。...9 月, Nvidia 的研究人员开发了一种 AI 模型,可以生成脑癌的合成扫描图像,8 月,卡内基梅隆大学的一个团队 演示了 AI 可以将人们已存的动作和面部表情转换成另一张照片或视频中的目标对象。

    74220

    吓人!AI模型性能上不去真的不怪我,ImageNet等数据集每100个标签就错3个!

    这些测试集是我们用来衡量机器学习进展的基准。 在这项研究中,MIT和亚马逊的研究人员通过算法识别验证了10个常用的测试集中确实存在普遍的标签错误,并进一步确定了它们如何影响ML基准的稳定性。...1 主要发现 (1)ML测试集中的错误有多普遍? 研究人员估计10个数据集的平均错误率为3.4%,例如2916个标签错误在ImageNet中占比6%;39万个标签错误在亚马逊评论中占比4%。...标签错误(红色):存在比给定类标签更适合某一示例的类标签。 人工验证 接下来是人工验证。研究人员基于算法识别的错误标签,进一步采用众包平台Mechanical Turk展开了研究。...Mechanical Turk的工作界面显示了CIFAR-100的一个示例(图片带有给定错误标签“ cat”)。界面中会展示错误类别“cat”的训练集示例,以及CL预测类别“frog”的训练集示例。...如下表所示,Mechanical Turk验证确认了普遍存在的标记错误,并对标签问题的类型进行了分类。 这些修正是否全部都对呢?并不是。在某些案例中,验证人员也会同意错误的标签。

    57620

    学界 | Yoshua Bengio等人提出MILABOT:强化学习聊天机器人

    这些支持帮助我们在 Amazon Mechanical Turk 平台通过众包方式处理了 20 万个标签,并维护系统运行所需的 32 个 Tesla K80 GPU。...最终系统的回答语句为粗体。 模型架构 评分模型是一个 5 层神经网络,第一层作为输入,包含 1458 个特征。...第二层包含 500 个隐藏单元,通过将线性变换和修正的线性激活函数(Nair&Hinton,2010;Glorot 等,2011)应用于输入层单元进行计算。...该层对应于 Amazon Mechanical Turk 上获得的标签。第五层是通过对第三层和第四层中的单元应用线性变换来计算的最终输出标量。该模型如图 2 所示: ?...该模型包含一个带有 1485 个特征的输入层、一个带有 500 个隐藏单元的隐藏层、带有 20 个隐藏单元的隐藏层、带有 5 个输出可能性的 softmax 层(对应论文章节 4.3 中的 5 个 AMT

    54090

    详解ParlAI:为了让机器人更会聊天,Facebook开源了新平台

    ParlAI为AI程序员提供了一个简单的框架,来训练和测试聊天机器人,并提供样本对话数据集,还无缝集成了亚马逊的Mechanical Turk“人工”智能服务。...“我们的最终目标之一,是让你拥有自己的数字朋友,一个为你量身定制的虚拟助理”,LeCun表示这个AI虚拟助理,将帮助你更好的与世界互动,更好的与他人交流,更好的了解海量信息,总之会让生活更美好。...通过在数据收集、训练和评价方面与Mechanical Turk的整合,ParlAI中的机器人可以与人类对话。...我们计划在未来的版本中加入更多新任务和agent。 Mechanical Turk 在开发聊天机器人时,与人类的对话是训练中的重要部分。...因此,ParlAI与Mechanical Turk进行了集成,进行数据收集、训练和评价。这也意味着,研究机构可以对Turk试验进行比较,而以往这很困难。

    1.2K80

    Image-to-Image Translation with Conditional Adversarial Networks超细致解析:使用条件Gan经行图像的转换

    这篇论文解决的问题是使用通用框架解决像素到像素的预测,按照从上到下,从做到右说明:上图的第一幅分割街景图恢复成真是街景图,第二幅使用不同颜色的块生成真实建筑,第三幅图是常见的灰度变彩色,第四幅是将空中照片生成地图...PatchGAN可以被理解为纹理/风格损失的一种形式。...在看过文中提到的【25】这篇论文后,patch这个含义以及为什么叫做马尔科夫判别器,【25】这个论文的patch和马尔科夫性体现在固定层的featuremap作为patch输入到判别网络看是否为‘真’,...本篇论文,patch是一整图片的一小块,马尔可夫性是论文作者假设出来的。 说到这里这篇论文的结构已经讲好了,那大家会不会好奇,如何评价生成图片好不好呢?...论文中提出了两个策略,Amazon Mechanical Turk (AMT),大概就是一些人提出要求并付费,一些人有偿接受要求,有一丢丢那啥,比如图像标注啦~另一种fcn-score,属于语义分割中的

    3K80

    这个ObjectNet让世界最强视觉模型秒变水货

    该数据集让AlexNet、ResNet、Inception等最先进的图像识别模型纷纷栽倒,性能暴降40%~45%。...研究人员从Amazon Mechanical Turk 上聘请自由职业者,为数百个随机摆放的家居物品拍照。...他们需要在一个APP上收到分配给他们的拍摄任务,并且会有动画说明告诉他们如何摆放分配的物体,从什么角度拍摄,以及将物体摆放在厨房,浴室,卧室,还是客厅。...“我们发现如何在控制各种偏差的条件下收集数据是非常棘手的,”该研究的合著者、MIT电子工程与计算机科学系的研究生David Mayo说:“我们还必须进行实验,确保我们提供的指示清晰明了,让拍摄者完全理解要求他们做什么...ObjectNet的目标是激励研究人员提出下一波革命性的技术,就像ImageNet挑战赛最初的目标一样。 Katz说:“人们为这些检测器提供了大量数据,但回报却在递减。”

    81410

    学界 | 三维对抗样本的生成方法MeshAdv,成功欺骗真实场景中的分类器和目标检测器

    首先作者们定义了自己的目标:已知一个训练好的二维图片作为输入的机器学习模型 g。通过渲染一个三维物体网格 S,得到一张输入图片 I。...研究者将扰动后的对抗式三维网格放到 Amazon Mechanical Turk 上让人们对其进行分类,99.29+-1.96% 的分类准确率表明这种对抗式三维网格的扰动对于人类感知影响是很小的。...他们再将一张室外的真实照片作为输入,通过估计光照来将兔子网格「真实地」放到场景中然后再对其进行扰动,并且成功地移除了对于原始真实照片中的「自行车」和「狗」的检测,如图 5 所示。 ?...图 5:将对抗式三维网格(Stanford Bunny)渲染到真实照片中导致物体检测器失效 最后,作者研究了对抗式三维网格的转移能力,因为他们用了一个可导的渲染器,该渲染器做出了很多假设,包括三维物体表面为简单的...生成后,将该网格再重新放回 Mitsuba,再评估 Mitsuba 生成的图片是否也可以让机器学习模型预测失败。结果表明这种对抗式三维网格能够转移到不同的渲染器上。

    98540
    领券