首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

一分钟入门数据标注

小科普

人工智能(Artificial Intelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。人工智能从诞生以来,理论和技术日益成熟,应用领域也不断扩大,可以设想,未来人工智能带来的科技产品,将会是人类智慧的“容器”。

MBH小编告诉你,什么是数据标注

数据标注种类繁多,如分类、拉框、注释、标记等等。想要理解数据标注,就得先理解什么是AI ,其实是部分替代人的认知功能。

小编带大家回想一下我们是如何学习的,例如我们学习认识飞机,那么就需要有人拿着一个飞机的图片到你面前告诉你,“看,这是飞机”。从此以后,不管你是在电视里还是在机场,只要你见到了飞机,你就会知道这玩意儿叫做"飞机"。

同理可证,类比机器学习,我们要教它认识飞机,同样的,直接给它一张飞机的图片,它完全不知道这是个啥玩意的,这可怎么办呢?这跟人脑还是有点差距的啊!

什么?差距?没有的事儿,只是你的打开方式不对!

你听小编慢慢道来,首先,我们得有张飞机的图片,并且上面得标注着 " 飞机"两个字,然后机器通过学习了无数张飞机图片中的特征,直到它可以自行识别飞机,这时候我们再给机器任意一张飞机的图片,它就能认出来这是飞机了。

小编再说说训练集和测试集,它们都是标注过的数据。

还是以飞机为例子,假设我们有 1000 张标注着"飞机"的图片,那么我们可以拿900张作为训练集,100张作为测试集。

机器从 900 张飞机的图片中学习得到一个模型,然后我们将剩下的100张机器没有见过的图片去给它识别,那么我们就能够得到这个模型的准确率了。

想想我们上学的时候,考试题与平时我们做过的练习题总是有些出入的。当然,变换题型才能测试出学习的真正效果,这样就不难理解为什么要划分一个测试集了。

我们都知道机器学习分为有监督学习和无监督学习。

无监督学习的效果是不可控的,常常是被用来做探索性的实验。而在实际产品应用中,通常使用的是有监督学习。那么有监督的机器学习就需要有标注的数据来作为先行经验了。

小编这节“数据标注课”讲得怎么样呢?!

下面给大家看一下标注实例(操作):

(准备标注)

(标注进行时——人体拉框1)

(标注进行时——人体拉框2)

(已完成的标注图)

数据标据平台操作流程:

1、注册MBH数据标注平台账户

①进入平台。

网址:https://www.mbh.ai

②注册账户。

2、实名认证

填写身份信息

上传身份证照片

注意事项

3、点击进入标定列表

4、承接/匹配任务

根据标签进行定向的标定任务匹配,为您推荐最适合您的任务

5、认证

开始任务之前我们将对您的资质水平进行评定,通过后即可开始进入答题环节

6、标定任务

认证完成后即可开始正式标定了,标定结果将在完成一组标定后进行展示

看了以上的操作详情,是不是有点跃跃欲试了呢?

数据标注哪家强?小编主推MBH在线群体智能平台

MBH是一家具有互联网属性的人工智能领域创新公司,公司基于众包的理念博弈的流程群体智能的算法,为泛AI公司、大数据公司提供数据标定(采集+清洗+标注)服务。

平台网址:https://www.mbh.ai

赶紧体验一下吧~!

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180505G0OV1D00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券