在苏黎世大学的调查报告中,研究人员通过实测发现,ChatGPT在15项标注任务中的处理能力高于众包人员。大模型嵌入众包平台的进度条也被拉快了。洛桑联邦理工学院之后的研究发现,已有超过30%的众包标注者在处理文本标注时使用了大模型。
AI无疑比人工更省时省力:研究人员表示,ChatGPT的单位成本只相当于MTurk的1/20。
文本标注已然被AI占据大部分业务,所以这时候我们会更关注技能要求更高的自动驾驶标注中。
但自动驾驶标注也正被AI侵入。相比人工的拉框方式,自动化标注只需要内置大模型,进行参数设置后,原本需要手动标注的矩形框会自动生成。目前唯一的问题是,生成的矩形框有踩线、贴合度太低等质量问题,需要人工逐一检验。
效率的提升让车企惊喜。理想在使用大模型2.0进行自动化标定,效率是人的1000倍;特斯拉一直在积极推进自动标注的进展,比如在2022年6月裁撤了200名为特斯拉标注视频,以改进辅助系统的美国员工,因为特斯拉的自动标注能力大幅改善,标注10000个不到60秒的视频,只需要大模型运行一周,而不再需要人工标注几个月。
AI数据公司整数智能的创始人林群书说,越来越多的车企和AIGC企业采用大模型产品做自动化标注,营收正在大幅增长。他们最新的动作是在新加坡建立研发分部。
但对于自动化标注的增长,第三方服务商没那么乐观。河南一家众包平台的项目经理说,自动化标注还不能取代60%以上的标注需求,只能作为辅助标注工具,处理单一或特定数据,提升人效。
另一家数据标注公司的产品经理认为,自动标注只能过滤简单的基础数据,还不能像人一样从复杂有争议的场景中精确识别物体。这也是数据标注市场,如今依然是以自动驾驶标注数据为主导的原因。
不过大家也认同,未来的数据标注将从重人力转向重技术的趋势。
总之,不是被同行“卷死”,就是被技术“卷死”。但坐以待毙肯定不行,数据标注的第三方公司在寻找未来的出路。
一边是AI风口带来的项目需求增长,一边是更混乱的竞价、更低的人均产值和正迅速成长的AI。两种情绪是交织的,AI会带来无限机遇,AI也会淘汰“我们”。
灵智互动|数据采集|数据标注
与灵智互动携手,引领AI数据时代,共享智慧硕果
领取专属 10元无门槛券
私享最新 技术干货