Meta通过开发MultiRay平台来优化人工智能模型运行,降低整体的模型运算成本。这个平台的想法,是要集中化大型模型的使用,以共同分担大部分的处理成本,除了能够有效降低成本之外,可以获得的模型服务,也比公司内各团队自己发展的模型更大更好。
现在人工智能可以处理文本、图像和各种形式的内容,但要产生高品质的结果,那就需要以非常多的资料训练大型模型,但Meta表示,这个过程代价高昂,当有许多问题要解决,就需要产生非常多的大型模型,如此成本便会迅速失控。也就是说,事实上在生产环境中使用的模型,通常更小且更简单。
而MultiRay平台便要通过重复使用,模型运算成本最昂贵的嵌入(Embedding),来优化人工智能模型的训练和托管成本。将整个企业的运算集成到单个模型中,更简单地使用人工智能加速器,并且以公司层级来权衡运算和存储能力。MultiRay的通用模型经过训练,可以广泛应用在各种任务中,研究人员提到,这种通用模型比之前针对每个任务创建的小型模型表现更好。
借由使用MultiRay,使得所有Meta的团队,都可以更快改进和迭代应用程序的机器学习模型,从贴文主题标记到仇恨言论侦测,比起每个团队从头开始构建的大型端到端模型,MultiRay能够以更高的效率和更少的人力完成任务。
MultiRay的第一个投入生产的模型是TextRay,支持文本理解应用,侦测虚假内容并改善用户的搜索体验。但只有理解文本是不够的,因为贴文可能包含文本、图像和视频,要理解一篇文章,系统需要分析每个元素,并且综合元素进行集成性分析。
因此MultiRay的第二个模型PostRay,是将文本和图像理解集成到同一个模型中,其应用的范围很广,包括脸书和Instagram上包含文本和图像的资料,这包含用于Reels的主题分类。由于PostRay模型结合多个领域的研究,因此训练、部署和维护也更复杂,通过MultiRay能够将所有服务集成使用同一个通用模型,不只减省成本也能够使应用更快投入生产。
领取专属 10元无门槛券
私享最新 技术干货