Jina AI创立于2020年,总部位于德国柏林,主要从事提示工程和嵌入模型业务,已迅速成长为多模态AI领导者。Jina AI积极推动开源和开放研究,致力于弥合先进AI理论与开发者及数据科学家构建的AI驱动型真实世界应用程序之间的差距。目前,Jina AI平台已拥有超过40万名注册用户。
Jina AI创始人兼CEO肖涵博士在阐述公司使命时表示:“我们希望能够为多模态AI未来的实现铺平道路。我们发现当前的机器学习和软件生态系统在处理多模态AI方面面临着一些挑战。鉴于此,我们鼎力研发开创性工具和平台,助力企业和开发者解决这些复杂问题。我们的愿景是发挥自身的关键作用,帮助全球用户充分利用多模态AI的巨大潜力并彻底改变信息的解读和互动方式。”
Jina AI在嵌入模型领域的研究引起了业界的广泛兴趣和关注。因为如今许多开发者都已认识到嵌入技术对于生成式AI的重要意义。嵌入模型是非常复杂的算法,可以将任意结构的数据转化并嵌入到多维数字编码(即向量)中。这些向量通过捕捉数据的模式和关系来赋予数据相应的语义信息。这意味着,我们可以使用与结构化业务数据相同的方式来分析和搜索非结构化数据。考虑到我们每天生成的数据中有80%以上是非结构化数据,我们开始对嵌入模型与MongoDB AtlasVector Search等先进解决方案相结合对生成式AI带来的变革性影响充满期待。
Jina AI推出的jina-embeddings-v2是目前首个开源8K文本嵌入模型。该模型的标记长度达到8K,这使其能够更深入地理解上下文,从而显著提高检索增强生成(RAG)和语义搜索等任务的准确性和相关性。Jina AI的嵌入模型具有增强型数据索引和搜索能力,并支持双语环境。嵌入模型专注于单一语言和语言对,确保在特定语言基准测试中达到最先进的性能。Jina Embeddings v2目前已经发布了德语-英语和汉语-英语的双语模型,其他双语模型正在开发中。
Jina AI的嵌入模型在分类、重排、检索和摘要等方面均有优异表现,因此适用于各种应用场景,尤其是跨语言任务。近期,该嵌入模型在跨国企业客户中的部分应用案例包括:销售序列自动化、人力资源技能匹配以及附带欺诈检测功能的付款对账等。
图1:Jina AI的世界级嵌入模型可提高搜索能力和RAG系统性能。
肖涵博士表示:“我们的嵌入API能够原生集成生成式AI开发者堆栈中的关键技术,包括MongoDB Atlas、LangChain、LlamaIndex、Dify和Haystack。MongoDB Atlas将应用程序数据和向量嵌入整合至一个统一的平台,使两者之间完全保持同步。每当数据库中加入新的数据或更新已有数据时,Atlas Triggers 都会调用嵌入API,以确保嵌入始终保持最新状态。这种集成式方法使开发者能够更加高效地为企业构建全新的前沿AI驱动型应用程序。”
如需开始使用MongoDB和Jina AI,请注册MongoDB Atlas并阅读操作指南。如果您的团队正在构建AI应用程序,欢迎报名参加AI创新者计划。报名成功的公司可以获得免费的Atlas学分和技术扶持,并与更广泛的AI生态系统建立联系。
领取专属 10元无门槛券
私享最新 技术干货