许多人工智能工具依赖于一个被称为自然语言处理的人工智能技术,这种技术使计算机能够理解人类语言。计算机可以通过训练来掌握一门语言,然而,在特定语言数据稀缺的情况下,它们会无法学习,例如非洲语言。
从ChatGPT到Siri,人工智能能让我们的日常生活更加便利,只要你说的是它们支持的语言。然而,对于那些不使用中文、英语、法语或其他主流语言的数十亿人来说,这些技术是无法触及的。
不过,非洲研究人员正在努力改变这一现状。在8月11日细胞出版社(Cell Press)旗下期刊Patterns发布的一项研究中,科学家们提出了更好地开发面向非洲语言的人工智能工具的路线图。
该论文第一作者、Masakhane研究基金会人工智能研究员Kathleen Siminyu表示:“对我来说,缺乏面向非洲语言的人工智能工具是不合理的,语言的包容性和代表性应该是技术发展之初就被考虑在内的。”该基金会是一个由非洲科学家组成的草根组织,旨在为讲非洲语言的人们提供可访问的人工智能工具。
许多人工智能工具依赖于一个被称为自然语言处理的人工智能技术,这种技术使计算机能够理解人类语言。计算机可以通过训练来掌握一门语言,然而,在特定语言数据稀缺的情况下,它们会无法学习,例如非洲语言。
为了弥补这一空白,研究团队首先确定了参与非洲语言工具开发的关键参与者,并探索了他们的经验、动机、焦点和挑战。这些参与者包括创作和管理内容的作家和编辑,以及在建立语言工具基础设施方面至关重要的语言学家、软件工程师和企业家等。
研究人员揭示了在设计非洲语言工具时需要考虑的4个核心主题:
首先,非洲是一个多语言社会,非洲语言对人们的文化身份至关重要,并对教育、政治、经济等方面的社会参与起着关键作用。
第二,有必要支持非洲语言内容的创作,包括构建非洲语言的基本工具,如词典、拼写检查器和键盘,并消除语言翻译障碍。
第三,非洲语言技术的创建将从语言学和计算机科学间的合作中受益。此外,应重点关注创造以人为中心的工具,帮助个人释放更大潜力。
第四,开发者在数据的收集、整理和使用过程中应注意社区和伦理规范。
Siminyu表示:“有越来越多的组织工作在这个领域,这项研究使我们能够协调各方努力,构建有影响力的语言工具。研究结果突出和阐述了在时间和资金投入方面的优先事项。”
接下来,研究团队计划扩大研究范围,增加更多参与者,识别人工智能语言技术可能影响的群体。他们还计划解决可能妨碍人们接触技术的障碍。该团队希望他们的研究能够形成一个路线图,从而帮助开发各种语言工具。研究结果还可能为保护非洲土著语言铺平道路。
Siminyu说:“我希望我们能生活在一个非洲人可以拥有与讲中文、英语、法语或其他语言的人一样优质生活质量、信息和机会获取渠道的世界。”
阅读论文:https://www.cell.com/patterns/fulltext/S2666-3899(23)00189-7
了解更多最新研究,请关注Cell Press细胞出版社官方微信“CellPress细胞科学”
领取专属 10元无门槛券
私享最新 技术干货