随着自然语言处理和大语言模型(LLM)的最新进展,以及像某机构这样的大公司主导该领域,许多人都在想:我们是否正进一步走向一个黑箱时代,模型越来越大,被隐藏在大型科技垄断企业控制的API之后?
并非如此。本文将深入探讨开源模型生态系统、关于行业中LLM用例的一些常见误解、实际案例以及软件开发的基本原则(如模块化、可测试性和灵活性)如何仍然适用。LLM是工具箱中强大的新工具,但最终目标仍然是创建一个能按需工作的系统。显式优于隐式,可组合的构建块仍然优于巨大的黑箱。
随着理念的发展,人们看到了越来越多高效利用计算资源的方法,从而产生运行成本更低、更易于控制的AI系统。以下将分享一些可立即应用的实用方法。如果要构建一个执行特定任务的系统,并不需要将请求转换为任意语言,然后调用最能理解任意语言的最大模型。开发那些模型的人在讲述那个故事,但其他人没有义务相信他们。
模型 | F值 | 速度 (词/秒) |
|---|---|---|
GPT-3.5 | 78.6 | < 100 |
GPT-4 | 83.5 | < 100 |
spaCy | 91.6 | 4,000 |
Flair | 93.1 | 1,000 |
2023年SOTA | 94.6 | 1,000 |
2003年SOTA | 88.8 | 20,000 |
这更多说明了众包工作者的方法论问题,而不是LLM本身的问题。我们不再需要众包工作者。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。