Llama 3发布，开源社区迎来自己的GPT4模型了吗？

原创

算法一只狗

发布于 2024-08-20 19:49:27

2830

文章被收录于专栏：算法一只狗算法一只狗

Meta终于发布Llama 3开源模型，开源社区终于要迎来自己的GPT-4模型了吗？

那到底Llama 3优化了什么地方？真的会有这么强的能力，可以追上GPT4吗？因此，本文初体验了一下Llama 3的能力，带大家深入了解一下新的Llama模型

在线使用

目前想要体验Llama 3模型，有两个网址，一个是Meta自己官方的网址，另一个是huggingchat搭载。

Meta网址

https://www.meta.ai/ 而且像ChatGPT一样，它也可以不需要任何账号就可以与之对话

然而，目前Llama 3不太支持中文回复。幸运的是，它已经在github上公布了开源代码，为开发者提供了训练的基础。可以基于开源代码，打造出中文社区的“GPT4”大模型，让沟通变得更加流畅、生动。

Huggingchat网址

另一个是huggingchat网址：

https://huggingface.co/chat/ 这个网址不需要科学上网，在国内也可以访问

在huggingchat中，模型上可以选择Llama 3进行对话

LLama 3的初体验

数学计算

Q:一个三角形,如果一条边长为4cm,另一条边长为7cm,则第三条边最长可能是多少厘米?（答案为正整数）

Llama 3给出的答案范围是在“3< c < 11”，然后又由于是最长正整数，所以是“10cm”，推理是正确的。

逻辑推理

Q：赵三的父母结婚的时候，为什么没有邀请自己参加

在伦理逻辑上，模型知道了“赵三”是他们的孩子，所以不可能参加他们的婚礼

赵三的父母结婚就意味着他们要结婚了，也就是说赵三是他们的孩子。但如果赵三是他们的孩子，那么他就不能参加自己父母的婚礼了，因为……好吧，他还不存在！

代码能力

Q：利用huggingface调用LLAMA大模型代码。

首先Llama 3会让你安装相关的依赖库：

然后还贴心的给出每个步骤需要干什么，从实现角度看，给出了具体的调用Llama模型主干，但是数据并没有给我们准备，还是不够完整。

网络热梗

但是对于中文的网络热梗是无能为力了，问他关于“花西子币”是什么，直接开始胡说八道了

Llama 3升级了什么能力？

这里总结了Llama 3到底改进了哪些地方：

Meta的新版本Llama 3模型在各项指标上均表现出显著提升，特别是在人工评估上，效果优于其他模型
Llama 3模型采用decoder-only架构，词汇表扩大至128k，提升了推理效率，并支持输入8k token
Llama 3模型的改进在于预训练方法的优化，降低了错误拒绝率，改善了一致性，并增加了模型响应的多样性。
在同等参数量大小的情况下，Llama 3的效果远超其他模型，如Gemma和Mistral。
Llama 3模型的预训练数据集扩大至15T，覆盖30多中非英语语言，有助于提高模型的多语言应用能力。
目前，Llama 3的400B模型正在训练中，预计将取得更好的效果。

各种数据集上效果提升明显

Meta的新版本Llama的8B和70B模型，对比于旧版本有一个重大的提升。改进了预训练的方法后，新的模型大大降低了错误拒绝率，改善了一致性，并增加了模型响应的多样性。

在上图中，同样规模下经过指令微调的模型，Llama 3比Gemma和Mistral模型在不同数据集上的效果都要好。

同时Meta还开发了一套自己的人类评估集，该评估集包含 1,800 个提示，涵盖 12 个关键用例：寻求建议、头脑风暴、分类、封闭式问答、编码、创意写作、提取、塑造角色/角色、开放式问答、推理、重写和总结。在这个集合上，对比了Claude Sonnet、GPT-3.5、Mistral等模型，其取得的效果都比其他模型要好。