Loading [MathJax]/jax/input/TeX/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >340B险胜70B,Kimi机器人贴脸“嘲讽”英伟达新开源模型

340B险胜70B,Kimi机器人贴脸“嘲讽”英伟达新开源模型

作者头像
量子位
发布于 2024-06-21 00:25:32
发布于 2024-06-21 00:25:32
1480
举报
文章被收录于专栏:量子位量子位
一水 发自 凹非寺 量子位 | 公众号 QbitAI

排名超过Llama-3-70B,英伟达Nemotron-4 340B问鼎竞技场最强开源模型!

前两天,英伟达突然开源了其通用大模型Nemotron的3400亿参数版本。

就在最近,竞技场更新了排名情况:

胜率热图显示,Nemotron-4 340B对阵Llama-3-70B的胜率为53%

究竟Nemotron-4 340B表现如何?接下来一起看看。

新模型最新战绩

简单回顾一下,英伟达上周五突然宣布开源Nemotron-4 340B,该系列包括基础模型、指令模型和奖励模型,用于生成训练和改进LLM的合成数据。

Nemotron-4 340B一经发布便瞬时登顶Hugging Face RewardBench 榜一

紧接着,竞技场新近公布了Nemotron-4 340B的一系列测评结果。

长文本查询(长度>=500个token)中,Nemotron-4 340B排在第5位,超过Claude 3 Sonnet及Qwen 2-72B等主流开源模型。

处理硬提示方面,Nemotron-4 340B超越了Claude 3 Sonnet和Llama3 70B-Instruct,显示出其在应对复杂和高难度查询时的卓越能力。

整体性能评估中,Nemotron-4 340B的评分和稳定性均处于中上水平,超越了多款知名开源模型。

概括一下,Nemotron-4 340B已经取得了不错的战绩,直接超越了Mixtral 8x22B、Claude sonnet、Llama3 70B、Qwen 2,有时甚至可以和GPT-4一较高下。

其实,以前这个模型就曾登上大模型竞技场LMSys Chatbot Arena,当时它的别名是june-chatbot

具体来说,这个模型支持4K上下文窗口、50多种自然语言和40多种编程语言,训练数据截止到2023年6月。

训练数据方面,英伟达采用了高达9万亿个token。其中,8万亿用于预训练,1万亿用于继续训练以提高质量。

BF16精度下,模型的推理需要8块H200,或16块H100/A100 80GB。如果是在FP8精度下,则只需8块H100。

值得一提的是,指令模型的训练是在98%的合成数据上完成的。

而合成数据无疑是Nemotron-4 340B的最大亮点,它有可能彻底改变训练LLM的方式。

合成数据才是未来

面对最新排名,兴奋的网友们突然咂摸出一丝不对劲:

用340B对战70B,而且还是险胜,这事儿有点说不过去吧!

就连机器人Kimi也对此开启了“嘲讽”模式:

英伟达这波操作,参数大得像宇宙,性能却跟Llama-3-70B肩并肩,科技界的”大号小能”啊!

对此,在英伟达负责AI模型对齐和定制的Oleksii Kuchaiev拿出了关键法宝:

是的,Nemotron-4 340B商用友好,支持生成合成数据

高级深度学习研究工程师Somshubra Majumdar对此表示大赞:

你可以用它(免费)生成你想要的所有数据

这一突破性进展,标志着AI行业的一个重要里程碑——

从此,各行各业都无需依赖大量昂贵的真实世界数据集了,用合成数据,就可以创建性能强大的特定领域LLM!

那么,英伟达具体是如何实现的呢?

一句话概括,这与它开源通常不发布的奖励模型有关。

生成高质量合成数据不仅需要优秀的指导模型,还需根据特定需求进行数据筛选。

通常,使用同一模型作为评分者(LLM-as-Judge);但在特定情况下,采用专门的奖励模型(Reward-Model-as-Judge)进行评估更为合适。

而Nemotron-4 340B指令模型可以生成高质量的数据,然后奖励模型可以过滤掉多个属性的数据。

它会根据有用性、正确性、一致性、复杂性和冗长性这5个属性,对响应评分。

另外,研究者可以使用自己的专用数据,再结合HelpSteer2数据集,定制Nemotron-4 340B基础模型,以创建自己的指令或奖励模型。

回到一开头和Llama-3-70B的对战,Nemotron-4 340B拥有更宽松的许可,或许这才是它的真正价值所在。

毕竟数据短缺早已成为业内普遍痛点。

据Epoch研究所的AI研究员Pablo Villalobos预测,到2024年年中,对高质量数据的需求超过供给的可能性为50%,到2026年发生这种情况的可能性为90%。

新的预期显示,这种短缺风险将延迟至2028年。

合成数据才是未来正逐渐成为行业共识……

模型地址: https://huggingface.co/nvidia/Nemotron-4-340B-Instruct

参考链接: [1]https://x.com/abrichr/status/1802510103557382341 [2]https://x.com/omarsar0/status/1802024352851878296 [3]https://x.com/lmsysorg/status/1802836187511713933 [4]https://x.com/reach_vb/status/1801907371507097622

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-06-19,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 量子位 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
NumPy之:NumPy简介教程
NumPy是一个开源的Python库,主要用在数据分析和科学计算,基本上可以把NumPy看做是Python数据计算的基础,因为很多非常优秀的数据分析和机器学习框架底层使用的都是NumPy。比如:Pandas, SciPy, Matplotlib, scikit-learn, scikit-image 等。
程序那些事
2021/04/21
2.2K0
NumPy之:NumPy简介教程
NumPy是一个开源的Python库,主要用在数据分析和科学计算,基本上可以把NumPy看做是Python数据计算的基础,因为很多非常优秀的数据分析和机器学习框架底层使用的都是NumPy。比如:Pandas, SciPy, Matplotlib, scikit-learn, scikit-image 等。
程序员鑫港
2022/01/06
8290
Numpy库
NumPy是一个功能强大的Python库,主要用于对多维数组执行计算。NumPy这个词来源于两个单词-- Numerical和Python。NumPy提供了大量的库函数和操作,可以帮助程序员轻松地进行数值计算。在数据分析和机器学习领域被广泛使用。他有以下几个特点:
用户9615083
2022/12/25
3.8K0
Numpy库
NumPy基础(二)(新手速来!)
NumPy 是一个为 Python 提供高性能向量、矩阵和高维数据结构的科学计算库。它通过 C 和 Fortran 实现,因此用向量和矩阵建立方程并实现数值计算有非常好的性能。NumPy 基本上是所有使用 Python 进行数值计算的框架和包的基础,例如 TensorFlow 和 PyTorch,构建机器学习模型最基础的内容就是学会使用 NumPy 搭建计算过程。
天道Vax的时间宝藏
2021/08/11
1K0
收藏 | Numpy详细教程
NumPy的主要对象是同种元素的多维数组。这是一个所有的元素都是一种类型、通过一个正整数元组索引的元素表格(通常是元素是数字)。在NumPy中维度(dimensions)叫做轴(axes),轴的个数叫做秩(rank)。
Python数据科学
2018/12/25
2.5K0
【机器学习】 搭建模型第一步:你需要预习的NumPy基础都在这了
NumPy 主要的运算对象为同质的多维数组,即由同一类型元素(一般是数字)组成的表格,且所有元素通过正整数元组进行索引。在 NumPy 中,维度 (dimension) 也被称之为轴线(axes)。
竹清
2018/08/31
2.2K0
Numpy应用整理
numpy是python最为常用的库,没有之一,它表示Numeric Python,从名字也可以看出来,它被用来做数值计算,常与scipy配合使用。现在几乎各种应用场合都会用到numpy,主要有以下几个原因:
猫叔Rex
2020/06/28
1.1K0
Python高级数组处理模块numpy用法精要
numpy是Python的高级数组处理扩展库,提供了Python中没有的数组对象,支持N维数组运算、处理大型矩阵、成熟的广播函数库、矢量运算、线性代数、傅里叶变换以及随机数生成等功能,可与C++、FORTRAN等语言无缝结合,树莓派Python v3默认安装就已包含了numpy。 根据Python社区的习惯,首先使用下面的方式来导入numpy模块: >>> import numpy as np (1)生成数组 >>> np.array((1, 2, 3, 4, 5)) #把Python列表转换成数组 ar
Python小屋屋主
2018/04/16
1.6K0
Python:numpy模块最详细的教程
一、numpy简介 numpy官方文档:https://docs.scipy.org/doc/numpy/reference/?v=20190307135750 numpy是Python的一种开源的数
Python学习者
2023/01/04
1.3K0
python中一些数据处理库
Numpy是Python的一个很重要的第三方库,很多其他科学计算的第三方库都是以Numpy为基础建立的。Numpy的一个重要特性是它的数组计算。
用户7886150
2021/01/05
9100
搭建模型第一步:你需要预习的NumPy基础都在这了
NumPy 主要的运算对象为同质的多维数组,即由同一类型元素(一般是数字)组成的表格,且所有元素通过正整数元组进行索引。在 NumPy 中,维度 (dimension) 也被称之为轴线(axes)。
机器之心
2018/07/26
2.3K0
python学习笔记(三)- numpy基础:array及matrix详解
numpy包含两种基本的数据类型:数组(array)和矩阵(matrix)。无论是数组,还是矩阵,都由同种元素组成。
用户7886150
2021/01/02
7710
python的numpy入门简介
arr=np.array(data)    #将列表转为numpy.ndarray  np.array([2,4])
用户7886150
2021/01/07
1.5K0
Numpy 学习笔记
在学习 numpy 之前,你总得在 python 上装上 numpy 吧,安装命令非常简单:
EmoryHuang
2022/10/31
6630
k-近邻算法
从今天开始,与大家分享我学习《Machine Learning In Action》这本书的笔记与心得。我会将源码加以详细的注释,这是我自己学习的一个过程,也是想通过这种方式帮助需要学习的童鞋的一种方式。
卡尔曼和玻尔兹曼谁曼
2019/01/22
7830
python︱numpy、array——高级matrix(替换、重复、格式转换、切片)
版权声明:博主原创文章,微信公众号:素质云笔记,转载请注明来源“素质云博客”,谢谢合作!! https://blog.csdn.net/sinat_26917383/article/details/52290505
悟乙己
2019/05/26
11.7K0
盘一盘 Python 系列 2 - NumPy (下)
重塑 (reshape) 和打平 (ravel, flatten) 这两个操作仅仅只改变数组的维度
用户5753894
2019/07/05
2.6K0
盘一盘 Python 系列 2 - NumPy (下)
Python NumPy ndarray 入门指南
因为这几天做模糊数学和用 Python OpenCV2 都涉及到 NumPy ndarray,搜到的东西都没有写一些自己想要的。于是干脆自己写一篇,方便以后查阅。
用户7886150
2021/01/05
8790
Python 之NumPy
NumPy的主要对象是同质的多维数组。它是一个有明确索引的相同类型的元素组成的表。在NumPy中维度称之为轴,轴数称之为列。
py3study
2020/01/13
6770
Numpy基础操作学习笔记
NumPy:Numerical Python,即数值Python包,是Python进行科学计算的一个基础包,因此要更好理解和掌握Python科学计算包,尤其是pandas,需要先行掌握NumPy库的用法
python与大数据分析
2022/03/11
6820
相关推荐
NumPy之:NumPy简介教程
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档