首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

昆仑万维:天工通用大模型推理能力超过GPT-3.5和LLaMA2

北京商报讯(记者 杨月涵)9月16日,昆仑万维发布消息称,在权威推理榜单Benchmark GSM8K 测试中,昆仑万维自研的通用基座大模型天工大模型以80%的正确率脱颖而出,大幅领先GPT-3.5(57.1%)和LLaMA2-70B(56.8%),“标志着天工大模型的推理能力达到全球领先,接近GPT-4”。

消息提到,天工大模型不仅在推理性能上有着强大的竞争力,在MMLU、C-EVAL、HumanEval等三项数据集测试中也同样表现出色。在MMLU数据集测试中,天工大模型以65%准确率超越了LLaMA-65B的63.4%;在C-EVAL数据集测试中,天工大模型以65%准确率超越了GPT3.5的54.4%。在HumanEval数据集测试中,天工大模型以37.2%的准确率超过了PaLM-540B(26.2%)、LLaMA-65B(23.7%)、LLaMa2 -70B(30.5%)。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OCE8D0yyAwcMcqc_MRN5Lbqg0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券