在业内素有OPENAI摸着石头过河,GLM4摸着OPENAI过河的说法。2024年1月16日智谱发布了ChatGLM4,全面对标GPT4,包括闭源。
智谱展示的GLM4能力在分数上基本达到了90%的GPT4水准。
而在中文能力上,则很大程度上正在超过GPT4.
它甚至还想在图像能力上挑战SDXL和DALL3。
对于广大玩家来说,这应该是最实用的能力之一,因为原生支持中文。
引用一下国内我认为最靠谱的superclue大模型榜单:
结论1:在SuperCLUE-Mat6h基准上,GLM-4综合得分为81.72,表现不俗,刷新国内最好成绩,被评为最高第五等级。
结论2:GLM-4较GPT4低2.14分,较GPT4-1106-Preview低6.04分,还有一定提升空间。
结论3:相比上一代ChatGLM-Turbo,GLM4有29.17分的较大提升,提升幅度为55%。相比第一轮问题,第二轮问题的准确率有一定下降,需要进一步提升。
结论4:GLM-4在深入数学推理方面表现较好,尤其在5步数学推理问题中有超过GPT4的表现。
可以看到的是,相比上一代大家熟悉的GLM3-6B本地开源版本,这个版本的强大真的强到没边了。
特别重要的是,GLM4也支持AGENT,具备了GLMs。
整体来说,根据实测体验,确实比其他都要强上很多。比如它的多模态!
我感觉咱这个公号也马上要换LOGO了。
还有一个比较好的是,智谱清言提供了手机APP、WIN/MACOS应用三种平台,老电脑也能很轻松的使用。
ALL tools应用能力,也是非常值得挖掘的。
还有就是GLM4的API定价也出来了,1块钱1万字,怎么说呢,不能算贵。毕竟你一个月要整个100-200万字,也不太容易。可以接受。
大模型测评
领取专属 10元无门槛券
私享最新 技术干货