我根据Google提供的Gemini的技术报告中的案例,跟GPT4做了一部分的对比实验,我的结果表明,Gemini能做到的GPT4也可以。
下面所有的图片顺序是先Gemini,后GPT4。另外GPT4不能处理视频和音频,另外也不能生成同时包含文字和图片的输出,所以这部分不比较。
第一个,读图,推理和数学。
GPT4也可以做的出来,结果也一点儿没错。
第二个,读图,公式生成,代码生成,以及推理。
ChatGPT做到了大部分,如果多尝试几次应该可以完美实现。
第三个,图标理解和推理
GPT4完美实现
第四个,图像识别
GPT4也没问题
第五个,图像理解和推理
GPT4回答正确
第六个,数学题
完全没问题
第七个,信息搜集也没差别
第八个,多语言模式下的常识推理
我觉得GPT4回答的好,还有中文
第九个,复杂的图像理解,代码生成和指令跟随
GPT4代码看起来没问题
结果渲染出来也完全正确
总结,我觉得就Gemini Ultra在报告中展示的案例,能够比较的部分,GPT4完全不输。不过Gemini宣称自己是原生多模态,可能在其他类型的数据上有过人之处吧。
领取专属 10元无门槛券
私享最新 技术干货