首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

DeepMind给人工智能搞了一套IQ测试

给AI搞了一套IQ测试题。 例如,下面这个问题:请问右下角应该是哪个图案? ? 基于观察、推理能力,一个智能体可以推断出这个问题的答案。...接下来,通过约束生成器可用的因子或组合,就可以创建用于训练和测试模型的不同问题集,看看模型究竟能“聪明”到什么程度。 ? ?...通过实验,DeepMind发现,当模型在测试中能够正确推断出任务背后的抽象概念时,就能产生良好的性能表现——IQ测试正确率可达87%,否则的话,蒙对答案的概率只有32%。...参与测试的模型,表现良好与否取决于一系列因素,而几乎在所有情况下,系统在需要推断超出其经验的输入,或处理完全不熟悉的属性时,表现不佳。 总之,这是一个很有意思的方向。

48550
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    学界 | DeepMind想用IQ测试AI的抽象思维能力,进展还不错

    又比如下边这道简单的IQ测试题。 ? IQ测试给了DeepMind灵感,是不是也能用其测量AI的推理能力呢?...大数据文摘微信公众号后台回复“IQ测试”获得本论文。 要构建更好、更智能的系统,使得神经网络能够处理抽象概念,需要对其进行改进。 此方法的灵感来源于IQ测试。...创建抽象推理数据集 标准的人类智商测试中,通常要求测试者通过应用他们日常经验学习的原则来解释感知上简单的视觉场景。...基于此认知,DeepMind设计一个实验,希望使人类视觉推理测试得到很好的利用。这一研究不是从日常生活到视觉推理问题(如人类测试)的知识转移,而是研究知识从一组受控的视觉推理问题转移到另一组问题。...接下来,DeepMind约束生成器可用的因子或组合,以便创建用于训练和测试模型的不同问题集,以度量模型可以推广到留存的测试集的程度。

    71200

    Linux测试必备

    Linux有三种网络方式:Bridged桥接模式,nat,Host-Only仅主机模式 修改了网络方式需要重启 远程登录工具:xshell,secureCRT,putty logout – 退出 reboot...– 关机 ifconfig – 查看ip 文件上传下载: 工具:Xftp、Filezilla 安装命令:yum install lrzsz -y 命令:rz、sz uname -r –查看内核版本,Linux...这个目录存放着最经常使用的命令,例如cp、mv、ls等 /boot 这里存放的是启动Linux时使用的一些核心文件,包括一些链接文件以及镜像文件。 /dev dev是Device(设备)的缩写。...该目录下存放的是Linux的外部设备,在Linux中访问设备的方式和访问文件的方式是相同的。.../etc 是 Etcetera(等等) 的缩写,这个目录用来存放所有的系统管理所需要的配置文件和子目录 /home 用户的主目录,在Linux中,每个用户都有一个自己的目录,一般该目录名是以用户的账号命名的

    1.6K10

    微软多模态「宇宙」搞定IQ测试,仅16亿参数

    甚至IQ测试也不在话下。 「宇宙」无所不能 Kosmos来源希腊一词cosmos,有「宇宙」之意。 据论文介绍,最新Kosmos-1模型是一个多模态大型语言模型。...研究团队从多角度进行实验来评价KOSMOS-1的性能,包括5大类十项任务: 1 语言任务(语言理解、语言生成、无OCR的文本分类) 2 多模态转移(常识推理) 3 非语言推理(IQ测试) 4 感知-语言任务...KOSMOS-1对HatefulMemes和对Rendered SST-2测试集的准确率均高于优于其他模型。...IQ测试 瑞文智力测试是评估非语言的最常用测试之一。 KOSMOS-1在没有进行微调时准确率比随机选择提高了5.3%,经过微调后则提高了9.3%,表明其具有感知非语言环境中的抽象概念模式的能力。...图像说明 KOSMOS-1在COCO和Flickr30k测试中的零样本性能均表现优秀,相比其他模型,其得分更高,但采用的参数量更小。 在少样本性能测试中,得分随着k值增大有所增加。

    35310
    领券