前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >读书笔记之《AI3.0—AGI会到来吗?》

读书笔记之《AI3.0—AGI会到来吗?》

作者头像
AIGC部落
发布于 2024-12-05 07:58:24
发布于 2024-12-05 07:58:24
1510
举报
文章被收录于专栏:Dance with GenAIDance with GenAI

《AI 3.0》(Artificial Intelligence: A Guide for Thinking Humans)这本书由梅拉妮·米歇尔所著,深入探讨了人工智能(AI)的发展历程、现状以及未来的可能性。

梅拉妮·米歇尔(Melanie Mitchell),波特兰州立大学计算机科学教授,曾在美国圣塔菲研究所(Santa Fe Institute)和洛斯阿拉莫斯国家实验室(Los Alamos National Laboratory)工作,主要的研究领域为类比推理、复杂系统、遗传算法等。在圣塔菲研究所时,米歇尔主导了复杂系统领域的研究工作,并教授了相关的在线课程。她的在线课程 Introduction to Complexity 已有近30000名学生选修,成为Coursera排名前50位的在线课程之一。

全书分为五个部分,每个部分聚焦于AI的不同方面,核心是AI发展的三个阶段:

AI 1.0(逻辑智能):这个阶段的人工智能主要基于规则和逻辑,它依赖于明确的指令和程序来执行特定的任务。这些系统通常被称为专家系统,它们在特定的领域内模拟专家的决策过程,但缺乏灵活性和适应性。

AI 2.0(计算智能):这个阶段的人工智能以数据驱动和机器学习为核心,特别是深度学习的发展,使得机器能够从大量数据中学习模式,并在诸如图像识别语音识别等任务上取得显著成就。AI 2.0 的系统能够处理更复杂的任务,但仍然局限于它们被训练来执行的特定领域。

AI 3.0 (AGI)是在AI 2.0的基础上,进一步发展,旨在实现更接近人类智能的人工智能系统,这些系统能够更好地理解环境、进行决策,并与人类进行更自然的交互。AI 3.0 强调的是人工智能的自主性、创造性和适应性,以及在更广泛领域内的应用能力。

以下是对每个章节内容的详细总结:

序言:

杰文斯悖论(Jevons paradox):威廉姆·斯坦利·杰文斯(William Stanley Jevons)是19世纪英国的数学家、哲学家和经济学家,现代经济学中的边际效用理论的主要奠基人。在英国工业革命时期,工业大量消耗煤资源并产生了严重的污染,引发了利用技术提高燃煤效率的讨论,但杰文斯的研究表明:烧煤效率越高,耗煤量将会越大。这就是杰文斯悖论:技术进步可以提高自然资源的利用效率,但结果是增加而不是减少人们对这种资源的需求,因为效率的提高会导致生产规模的扩大,这会进一步刺激需要。

工智能在视觉系统上的应用,以及一切所谓深度学习(deep learning)算法,从数学角度上看,无非是使用20世纪七八十年代的多层神经网络(multilayer neural network),通过傅立叶变换来求解对象的特征方程的过程。

人工智能应用ConvNets分为两个过程:第一个过程是猜测对象的特征函数,也就是为对象建模的过程(识别);第二个过程则是根据对象的输入-输出响应序列,进一步调节对象参数的过程,这一过程也是“学习”的内在含义。也就是说,做卷积分析,就是面对一个不知其内部构造如何的对象,通过输入一个已知的函数,观察输出函数,最终给出对目标对象内部构造的一个猜测。

第一部分:若想对未来下注,先要厘清人工智能为何仍然无法超越人类智能

第1章:介绍了AI的起源和早期发展,包括符号AI和亚符号AI的提出,以及早期AI的局限性和遇到的挑战。

一个用于识别手写“8”的感知机的示意图:

第2章:讨论了神经网络和机器学习的发展,特别是深度学习如何成为现代AI的核心技术。

在过去60多年的人工智能研究中,人们围绕符号和亚符号方法的相对优势进行了大量的讨论。符号系统可以由人类设计,被输入人类知识,并使用人类可理解的逻辑推理来解决问题。例如,一个于20世纪70年代早期开发的专家系统“MYCIN”,被给定了大约600条规则,用于帮助内科医生来诊断和治疗血液疾病。设计MYCIN的程序员在与内科医学专家经过辛苦面谈后开发了这些规则。针对一个病人的症状和医学检测结果,MYCIN能够同时对规则进行逻辑推理和概率判断来做出诊断,并能够解释其推理过程。简而言之,MYCIN是符号人工智能的一个典型范例。

相比而言,正如我们所看到的那样,亚符号系统往往难以阐释,并且没人知道如何直接将复杂的人类知识和逻辑编码到这些系统中。亚符号系统似乎更适合那些人类难以定义其中规则的感知任务。例如,你很难写出能够完成识别手写数字、接住棒球或识别你母亲声音等任务的规则,而你基本上是连下意识的思考都没有经过就自动完成了这些事情。正如哲学家安迪·克拉克(Andy Clark)所说,亚符号人工智能系统的本质是“不擅长逻辑,擅长接飞盘”。

第3章:探讨了图灵测试和AI的奇点理论,以及这些理论对AI未来发展的影响。

第二部分:视觉识别:始终是“看”起来容易“做”起来难

第4章:分析了深度学习在视觉识别领域的进展,特别是ConvNets如何改变计算机视觉

视皮层中不同层的神经元检测到的视觉特征简图:

第5章:讲述了ImageNet竞赛如何推动AI视觉识别技术的发展。

第6章:讨论了AI在视觉识别方面与人类视觉的差异,以及AI在这一领域的局限性。

第三部分:游戏与推理:开发具有更接近人类水平的学习和推理能力的机器

第8章:介绍了强化学习在训练机器人方面的应用。

第9章:探讨了AI在玩游戏方面的进展,特别是AlphaGo如何击败人类围棋冠军。

第10章:讨论了AI在游戏领域的成就如何转化为通用AI的潜力。

第四部分:自然语言:让计算机理解它所“阅读”的内容

第11章:探讨了自然语言处理的挑战,包括语音识别和情感分类。

第12章:讨论了机器翻译的进展和挑战,以及AI在理解自然语言方面的局限性。

第13章:分析了虚拟助理如何理解和回应人类的问题。

第五部分:常识——人工智能打破意义障碍的关键

第14章:探讨了AI如何理解和应用常识,以及这对于AI发展的重要性。

第15章:讨论了知识、抽象和类比如何赋予AI核心常识。

人类智能的一个必不可少的方面,是感知并反思自己的思维能力,这也是人工智能领域近来很少讨论的一点,在心理学中,这被称作“元认知”。

自20世纪50年代以来,人工智能的主流方法都隐晦地接受了笛卡儿的这一论点,假设通用人工智能可以通过非实体的程序来实现。但是,有一小部分人工智能研究群体一直主张所谓的具身假说:如果一台机器没有与世界进行交互的实体,那它就无法获得人类水平的智能。这种观点认为:一台放置在桌子上的计算机,甚至是生长在缸中的非实体的大脑,都永远无法获得实现通用智能所需的对概念的理解能力。只有那种既是物化的又在世界中很活跃的机器,才能在其领域中达到人类水平的智能。

结语:提出了6个关键问题,探讨了AI的未来潜力和挑战。

实现足够可靠的、在几乎所有情境下都能自主行驶的完全自动驾驶汽车的技术还不存在,我们也很难预测什么时候这些问题才能被解决,专家们的预测从几年到几十年不等。一句值得记住的格言是:对于一项复杂的技术项目,完成其前90%的工作往往只需要花费10%的时间,而完成最后10%则需要花费90%的时间。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-12-04,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 Dance with GenAI 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
GitHub:图像分割最全资料集锦
https://github.com/mrgloom/awesome-semantic-segmentation
Amusi
2019/03/08
2.2K0
awesome 整理的GitHub项目整理清单(必看!!!)
https://github.com/ChristosChristofidis/awesome-deep-learning
朱晓霞
2019/05/21
2.4K0
FCN、ReSeg、U-Net、ParseNet、DeepMask…你都掌握了吗?一文总结图像分割必备经典模型(一)
 机器之心专栏 本专栏由机器之心SOTA!模型资源站出品,每周日于机器之心公众号持续更新。 本专栏将逐一盘点自然语言处理、计算机视觉等领域下的常见任务,并对在这些任务上取得过 SOTA 的经典模型逐一详解。前往 SOTA!模型资源站(sota.jiqizhixin.com)即可获取本文中包含的模型实现代码、预训练模型及 API 等资源。 本文将分 3 期进行连载,共介绍 19 个在图像分割任务上曾取得 SOTA 的经典模型。 第 1 期:FCN、ReSeg、U-Net、ParseNet、DeepMask、S
机器之心
2023/05/01
1.3K0
FCN、ReSeg、U-Net、ParseNet、DeepMask…你都掌握了吗?一文总结图像分割必备经典模型(一)
【图像分割模型】用BRNN做分割—ReSeg
这是专栏《图像分割模型》的第9篇文章。在这里,我们将共同探索解决分割问题的主流网络结构和设计思想。
用户1508658
2019/07/23
1.1K0
深度学习图语义分割的综述
图像分割是计算机视觉和机器学习领域发展最快的领域之一,包括分类、分类与定位、目标检测、语义分割、实例分割和Panoptic分割。
算法进阶
2023/12/26
7270
深度学习图语义分割的综述
基于深度学习的图像语义分割算法综述
本文翻译自An overview of semantic image segmentation,原作者保留版权。
机器学习算法工程师
2018/07/26
2K0
基于深度学习的图像语义分割算法综述
2019年的语义分割指南
原标题 | A 2019 Guide to Semantic Segmentation
AI科技评论
2019/08/08
9280
2019年的语义分割指南
使用PixelLib来实现图像分割
近年来,计算机视觉快速发展。目前流行的计算机视觉技术如图像分类、目标检测等已被广泛应用于解决许多计算机视觉问题。在图像分类中,对整个图像进行分类。在目标检测中,则是通过检测图像中单个目标的位置来扩展图像分类。
小白学视觉
2022/04/06
6660
使用PixelLib来实现图像分割
图像分割 2020 最新进展
url : https://towardsdatascience.com/image-segmentation-in-2020-756b77fa88fc
LiveVideoStack
2020/10/23
1.1K0
图像分割 2020 最新进展
想学图像分割,强烈建议从这5篇图像分割算法综述
在过去的一年中,计算机视觉领域出现了许多优秀的工作,并推动了相关领域的技术发展与进步。去年上半年,极市曾盘点过计算机视觉领域综述论文,并进行了分类整理,得到了很多读者的支持。因此,在2021年初,我们对2020年出现的全部计算机视觉综述论文进行了分方向梳理,希望能帮助大家学习进步。
AI算法与图像处理
2021/02/05
3.4K0
想学图像分割,强烈建议从这5篇图像分割算法综述
入门 | 一文了解什么是语义分割及常用的语义分割方法有哪些
选自The Gradient 作者:Andy Chen、Chaitanya Asawa 机器之心编译 参与:李诗萌、思源 语义分割是计算机视觉中的基础任务,我们通常会使用基于 CNN 加 CRF 的方法或直接使用对抗性的训练实现端到端的分割。本文简要介绍了这两种方法及它们的特点。 人类是如何描述场景的?我们可能会说「窗户下有一张桌子」,或者「沙发右边有一盏灯」。图像理解的关键在于将一个整体场景分解成几个单独的实体,这也有助于我们推理目标的不同行为。 当然,目标检测方法可以帮助我们绘制某些确定实体的边框,但人
机器之心
2018/06/08
1.4K0
2020入坑图像分割,我该从哪儿入手?
顾名思义,图像分割就是指将图像分割成多个部分。在这个过程中,图像的每个像素点都和目标的种类相关联。图像分割方法主要可分为两种类型:语义分割和实例分割。语义分割会使用相同的类标签标注同一类目标(下图左),而在实例分割中,相似的目标也会使用不同标签进行标注(下图右)。
机器之心
2020/06/02
6080
深度学习500问——Chapter09:图像分割(4)
其中黑色部分为原来的Faster-RCNN,红色部分为在Faster 网络上的修改:
JOYCE_Leo16
2024/05/24
1340
深度学习500问——Chapter09:图像分割(4)
图像分割中的深度学习:U-Net 体系结构
原标题 | Deep Learning for Image Segmentation: U-Net Architecture
AI科技评论
2019/10/10
2.8K0
图像分割中的深度学习:U-Net 体系结构
【图像分割应用】医学图像分割小总结
这是专栏《图像分割应用》的第4篇文章,本专栏主要介绍图像分割在各个领域的应用、难点、技术要求等常见问题。
用户1508658
2019/07/23
2.6K1
【图像分割应用】设备自动化(一)——自动驾驶
这是专栏《图像分割应用》的第5篇文章,本专栏主要介绍图像分割在各个领域的应用、难点、技术要求等常见问题。
用户1508658
2019/07/23
9260
汇总 | 深度学习中图像语义分割基准数据集详解
图像语义分割是计算机视觉最经典的任务之一,早期的图像分割主要有以下几种实现方法。
OpenCV学堂
2019/08/28
2.9K0
汇总 | 深度学习中图像语义分割基准数据集详解
汇总|实时性语义分割算法(共24篇)
语义图像分割是计算机视觉中发展最快的领域之一,有着广泛的应用。在许多领域,如机器人和自动驾驶汽车,语义图像分割是至关重要的,因为它提供了必要的上下文,以采取行动,基于对场景的理解在像素级。
计算机视觉
2020/11/11
1.4K0
汇总|实时性语义分割算法(共24篇)
代码开源 | COCO-16 图像分割冠军:首个全卷积端到端实例分割模型
【新智元导读】清华大学与微软研究院合作,提出了一种新的架构 FCIS,是首个用于图像实例分割任务的全卷积、端到端的解决方案,该架构在 COCO 2016 图像分割竞赛中获得了第一名。论文现被 CVPR 2017 作为 spotlight paper 接收,代码也已开源:https://github.com/msracver/FCIS 继图像分类、物体检测之后,精确到像素级别的物体实例分割就成为更具挑战性和实用性的视觉识别任务。前两个任务在近年来取得了迅速的进展,已经有了不少优雅有效的方法。然而,实例分割任务
新智元
2018/03/28
2K0
代码开源 | COCO-16 图像分割冠军:首个全卷积端到端实例分割模型
语义分割综述
语义分割 (Semantic segmentation) 是指将图像中的每个像素链接到类标签的过程。这些标签可能包括人、车、花、家具等。
计算机视觉
2021/10/11
1.3K0
推荐阅读
相关推荐
GitHub:图像分割最全资料集锦
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档