首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

人工智能(3)

Supervised Learning with TLUs

Supervised Learning (监督式学习):

在给定的一系列 n 维的向量(vector),每个向量都有对应的标签(label)。相应地,在设计这样一个boundary following的机器人的时候,n维的向量,可能是探测器的输入的值或者来自探测器的一些特征。标签可能是机器人要走的方向。

一直都在讲supervised learning, supervised 不难理解,训练集都是有明确的标签,每次训练的过程都是向着给的标准结果靠拢的一个过程。Learning如何解释?learning或者说“学习”,其实就是计算一个函数或者模型,使得结果越来越符合训练集中的成员,或者说,训练就是使函数或者模型满足训练集中的尽可能多的成员。今天我们想要一起探讨的是一组线性权重的函数,就是阈值逻辑单元。

再回到boundary following的小车的问题,固然,我们可以通过上次所说的根据8个传感器的值进行组合和变换,得出小车应该走的方向,这样的一个方式其实没有用到AI的过程,只是靠人的智慧和经验去总结的一套规律,然后赋予计算机去执行。那如果用AI的方式去处理,应该怎么做?或者说怎么让计算机或者程序自己总结规律,具有处理这样的问题的能力呢?

答案是“learning”,让计算机不断地纠正自己,直到适应整个训练集。回到小车的问题,小车可以选择向东南西北四个方向行走,到底需要在什么情况下往这四个方向走?这次我们不去总结规律,只把一些“现象”告诉计算机,让计算机根据这些“现象”去学习,这些现象其实就是训练集。以向南走为例,8个传感器的数据,对应是(1)否(0)向南走。

0, 0, 0, 0, 1, 0, 0, 0, 1

0, 0, 0, 1, 0, 0, 0, 0, 1

0, 0, 0, 0, 0, 0, 0, 0, 0

0, 0, 0, 0, 1, 1, 0, 0, 0

0, 0, 0, 0, 1, 0, 1, 0, 0

0, 0, 0, 1, 1, 1, 0, 0, 0

0, 0, 0, 1, 1, 0, 1, 0, 0

以上面的数据为例,前两种情况下,小车需要向南走,注意:每一行是一个vector,前8位分别是西北,北,东北,,,西,这8个方向,最后一位表示是否向南行走,1表示肯定,0表示否定。这已经是一组训练集,准确的讲就是向南走的训练集。说到训练集和“现象”,其实中间还有一个步骤,就是encode(编码)。比如说,我们没有把东南西北四个方向,标记为1,2,3,4。而是,每一个方向单独考虑,用0或者1来表示否与是。同样,包括八个探测器的值也都是用0或者1来表示,这是经常用的表示方式。

说完了learning,一起来看一下TLU。

Threshold Logic Unit 又叫做perceptron (感知器)。

x1,,,xn 是一个vector中的数据,w1 ,,wn 是每一个值的权重,分别相乘求和之和,与阈值比较。一般规定,如果大于等于阈值,输出1,反之输出0. 值得注意的是,一个行动可能对应一个TLU,或者感知器。而,比较复杂的系统,可能需要一组的TLU来完成,这样的一组TLU,就是通常所说的neural network (神经网络)。

至此,了解了TLU包含n个输入,以及与之相乘的权重,然后减去阈值θ,这样的话,不妨把 -θ看成第n+1项,输入是1,权重是 – θ,这样话,训练这样的一个TLU,其实最终我们想知道的就是n+1个权重值。回到boundary following的小车,每一个方向我们都可以训练一个perceptron,这样四个方向就相当于四个感知器,然后根据感知器的输入,分别输入到这四个感知器中,预测是否往哪个方向移动。

在实际的应用中,为了得到权重的值,会采用一种错误纠正(error-correction)的过程来不断优化权重值。权重值一开始被初始化,然后经过这一个过程:

W = w + c (d -f) x,

C 是学习率(learning rate),d 是标签,f 是实际的TLU的输出。

不难看出,学习率,权重的初始化值都会影响权重值的更新过程。其实,训练集的顺序也会对这样的过程产生影响。

这次就是这些,下次一起探讨一下学习中的遗传编程过程(Genetic Programming)。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180923G0H52N00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券