无论是生物体还是机器,学习都是关键生物的学习系统随处可见,从只有300个左右神经元的低级蛔虫(秀丽隐杆线虫),到有两千亿个神经元的成年大象的大脑,比比皆是。无论是在果蝇、蟑螂、黑猩猩或海豚体内,所有的神经元所做的事情都是一样的:处理并传递信息。所有生物做这些事情的原因也是一致的:避免危险,使物种地生存并繁衍,所有的生物必须能感知环境,并做出相应的反应,记住那些是危险信号,哪些是有益的信号。简言之,无论对单个个体还是整个物种,学习都是其在自然界生存的必要条件。然而,这一铁的规律也越来越适用于人造系统。
Volker Tresp博士是西门子机器研究领域内的资深权威人士,也是慕尼黑大学的电脑科学教授。他说,学习有三种:记忆(如,记住事实的能力)、技能(如,学习如何投球的能力)和抽象能力(如,从大量观察中得出规律的能力)。电脑是个领域内的高手,但目前正在另外两个领域内迅速地赶超。例如,可以毫厘不差地生产出厚度均匀且平整的钢板——西门子20多年来一直在这个领域处于地位。Tresp说,“在这里,最简单的模式就是先给出预测,然后去检验产出品是否符合规格要。求。如,首先明确对钢板产成品的要求,自动轧钢厂结合传感器提供的数据(成分、带钢温度等),在已有信息的基础上,估算所需的压力。根据产出品数据相应地进行实时调整,最终慢慢地算出正确的压力,并产出符合厚度要求的钢板。“以神经网络为基础的学习系统中,” Tresp解释,“可以通过调整影响既定参数(如厚度)的全部因素的权重矩阵来实现这种调节的目标。”
除记忆和改进技能的能力外,人造系统正逐渐被用来进行概括或抽象个体的特点,以此来判断它是否属于某一个群体。光学字符识别(OCR)就是一个例子,它以前是用来高速扫描并分拣信件的。该技术约在1985年初次面世,与那时相比,现在其度已经有了惊人的提高,识别范围也已从单个数字提高到95%以上手写拉丁字母及90%以上阿拉伯语手写体。其实,早在2007年,西门子ARTread学习系统就曾经荣获文档分析与识别国际会议组织的阿拉伯语光学字符识别(OCR)比赛名。由于光学字符识别技术的高度可靠性,它已经开始被逐渐应用到诸如车牌自动识别和工业视觉中(如需了解更多信息,请参阅第67页)。
机器学习能力将会如何发展呢?显而易见的是,随着感应器在能源和数字方面的大规模应用,可以很容易地通过本地和信息网络获得更多数据,机器学习发展的前景十分广阔。网络环境下的学习应用主要体现在两个大型项目中。个是Theseus项目,西门子主导MEDICO技术,该项目主要是从图像和文本中提取语义信息,促成各种新的应用程序来改善医生的工作流程。第二个项目是欧盟的大规模知识加速器项目(LarKC),研发可伸缩查询、推理能力和键连资料的机器学习方法。“能够和键连资料一起学习,” Tresp说,“这才是今天最令人激动的地方!”
Arthur F. Pease
以神经系统为基础的学习体系(1)基于输入的信息(2)根据为期14天的培训对未来7天的气体需求做出预测(3)。
学习通过对部分学习(5)和完全训练(6)的随机权重组合(4)在三个片段中得到反映。
以神经网络为基础的系统有能力处理大量的输入数据,并调整最终的输出成果。为实现这一点,这种系统必须建立起一种数学模型来复制现实世界中相应的实物。这种模型本质上是一种决策单元的集合。从整体角度来看,可以通过矩阵形式来反映决策单元。取决于应用程序的复杂程度,可能要求数百个互动矩阵。
起初,决策单元之间的互动是随机的。那么,当系统开始进入学习阶段,其错误率——预期和实际观察到的结果之间的差异——很高(4)。和真实的结果相比较后,错误率会被反馈到每个矩阵中(箭头向右指向每个方框),然后就开始调整每个决策单元在内部的权重,避免随机出现,并根据已学到的信息去修正每个输入参数(箭头从每个方框指向左侧)。
每次这样的往复都在不断减少错误率,,在上千次这样的信息往复以后,系统就慢慢学会了如何描述完整的输入信息流,结果就是完全复制(6)——并最终预测——现实世界的行为。