预测学什么时候是工厂购买电和重要原材料的时机呢?是否可以足够地预测风电场每小时的发电量?这样就知道什么时候该使用备份的燃气发电机。西门子正在开发这种技术,以确定、跟踪并了解这种系统和趋势背后的关键指数,这样就可以大大提高预测结果的性。
休息一下,向窗外眺望一下。看到什么了?看不太清楚的形状——是建筑物还是树木?假如你从来没有见过高楼或者树木,从来没有听说过这些东西,进入视线的可能确实就是令人费解的乱糟糟的东西。现在你看到的不是那种让你费解的东西,这是因为你脑子里已经有一些模型,这些模型将进入你视线的大量数据进行整合,这样,你马上就辨认出这些事物了。
现在,复杂的人工系统也遇到了同样的挑战。但是,我们这里说到的模型要能够识别一些多面的、人类所无法感知的模式。随着它们不断成功,它们成为预测赖以依据的模式。
这的确是行之有效的!现在,西门子正在开发的这种预测技术,能够惊人地抓拍到未来的一些片段,包括从燃气轮机到风电场的发电量、运动模式、系统的维护需求,经济发展的趋势,如原材料价格和股市的走势等。确实,西门子已经通过其神经网络软件环境(SENN)学习体系的预测结果,决定了在德国购买多少电,在范围内采购多少铜。研究员Hans-Georg Zimmermann博士认为,“这是同类产品中的高维度、非线性建模体系”。正是得益于20多年来将数学研究、软件开发和现实世界应用相融合的经验,SENN才能够比其他项目更连贯而且持久地专注于预测学。
Zimmermann曾为预测学的60多个行业应用奠定了数学基础,注册了22个以保护相关软件系统的建筑模型。他还在大学里开办计量金融学讲座,分析为什么神经网络比传统的基于线性逻辑的预测系统更具优势。“神经系统可以应对现实世界应用问题,不管其内在问题是如何非线性或多维度的。另外,神经网络为时间结构建模提供了一个优美的框架,”他说。例如,在近期一项研究中,Zimmermann的团队用SENN和一个线性模型较量,对16种电气控制柜的需求做出预测。两种系统均对全年每个月电气控制柜的销售做出预测。但是SENN考虑了外汇汇率以及自动化系统市场波动等因素。结论是:SENN的平均误差率仅为23.3%(和实际需求相比)——比线性模式的误差要少很多,后者的误差率是52.6%。“这种极为的需求预测可以用来优化供应链,降低成本,”Zimmermann指出。
SENN还能够用来预测风电场的发电量。例如,丹麦的西门子风力公司使用SENN预测一个大型风电场72小时内每小时的发电量。当时,可以参考的天气预报信息只是一个粗糙的网格图,SENN用它来预测当地的电力供应。
“随着风电等可再生能源在总体能源构成中的所占比例不断上升,” Zimmermann说,“不仅要能够预测需求,还要预测供应量。预测很重要,这样我们才能够知道什么时候需要启动备份的燃气发电系统。”在这种想法的驱使下,Zimmermann的团队开发出一种神经网络,它的设计依据是影响风力发电的主要参数。目标就是创造一种软件模型,用数学手段反映现实世界,Zimmermann 说。但是他解释道,最初模型并不知道每个参数的重要性——正是从这里起,从数据中学习的能力就开始发挥了作用。所有系统最初都知道一点,根据训练阶段输入的数值,慢慢地,它要计算出一个最接近风电场真正发电量的数值。
起初,模型计算的结果和实际数据之间的差异很大。但是,慢慢地,学习型运算法则开始不断修正模型中的不同参数,这样预测就越来越接近实际结果了。
系统可以在数以千计的信息往复中衡量错误率,它开始得出的只是随机数据,但是系统逐渐就会确定输入参数的不同权重组合会导致相应的结果。“就像在足球比赛中学习如何射门一样,”Zimmermann说,“你所知道的就是你要把球射入球门。通过一系列的尝试和错误,在上千种可能影响结果的组合情况中,机器慢慢学会如何计算。”
SENN果然正确地预测出风电场的发电量。在预测轮机每天整体电力供应水平(根据标准差计算)时,平均误差现在已经降到7.2%——比最强竞争对手的物理学模型要低整整三个百分点。眼下,研究人员还在为光伏电站研发类似的模型。
量化未知事物。Zimmermann团队同时还为燃气轮机中氮氧化物(NOx)的排放量开发了一种神经网络模型。这种模型可以用来分析各种输入变量和轮机的输出功率的关系。和预测风电场发电量一样,SENN开始只是输入原始数据,并给其指令,让它慢慢计算轮机的实际输出功率。然而,当它认识到变量之间的关系以后,模型的预测越来越接近真实数据,简直像在复制燃气轮机的行为。最终,模型完极为地实时预测轮机的行为。
但是,轮机——或者其他复杂系统——实际涉及到的变量要远比已知的变量更多。Zimmermann指出,“有一些变量是没法测算的,还有一些是我们根本不知道的。”这些隐性的变量会使不确定性加大。“考虑到这一点,” Zimmermann说,“我们已经找出了一种解释不确定性的新答案——即,可见的和隐性的变量之间的互动。”
相比较而言,机械和经济动态体系中测量不确定性的标准做法就是,把模型的预测结果和实际发生的情况之间的偏差归结为风险预期。其内在的假设就是,过去推导出的不确定性模型要能够很好地预测未来的风险。
谁的神经单元最多?蛔虫302个 果蝇100,000个 蟑螂1,000,000个 章鱼300,000,000个 人类100,000,000,000个 大象200,000,000,000个
“但这并不普遍适用于金融界,包括铜和电的价格,”Zimmermann警告说,“这样的话,不确定性可以从现在不断向未来扩散,随着时间的推移,历史上模型的错误会被叠加,这种误差就会变得越来越大。”相反,根据Zimmermann的方案,由于不会明确地重建隐性系统变量,就可以通过分析不同情形的分布,在性预测中量化不确定性。这样,不同情形之间波动的范围就是风险的水平。基于不同情形,若每种情形出现的概率一样,那么相应的概率的平均值计算出的结果就可以被认为是未来最可能的趋势。“因此市场风险的特点就是不同情形之间的差异,” Zimmermann说。他解释说,根据有限的观察,总会有多种方式能够对隐性变量进行重建,这样就会导致对未来的预测出现不同的结果。
西门子已经使用这些方法来决定采购更多的电和铜。“这不单纯是一个关于未来的预测模型,”Zimmermann补充道,“这些方法还可以展示出不同的未来情形并对其做出评估。”
今后几年里,预测学将会如何发展呢?显而易见的是,如果可以参照过去,那我们将得出越来越的预测。Zimmermann指出,不仅仅是SENN模型的认知每天都在增长,在这些模型越来越能真实反映现实的同时,其研发者也在从所产生的各种模型中学到了更多东西。
巨大的潜力。除可以预测能源和原材料的价格,预测风电场发电量和轮机功率外,SENN的潜力巨大,几乎可以预测各种现实应用。它能够辅助做出当代挑战性、最复杂、最昂贵的决策,即,有关公路、航空、水资源以及电力基础设施方面的城市或者区域性投资决策。SENN作为决策支持系统的潜力确实已经在西门子得到了验证,比如在工厂建设前,它被用来计算并决定不同选址方案的长期优势。
芝加哥商品交易所。神经网络软件环境(SENN)帮助西门子选择时机来完成范围内大规模的铜采购
除了这些呢?有关我们和未来之间关系的模型正在开发过程中,在西门子内网上以SENN预测服务器的形式进行展示。这一系统被用于向内部客户介绍SENN的潜能。
再过十年,我们或许就可以将SENN应用程序到监视器上,来了解我们的家庭、车辆、企业以及供应链,对其做出判断并实现功能优化。SENN的未来版本甚至还可能给出不同的方案选择,支持最合理的、个性化的营养、医疗、教育、和理财方式。毕竟,每一个问题都可以在未来的某个角落里找到答案。
“预测学是一场比赛,”Zimmermann说,“比赛的对手是不断复杂的现实世界和我们通过信息技术用数学反映现实的能力。SENN模型就是一个例子,二者正在相互赶超。”