12月2-4日,BEYOND国际科技创新博览会于澳门威尼斯人酒店重磅举行。作为2021年度亚太地区最具影响力的科技博览会之一,本次大会邀请到了众多行业专家学者与意见领袖畅谈创新未来。
大会同期举办多场主题论坛,涵盖元宇宙、绿色经济、智慧医疗、人工智能等多个领域,为企业、产品、资本和产业提供全方位融合互动的平台,促进亚太地区甚至全球科技创新行业的发展。人工智能创新论坛是BEYOND EXPO大会的重点活动之一。北高峰资本及坤湛科技创始人兼CEO闵万里在论坛中发表演讲了《人工智能到产业之路-认知与行动》的主题演讲。
以下为北高峰资本及昆湛科技创始人兼CEO闵万里的演讲部分节选内容:
闵万里首先提问:“当我们有了很强的计算力,有了很强的硬件和软件的一体化之后,究竟能做一些什么样的事情,创造什么样的价值?”他理解为认知和行动。“认知是两个层面的,第一个就是它能够拓展什么样的认知能力,第二点就是现在大家都知道人工智能可以做很多事情,但是知道人工智能不能干什么事可能更重要。这在我们做投资也好,或者做创业的时候,更加清晰的知道有所为有所不为。”
这张图是在同一个场景下拍摄,左边这张图是典型的城市的交通,右边的图能看到救护车和信号灯,因为信号灯是红灯,救护车要左转是不能实现的,那为什么信号灯前面有那么多的摄像头,看见救护车但是信号灯还是红灯,也没有把前面的车清空,让救护车早一点走,这是一个典型的场景。救护车要鸣笛才能闯过去,所以有没有可能让信号灯像摄像头一样感知到救护车的存在,知道救护车想要左转,提前把它变绿,把前面的车给清掉,救护车就可以自由的畅行的左转。
这一场景的背后其实需要做一串的动作,需要在摄像头里面把每一辆车精准的捕捉出来,把行驶的动线实时的算出来。这就相当于知道城市每一个路口此时此刻有多少车在行驶,大概就可以推断出救护车可能要经过的路口大概是什么样的情况,在未来的30分钟里面,可以提前的通知信号灯的控制系统,告诉他在几点几分几秒钟在什么方向把它变绿,把车辆清空,它的难度是空前的,它的价值就是让救护车行驶时间减少一半。这就是典型的把人工智能从认知到行动之间全方位地串联在一起,这背后要有很强的计算力,然后还要很好的算法,把数据精炼出来,最后可以超越人类的智慧。
计算力+数据是循环增殖的永动力,他表示,今天在工厂生产线上,也存在巨大的机会。生产线本身是一个天然数据密集的场景,很多个传感器24小时不间断地在采集数据,当这些数据被按照生产流程串联在一起的时候,就会有通过数据重组整个生产的流程的可能,这就是数字化孪生。在数字化孪生基础上,加上数据,计算力,处理能力,算法和人工智能,就有可能预测出有一个介入的动作,会引起什么样的反应。
从城市交通到管道网络,再到生产流程,甚至到手机塔台之间,他们其实都在拓扑上被统一起来,这一种数学结构几乎可以概括人类在人类社会当中所有的身体行为。今天的人工智能和拓普结构有一个非常惊人的相似之处,就是都是在讲网络。
“如果我们把一个网络给它抽象出来,日复一日年复一年的在采集在流行上面动态的数据流,有了超强的计算力,就有可能从数据流去反向推理动力学特征。流行从数学定义上来讲,要刻画一个流行,需要讲它的切空间、切向量空间。闵万里用一个简化的模型去描述在流行上面怎么找信号的关键路径以及它的传递的强度,从而判断在哪个节点上去介入精准性好,误伤又小。”
如果把它放在宏观当中,他用制造工厂举例,“左边是个制造业的工厂,生产的是太阳能电池片,然后如果把它的生产流程分解一下之后,然后就会发现说它还是一个流程,在流水线上每一个岗位上都有波动性,最后工人要做质量把控。把它抽象成HMM。有了网络需要强化的就是因果关系。知道的因果关系之后,在一个生产流程当中,可以精准的去做协同控制,使得最后的良品率会变好。对于工业生产来说,就可以降本增效提质。”
随后他深入讲解了脑神经元网络在纳米尺度的信号传递量子效应,“我们如今讲了很多次深度神经网络,卷积神经网络,但是从来没有人真正的解析我们人脑的网络究竟是怎么运作的,人脑是上百亿个神经元组成的一个超大型的网络。网络结构里面,每个神经元之间都在不断的放电,有信号在产生。假定我们观测到了非常多信号和响应信号,有没有可能对人脑的工作机理,尤其是信号的认知传递做解析。我们现在讨论的是一个上百亿个神经元组成的大脑,神经网络本源机理是每一个神经元要在细胞放电,可能引起周边的另外一个也放电,这样信号就传递过去了。上亿个神经元,如果每一个都看到这样的时间序列,最后有没有可能发现谁是起源,谁是从属,从属的衰减强度是多少?如果这件事情搞清楚之后,我今天有非常多和认知相关的疾病是有可能解决的。如果把它抽象为一个数学问题,每一个节点都观察到的信号,就会得到节点和节点之间的一个方程,其实讲的全部是数学。在没有计算机的年代,数学家们已经写出了公式来,只是今天有人用的计算机把公式给验证出来。上亿维度的矩阵是无法求解的,但好处就是矩阵当中有很多的0,这样矩阵就变得非常容易求解。怎么样找到0,从而简化整个的计算过程,今天的人工智能算法都正在求解。”
他表示AI芯片的终极考研在于计算能源成本,人脑有上千亿个神经元,工作效率非常高,能够识别很多东西,人脑的能耗是每秒钟大概20瓦左右,但是如果训练Google的自然语言模型Bert,能耗是是500万瓦,这两个数字完全不成比例,所以这里面就存在一个巨大的问题,为什么现有的架构能耗是人脑的上万倍,但是能力还没有人脑这么强,一定是有地方搞错了或者说有需要改进的地方。一个是数据结构,一个是算法。有人已经把深度学习过去10年和传统的机器学习来比,深度学习随着数据量的增加是越来越越准确,但是有个巨大的成本问题,就是耗能特别高。如果参数太多,说明模型本身是可以在简化的。硬件层面,Google和英伟达,他们也在推出自己的解法,也推出了TPU等等。第三种是机械化学习,有可能把复杂度降低,成本降低。目前已经有人把人脑的生物学的神经网络里的神经元和人工智能当中所用到的神经网络里面的神经元,做功能性的模仿和对比。最后大家发现5~8层的卷积神经网络才模拟出一个人脑的神经元。马斯克创立的Neuralink,就是将极小的电级植入大脑,利用电流让电脑和脑细胞“互动”,它是有可能实现的。
回到信号灯的场景,比如在无人驾驶过程中摄像头看到地上画了左转的线,但是旁边的标识是禁止左转,那么该不该转?这就是基本的问题没有解决。为什么5~8层的卷积神经网络能够识别这么多准确的标识,但是到最后遇到矛盾的场景,他无法决策,就是今天的人工智能所用的卷积神经网络,跟我们人脑的人的神经元之间的认知,有一个天差地别的机理上的差别。但是如果哪天无人驾驶的车能够挑战这样的场景,基本上那是真正的从认知到行动的一气呵成,但到目前为止还很难看到有这样的一辆车存在。
闵万里最后总结,人工智能最底层的原理就是人脑怎么工作,人脑的神经元是怎样协同调节控制,然后从机理上去解题,从100年前的公式到今天我们要把硬件软件做到更加节能,跟人脑可比拟, 有可能倒逼着整个学术界和工业界去独辟蹊径,而不是在不断地增加神经网络的层次上做工程性的叠加,这样才有可能真正的把人工智能的多模态识别、决策,带到一种真正的可实用的层面,现今讲的所有的智能全部是来自于历史,最终什么东西能走到未来去,不是CPU,不是GPU,也不是神经网络,一定是数学公式,所以万物归本,还是以数来推理。