人工智能的发展,迄今为止已攀上了第三次高峰时段。前两次人工智能的发展高峰时段分别在20世纪50年代、20世纪80年代,科学家能感受到,人工智能技术将会改变世界,但仍然还止步在梦想阶段。
但这次人工智能的发展高峰时段与过往大大的不同。首先,深度学习变成了我们解决许多具体问题的十分强大的工具。次之,我们具备了强大的算力,无论是云上的计算还是端上的计算,芯片的计算能力都比以往强大得多。再次,我们积累了大量的数据,这些数据为我们解决问题、发掘价值创造了许多有利条件。最后,我们看到了越来越多真正在改变世界的应用诞生,这些成功案列包括搜索引擎、刷脸支付、智慧停车、电商搜索推荐等,其背后都拥有 大量的人工智能技术的支持。
人工智能技术在如今,有个典型的应用场景——城市大脑(城市智能计算)。今天,我们要从一个新的角度去了解一下它,这个角度便是“数字平行世界:城市智能4D智能推演”。
1、城市大脑的运行机制
有个段子是这样说的:世界上最遥远的距离是什么?两人坐在一起彼此不说话,看自己的手机。实际上,另外还有一个距离更遥远,那便是城市里的监控摄像头和交通信号灯之间的“距离”。监控摄像头“看”到了城市的所有的车辆、行人、路况变化,但它从来没有“告诉”过交通信号灯该怎么调节交通,才可以最大化通行的效率。我们总是有这样的经历:明明前方路口是没有车的,但我们不得不停下来等交通信号灯,耗费了许多通行的资源。
当然这只不过是一个例子,我们的城市中,有大量的数据没有被充分的连接,更遑论被充分运用起来。城市大脑的核心任务便是在今天强大的算力支持下,去发掘这些数据的价值,给城市的治理、城市的经济发展、城市的安全防护等方面带来更高效、更有生命力的改变。
在“城市大脑”出现之前,城市数据治理存有“盲人摸象”“灯下黑”“雾里看花”等误区。“盲人摸象”指的是城市里边已经存有了大量的数据,如卡口的数据、地磁的数据、GPS的数据等,尤其是信息量最大的“视频数据”没有被充分运用起来。“灯下黑”指的是我们已经安装了许多监控摄像头、拍到了许多画面,但没有对这些视频进行智能分析。“雾里看花”指的是我们没有去分析这些数据其背后的规律、发掘数据其背后的价值,不在意数据其背后的关联、数据形成的原因等逻辑,这造成 许多问题并不能获得有效的解决。
2、数字化平行世界
把上述工作放到一个四维的场景中去演练。我们通过无人机把城市的局部数据进行三维空间建模,这个建模与视频信息的时间轴叠加,就能构成四维场景。人工智能技术能够自动分析监控录像的监控摄像头角度,把监控录像所覆盖的场景复原到三维空间建模中去,这样就可以把视频能见到的信息、动态的变化与三维模型有机结合在一起,我们对整个场景就能有一个完整的、动态的、在四维时空下的真实复原,进而作出整体分析。
以广场集会管理为例,我们可以直观地见到数据:广场上的人群是怎样分布的、人群密度是怎样变化的。如果碰到人群密度过大的状况能够立即实施管理控制,管理控制的效果通过视频的数据分析,又可以作出查验认证。与此同时,现实空间里的诱导屏还能够给人群提供引导信息,如引导人们从哪一个出口离场最高效。
以道路交通事故处理为例,我们对城市的道路进行四维建模,能够看清楚车辆在哪个车道,如果发生了车辆剐蹭等事故,这两个车道的道路通行能力便会降至0,要怎样解决这种状况,交通指示灯怎样调整、是否实行开放公交车道给普通车辆通行?这一系列的信息在四维的时空下都能够进行演练和优化,我们可以最快地作出决策缓解交通的拥堵。
总的来说,视觉理解从二维迈向三维,再加上时间轴以后,我们对轨迹的跟踪就从三维迈向了四维,这是一个相当大的突破。它不仅仅是一个场景展示,而且可以把各类信息串连在一起,既直观,又有助于作出完整、全面的分析演练。
3、索引城市
当我们把城市数据的所有目标放进搜索引擎构建高效的索引之后,就可以按照自身的需求寻找所需要的数据。以交通规律发掘为例,可以实现按照整个城市或关键地区的整体流量和当前的流量,分析预测一段时间之后的流量,并充分考虑交通事故、天气、事件等因素,预演未来一小时车流量误差值可以控制在6%以内,自动事件事故检测结果也会被用在交通预测模型。
深度学习方法加上图计算方法,二者结合可以用在构建交通预测模型。我们可以把许多流量的点连接成一张图,在时间轴上,就可以得到多张数据连接成的图。随着时间的变化,图在发生变化。通过这种方式构建深度学习的模型,就能估算下个时刻的流量是多少。
在具体的应用案例中,构建实时车流预测模型,预测未来1小时内路口处各方向的车流量,准确度在93%以上。构建实时车流人流统一预测模型,预测未来1小时内外部路口处各方向车流量、停车场停车位使用率、商场各地区人流量,准确度均在90%以上,基于预测控制停车场闸机,停车位均衡度可提高30%。
城市视觉智能引擎如同一把“照妖镜”,能从治理数据直观反映城市治理成果是否得到提高。现如今,杭州人的通行时间平均减少了15%左右,特种车(如救护车、消防车等)的通行时间平均降低了50%。
城市视觉智能引擎(CityVisualIntelligenceEngine)依托于阿里云分布式计算和储存平台,运用先进的视频图像、图形学处理技术和深度学习算法,创建城市级人工智能模型,实现对整个城市视觉数据(枪机、球机等监控摄像头数据以及遥感、卫星、无人机收集的图像数据)的连接、计算、分析、索引和挖掘,并赋能公共安全、交通、市政综治、商业、司法、园区、电力能源、医疗教育等不同行业场景。城市视觉智能引擎可以打通并连接分布在城市不同单元的视觉数据资源,让图像、视频协助城市来做思索、决策和运营,进而整体性提升城市运转效率。