天云大数据CEO雷涛在接受记者采访时表示,数据资源的爆发和数据科学的普适性,不仅带来低代码等下一次软件开发效率的技术革新,更是一次对传统产业升级、商业流程重构的创新革命。
如果说互联网打破空间约束,挖掘了空间财富,那么人工智能则是打破时间约束,挖掘时间财富。
1865年,儒勒・凡尔纳( Jules Verne)在书中预测了100多年后将宇航员送往月球的详细情况,但他没有预测到, 登月后的50年内,谷歌(Google),脸书(Facebook),苹果(Apple),亚马逊(Amazon)等公司让我们可以和另一个大陆的伙伴充分交流,熟稔程度超过了隔壁邻居;我们可以坐在家里买卖数千公里之外的公司标的资产,只需要通过交易所的炒股软件;空间的概念不再是笛卡尔坐标系里连续分布的尺度度量,而是“点赞”按钮的热度和几度空间的HOP连接。
可以看到,人工智能帮助人类从电力电气、蒸汽时代到现在多彩纷呈的现代世界。伴随着云计算和开源软件技术的成熟应用,大数据时代的到来,IT开始向DT转型,生态面临重新洗牌,信息产业本身发生了颠覆性变革。
雷涛认为,在过去,人类所有的能力都是在空间维度的展开,从上天入地,到全球贸易,人类在时间维度的能力是极度匮乏的,古代流传至今的星象命理、天文历法,都是为了利用有限的数据集合建模,形成并不太靠谱的通向未来的能力。“只有计算机出现之后,我们才有了预报能力,才能够真正的在时间轴上爬行。”
实际上,从上世纪60年代开始,数学的发展就曾带来第一波对人工智能的探索,由于受限于当时的信息化技术,终未能落地。上世纪80年代人工智能再次兴起,主要体现在对已有的人类行为做出复制,用机器模拟人类的经验,并达到自动化执行。问题是成本很高,商业实践上并不成功。第三次人工智能的浪潮始于2012年,对于神经网络的探索,大举提高了算法和算力。凯文凯利曾预言过未来的12个趋势其中之一便是知化(Cognifying):人类用手的肌肉力量即可开动250马力的汽车,假设将250马力的车转换成250种思想,那么我们开的就不是车,而是自动化的电脑。人类未来的目标,是将智力作为一种服务,可以像电力一样传输。根据雷涛的推测,以后不只是能驾驶250马力的汽车奔跑数百公里,还可以驾驭25000脑力的AI在数万线索维度上的预测。
雷涛表示,以往的商业决策更多基于规则、流程,这些规则往往建立在多年的行业深耕基础上,因而锻造了极强的行业壁垒,但所有复杂的、难以抽象的商业规则和场景,将它们数字化以后,复杂问题反而可以被清晰的界定和量化,算法可以对商业实践做替代,算法构建的商业形态模式,可以打通、重构各行业的商业实践。
谈及当下人工智能最为落地的场景,雷涛认为是对视觉信号和语言持续信号的人机交互的处理,包括面部识别、声音识别等,而人工智能在大型企业中的应用依旧匮乏。在雷涛看来,已经经历或正在经历数字化转型的企业,如何利用已有的数据资源构建数据驱动业务,实现自身升级是重中之重。
首先,企业需要认识数据。雷涛直言,企业需要将传统的基于业务的主数据管理升级而成利用机器学习和知识图谱自动化构建的数据治理结构。不再使用以前业务主题阈导向的人工咨询服务方法,而使用自动化数据治理方法来对数据资产做盘活和量化。以金融为例,通过复杂网络等表示学习,构建金融产品本体的知识图谱,这将为新的商业世界的构建创造诸多可能性。
在融合流动数据资源、处理数据方面,雷涛提出要减少数据冗余与搬家(去ETL),混合布署先进的HTAP架构,融合型数据库同时支持三块业务:交易、分析和数据挖掘,构建全新的数据库基础设施,即混布数据库。
“HTAP混布数据引擎的数据库是在基础能力上做到数据融合和高并发、高性能的支撑大规模数据的计算,并有效地组织现有的数据资源。”雷涛称,企业里已沉淀的和将要采集的数据资源,需要有一套新的数据治理方法,即自动化的数据治理手段。
雷涛坦言,数据治理在以前是非常昂贵的,传统方法都是由人力通过数据字典的方式,一条一条的描述然后拆解,业务流程的复杂性使得各种企业数据在规整时容易出现不统一、不一致等情况。将人工智能用于数据治理,可以将业务的价值从数据的自然的分布、调用以及描述三个维度上做出规整,从而挖掘出数据价值并予以最大化。比如,使用机器学习进行数据建模实现服务应用,AI PaaS使数据资产得到价值挖掘。
雷涛表示,在数据科学工程广度上,天云已形成完备AI中台系列产品,覆盖从特征工程到模型训练再到推理服务;在数据科学工程深度上,天云AI中台产品支持从基础算法的并行化,到模型生命周期管理,模型规划化生产,模型评估,以及自动化机器学习,以及第四代基于知识表达和知识沉淀的模型商店等功能,形成了完备的端到端的AI生产流水线。
“利用核心技术组件在创新性的商业路径上实践,AI沉淀之路才刚刚开始,在这条路径上,千亿市场规模的软件提供商出现指日可待。”雷涛称。
(第一财经)