2019WAIC天云大数据雷涛:AI跨行业赋能大有所为

2019-08-30 17:43:23 作者:佚名 出处 : 互联网

数据资源的爆发和数据科学的普适性,不仅带来低代码:下一次软件开发效率的技术革新,更是一次对传统产业升级、商业流程重构的创新革命。

  ——雷涛在2019上海世界人工智能大会WAIC上如是说

  8月29-31日,全球瞩目的2019世界人工智能大会在沪举行。上海市委书记李强、上海市市长应勇等国内外政要、特斯拉联合创始人Elon Musk、腾讯董事长马化腾、阿里集团创始人马云等国内外人工智能龙头企业代表,包括图灵奖得主在内的顶尖科学家与学者齐聚上海,全球人工智能领域群英荟萃,分享全球AI顶级智慧。

  8月30日下午,国内知名AI基础设施提供商天云大数据亮相本次大会,在“智慧新经济,科创新时代”投融资论坛上,CEO雷涛作为演讲嘉宾分享了前沿观点。

  图:天云大数据CEO雷涛:AI 重构商业实践 跨行业赋能大有所为

  低代码:下一次IT技术革命带来的商业模式创新

  伴随着云计算和开源软件技术的成熟应用、大数据时代的到来,IT开始向DT转型,行业生态面临重新洗牌,信息产业本身发生了颠覆性变革。

  雷涛表示,传统IT的本质是依靠程序员一行行写代码,生产规模与效率受限于程序员的数量,比如说10亿收入的软件企业,至少需要5000个程序员。庞大规模的公司组织形态形成的最终结果就是低人效比。

  据软件行业协会提供的数据显示,长久以来,软件行业的平均人效不到20万,软件开发效率难逃低附加值窠臼,难以符合摩尔定律实现快速提升,陷入低增长模式瓶颈。DT颠覆IT的进程,本质上是生产资料与生产方式的全面革新,程序员被数据替代,传统经验规则流程等通过人力咨询方式获取的程序构建方法,被智能算法替代。

  举例来说,在传统方式下,证券行业交易系统查处漏洞,由行业主要参与者沉淀五年以上经验来制定筛选规则,而天云仅仅使用2周的时间,即用算法快速生成了原来行业专家需要五年经验积累才能形成的筛选规则,带来全新生产模式,即低代码开发方式,整个过程将软件开发效率提升数倍;同时在这短短2周内,就将成功预测异常交易账户的准确率提高到了90%以上。

  低代码开发,使生产代码的主体从人变成了机器,形成了全新商业形态组织,带来最直观的结果就是软件开发效率呈几何数量级增长,比如天云的人效比,从16年的16万提升到25万,再到如今已超过百万。

  将长久以来难逃低附加值窠臼的软件开发效率,从10几万提高到百万级别不可谓不难,雷涛对此总结道,软件开发效率实现规模化增长主要来自于以下两大要素:

  第一,不断扩大的数据资源:信息化系统里沉淀的交易数据、互联网从业人员产生的行为数据、产业互联网带来的机器生产数据迅猛增长。这些不断扩大的数据资源,同时也为积极创新的厂商带来了收入增长的机遇。以天云为例,从Fintech,到医药、军工、能源,天云的泛行业布局主要对象就是机器生产数据,收入数倍的增长均来自于新行业布局的收入;

  第二,算法的普适性:电商利用推荐引擎重构了零售业;传统超市货物摆放的最佳实践,被淘宝的贝叶斯算法取代;天云大数据针对没有图纸的油气管道,无法实现压力差的复杂现实场景,利用隐马尔科夫算法抽象出油气管线泄露的风险,这些都说明算法可以重构商业实践,具有极强的跨行业属性。

  雷涛指出,这是因为以往的商业决策更多基于规则、流程,这些规则往往建立在多年的行业深耕基础上,因而锻造了极强的行业壁垒,但所有复杂的、难以抽象的商业规则和场景,将它们数字化以后,复杂问题反而可以被清晰的界定和量化,算法可以为商业实践提供替代解决方案,算法构建的商业形态模式,可以打通、重构各行业的商业实践。这个过程,即AI PaaS(AI平台即服务),可以成为产业升级、数字化转型的基石。

  图:天云大数据在WAIC上的展位

  数据中台:推动低代码生产方式的变革

  在开源环境下,产业从业者如何保持自己的技术壁垒,是国内技术厂商的发展痛点。在接受记者采访时雷涛提出,数据中台推动了低代码生产方式的变革,在革新之中,核心组件本身的壁垒就会逐渐沉淀在创新技术之中。

  以下为问答实录:

  1、在开源环境下,算法以论文体现,技术是流动与开放的,产业从业者如何保持自己的技术壁垒?

  雷涛:以前大数据平台售卖的是认知,将众多开源组件封装、打包变成可交付的系统化运营环境,如何组织、配置、调度开源组件是大数据公司的核心价值,但只有时间窗口的优势,竞争的技术壁垒必然随着市场的日益成熟而被磨平。

  然而,随着AI带来的商业流程重构,数据成为企业业务系统的核心资产,中国科技厂商开始扮演更关键的角色,很多原来处于边缘的国内创新者找到了核心位置,核心组件本身的技术壁垒已经逐渐沉淀在创新的技术中,比如天云数据中台的三驾马车(ADG自动化数据治理、HTAP数据库Hubble、AI PaaS平台MaximAI),均极具市场竞争优势。

  2、如何认识数据?

  雷涛:将传统的基于业务的主数据管理进行升级,利用机器学习和知识图谱自动化构建数据治理结构。不再使用以前业务主题阈导向的人工咨询服务方法,而使用自动化数据治理方法来对数据资产做盘活和量化。以金融为例,通过复杂网络等表示学习,构建金融产品本体的知识图谱,这将为新的商业世界的构建创造诸多可能性。

  3、如何融合流动数据资源、处理数据?

  雷涛:减少数据冗余与搬家(去ETL),混合布署先进的HTAP架构,融合型数据库同时支持三块业务:交易、分析和数据挖掘,构建了全新的数据库基础设施,即混布数据库(如下图,维基百科定义HTAP数据库,诸如阿里的DRDS、SAP的Hana、天云大数据的Hubble,都是混布数据库的典型代表)

image.png

  4、如何挖掘数据资产价值?

  雷涛:使用机器学习进行数据建模实现服务应用,AI PaaS使数据资产的价值得到挖掘。在数据科学工程广度上,天云已形成完备的AI中台系列产品,覆盖从特征工程到模型训练再到推理服务全链条;在数据科学工程深度上,天云AI中台产品支持从基础算法的并行化,到模型生命周期管理,模型规划化生产,模型评估,以及自动化机器学习,以及第四代基于知识表达和知识沉淀的模型商店等功能,形成了完备的端到端的AI生产流水线。

  对此,雷涛进一步总结道:”天云的三驾马车均构成了小众的技术组件级的应用服务,天云在技术赋能时,既保持了商业模式的前沿创新性,又构建了自身独特的技术壁垒。利用核心技术组件在创新性的商业路径上实践,AI沉淀之路才刚刚开始,在这条路径上,千亿市场规模的软件提供商出现指日可待。”