近期,IDC的一项报告显示:由AI驱动的智能决策将事后分析转变为事前的预判和主动的执行,能够大大提高企业的生产力和运营效率。到2025年,超过60%的中国企业将把人类专业知识与人工智能、机器学习、NLP和模式识别相结合,做智能预测与决策,以增强整个企业的远见卓识,并使员工的工作效率和生产力提高25%。
AI市场的高速成长,客观地反映出企业用户对于AI关注点的进步:他们更希望通过AI技术手段,充分实现数据的分析和价值发掘,与业务相结合,从而实现让数据真正发挥价值,最终完成其“数字”应用的完整流程。
AI是一个很热的话题,但对于现阶段企业客户而言,有四个具体问题是需要面对的:第一,必须贴近业务,AI分析需要实时数据处理的能力,并对业务实时支撑;第二,如何基于大数据平台搭建AI,从而可以快速做出决策;第三,如何让AI更便捷化、可视化,可以直接用于仪表盘,通过界面、报表展现,让业务人员简单明了地获取结果;第四,AI核心的领域逐渐从金融、交易防欺诈、反洗钱,走向汽车、物流、航空等传统行业,需要更多的业务、开发模型,以满足企业不同部门和业务场景的需求。
Cloudera大中华区区域副总裁王刚
“面对变局,企业数据策略也当应时而变,不仅需具备安全性、可靠性等长期要求的能力,还必须持续提升弹性和灵活性,从而轻松实现共享和各种自助功能,为企业提供一个涵盖所有数据的通用元数据、安全和治理模式。” Cloudera大中华区区域副总裁王刚在接受笔者的采访时表示,对于企业而言,无论数据位于何处,企业都能将其送到需要的人手中,以构建数据驱动的未来,才是解决问题的根本和基础。
事实上,作为一家大数据和AI解决方案提供商,Cloudera对解决以上四个问题,有一个相对清晰的技术和产品逻辑:首先,要内置一个预制好的开发模型,通过鼠标点击选用合适的模型,加快开发速度;其次,平台上的AI机器学习,能够提供多样化的工具,不同工具之间的组合,可以帮助企业适应不同部门之间的业务需求;最后,AI机器学习必须是交互式应用,让业务部门更容易接受AI在实际业务工作中落地的过程。
基于这样一个技术逻辑,Cloudera的现代化混合数据平台Cloudera Data Platform(CDP)为人工智能、机器学习提供了良好的运营环境: Cloudera的CDP平台支持多云混合云的的部署方式,企业可以根据自身的业务需求,选择合适的部署方式;与此同时,整个机器学习从数据的收集到展现、预测,和业务结合的过程中用到很多工具,也会产生很多的安全问题。如何保证数据在长链条中的安全问题,让合适的人看到数据,且满足数据合规,数据治理的要求,需要一个平台的支撑。CDP功能之一SDX(安全治理平台),可以帮助企业从端到端,从最初收集数据,到把数据和业务结合的生产过程,整全部满足数据安全和治理的要求。此外,为保证企业内部不同部门之间对数据的分析发掘,CDP将流程界面协同一体化,满足不同的使用人群。
大数据平台越来越复杂,同时有一些特性:它一定是分布式,可以多云部署,通过数据集成,数据管理,把所有的组件黏合,高度的自动化,又满足安全和合规的要求。这是Gartner对于未来数据生态系统的描述,与Cloudera的CDP定位不谋而合。
“现在基于CDP平台,就可把Gartner描述的未来生态系统的要求全都实现,这很难做到,是Cloudera很大的一个优势。”王刚举例补充说,数据全生命周期管理在数据行业是一个很长的链条,从数据的收集、流通管理,到数据的规则标准化,数据清洗整理入仓,在数据仓库里生成报表,输出到业务部门,最后通过人工智能和机器学习,对生产和运营做出预测,CDP平台可以支撑全链条的管理。
王刚强调,Cloudera大数据平台从端到端的各个环节都有各种各样的组件,来实现数据收集、分析、整理。“从数据的本质来讲,把大数据平台延伸到AI最后一个环节是顺理成章的事情,我们有了数据之后才可以做AI,如果没有数据,没法对一些算法进行数据的学习、训练,你是做不到的,这方面来讲,我们有天然的优势。”
值得一提的是,在数据行业绕不过去数据架构的几个核心概念:数据网格、数据编织和湖仓一体。
Cloudera的解决方案也是紧跟数据架构的理念:CDP平台可以支持数据网格,DataMesh,展现的数据让很多业务部门即时即用,这些数据可能更多的面对最终用户,比如CEO、CIO、CDO等;在数据编织方面,Cloudera有专门的工具,可以帮助企业收集各种类型的数据,无论是流数据、实时数据、远端数据、机器数据等;湖仓一体方面,数据类型变得多样化,除了传统的文本数据,还有大量的原数据、非结构化数据,比如音频、视频、文档,这些数据跟结构化的数据都要混合在一起,进行综合的分析。Cloudera的CDP有很强的湖仓一体的功能,可以满足各种各样数据湖的管理。
写在最后
ChatGPT出现,重新激发了大家对于AI的热情,更重要的是,其对整个AI行业的发展提供了很好的借鉴:AI商业化落地的关键需要降低使用门槛,同时保持与业务之间的互动性,这很重要。
Cloudera提供了很强的技术能力,让不同行业使用场景AI的落地变成可能:Cloudera选择与生态合作伙伴合作研究,跟客户碰撞,拉近技术与业务之间鸿沟;此外,Cloudera与咨询公司合作,通过他们对行业积累的方法论,例如在国外很多AI已经成功落地的项目经验,进行分享,这些使用场景很大层面上是可以相通的,客户可以结合自己的实际情况去探讨和碰撞。
从技术层面来讲,机器学习AI平台的搭建已相对简单,它不像以前那么高深,不是一堆算法,写程序,写代码,现在有很强的互动性,通过拖拉拽的方式很快的可以搭建。
“Cloudera可以提供足够强的技术和合作生态服务保证客户AI成功落地的‘最后一公里’。”王刚强调,Cloudera很少做整个交钥匙工程,比如金融行业的风控系统、合规系统,这部分一定要借助于广大的合作伙伴,他们更了解行业中的场景,如何利用数字化、AI完成转型。“Cloudera的定位是数据平台解决方案提供商,而不是延伸到应用端的服务商,作为纯技术型的公司,Cloudera希望通过与中国的合作伙伴,把技术应用在不同的行业中,结合他们对行业的理解,把最后一公里交付给客户。”