专注于数字技术的商业观察者
登录×
公司
2020-06-30

Cloudera:无处不在的云体验开源平台

时间: 2020-06-30 编辑:

“从去年与Hortonworks完成合并后,Cloudera的定位和愿景是成为一家企业数据云的公司,包括Cloudera即将...

“从去年与Hortonworks完成合并后,Cloudera的定位和愿景是成为一家企业数据云的公司,包括Cloudera即将推出的下一代产品都是以企业的数据云作为主要方向。” Cloudera大中华区总经理徐晋在接受笔者的采访时表示,Cloudera希望能够赋能于用户把复杂的数据转化成为清晰可行的洞察力,且能够适用于任何云环境或者数据中心,提供数据全生命周期的云原生服务和软件平台。

Cloudera大中华区总经理徐晋

关于数据,几乎全球所有的企业都数字化转型,同样也在寻求转变成为数据驱动类型的企业。尤其是在国内新冠疫情后,企业的数字化转型也进一步提速,在这一过程中,数据的价值日益重要。

在这样一个大的背景下,各行各业在数据方面投入越来越多的资源来实现尽快将企业经营各个环节数字化,以促进整个数字化转型的进程,这也势必使整个企业收集的数据量越来越大。

去年哈佛商学院曾发布一个研究报告数据表明,无论是企业还是政府机关,他们在不同的环境中收集、处理和管理数据。而且,在云环境中,不管是在组织内部,还是在私有云、混合云,还是在多云或者单云,都有大量客户把他们的数据存放在不同的地方进行运维和管理。

此时,带给企业的挑战主要体现体现在两个方面:面对复杂多变的环境,企业要如何正确的收集、管理数据,以及如何形成一个统一的数据战略,做到真正的把数据转化成为真实可见的业务价值。

“对于Cloudera而言,我们是希望从数据安全、管理影子IT、云原生服务、完整的数据周期以及AI五个方面赋能企业客户,”徐晋表示,安全问题是企业上云过程中首要考虑的问题。Cloudera希望客户在任何地方运行其数据资产都能够确保一致的数据的安全性。实现对数据可行进行有效的治理,很大程度上在整个企业范围内能够确保这些数据的安全。

影子IT是Gartner提出来的概念,是指企业员工使用没有经过IT批准的应用程序。很多时候,IT往往在跟随业务需求方面会有一定的迟滞,这造成很多业务部门会自己在外部去采购很多的业务系统,这就会造成很多数据孤岛,对企业实现统一的数据战略形成障碍。

“如何解决好业务部门和IT部门之间不同步的问题,这需要通过诸如云原生数据技术来增加整个IT部门的敏捷来得以解决。”徐晋表示,Cloudera希望赋能客户跨公、私有云的云原生的服务。帮助企业IT能够连接完整的数据生命周期,从边缘计算到经过粗加工、精加工、以及数据科学和AI等能够提供前瞻性预测的端到端的解决方案,为客户提供一致的使用体验。

Cloudera Data Platform(CDP)是Cloudera与Hortonworks合并后推出的全新一代的数据平台产品。它结合了Cloudera原产品CDH以及Hortonworks原产品HDP当中最精华的部分融为一体,。它基本上是基于Apache开源社区的将近30多个开源项目,经过研发、测试、整合后提供的一个可靠的基础的大数据运营环境。

在此基础之上,它还可以提供六方面的能力——数据中心、Data Flow & Streaming,用于数据的采集、Cloudera Data Engineering,做批量数据处理的组件、数据仓库、Operational Database,基于Hbase等一些实时的非结构化的数据库、以及机器学习平台。

值得一提的是,在六大核心能力之上是Cloudera非常独特的数据管理的一层——SDX,即共享数据体验。存放在Cloudera平台上的数据,用户无论是把这些数据用做批量处理还是报表,都会提供统一的数据管理、统一的数据目录、统一数据的安全管控。

除此之外,CDP的特点是可以在运行不同的环境当中,包括企业自己内部的数据中心、私有云环境或者是多云/公有云,可都可以去运行CDP,而且用户的体验也是一致的。

近日,Cloudera发布了CDP的两个最新版本:CDP的public cloud——基于PAAS层,以公有云服务的形式提供。以及 CDP的private cloud,这是Cloudera私有云的产品,主要是部署在企业的数据中心内部。

“Cloudera的私有云版本跟传统方式有些不同,我们会借用容器化的private cloud方式,一次性的去安装CDP的private cloud版本,在设计好环境之后,可以在几分钟之内就可部署好环境。”Cloudera大中华区技术总监刘隶放表示,部署在新的环境里面,用户的安全管控机制是跟DC版本完全一致的,这完全符合Cloudera企业级的客户对数据管控的要求。所以说Cloudera私有云为用户提供了一个上手更快、且真正意义上多租户的版本。

Cloudera大中华区技术总监刘隶放

刘隶放强调,Cloudera会在公有云和私有云平台上,用一种开发模式在两种云上都部署,这样既可以保证产品的开发,又可以保证用户的使用体验。也就是说如果客户有需求,比如从公有云往私有云上面去移自己的应用或者反向去移自己的应用都是可以实现的。

“迈向私有云是基于裸数据中心的数据分析体验的版本,这样在已有的环境上面能够快速去部署,用户的IT或者业务部门可以自动化的去做自主服务。” 刘隶放表示,Cloudera的私有云产品会为客户带来两点改变——企业级的安全性和管控的机制,这是Cloudera在市场生存的重中之重,以及跨云的环境,让用户公有云、私有云,包括私有平台上面得到一致的体验。

写在最后

“Cloudera整个企业数据云在整个市场当中,跟其他一些解决方案不一样的地方。”在徐晋看来,Cloudera的产品可以运行在任何云环境里面,不管是私有云、公有云还是公有云中。其次,Cloudera提供的是全生命周期的平台,并且在整个数据生命周期里面提供了全套的数据安全跟数据治理这方面的功能。更重要的是,Cloudera平台的开放性。

“在Cloudera进入中国这5年之内,可能我们最大的友商就是我们自己的开源的版本。”徐晋表示,接下来Cloudera的各类Apache组件依旧会按照Apache的协议提交到Apache社区,任何对Apache社区的贡献,Cloudera会100%的开源,继续在社区做开源项目的贡献,这也是Cloudera接下来产品发展坚持的最重要元素。

标签:
版权声明:本文版权归数字商业时代所有,未经允许任何单位或个人不得转载,复制或以任何其他方式使用本文全部或部分,侵权必究。