专注于数字技术的商业观察者
登录×
公司
2025-07-10

Cloudera:企业部署AI智能体的底层逻辑,回到数据

时间: 2025-07-10 编辑:

2025年,AI智能体从一个概念热词,迅速成为企业智能化战略中绕不开的主角。生成式AI的广泛普及为Agent的...

2025年,AI智能体从一个概念热词,迅速成为企业智能化战略中绕不开的主角。生成式AI的广泛普及为Agent的发展提供了土壤,而企业对降本增效、业务自动化、决策智能化的现实需求,则推动AI Agent从理念走向落地。

“现在几乎没有一家客户不谈AI智能体。”Cloudera大中华区技术总监刘隶放坦言,自春节以来,AI Agent已成为他与客户对话中最常被提及的词汇。这种现象背后,不仅是技术的跃迁,更是企业对效率提升与流程重塑的强烈期待。

Cloudera大中华区技术总监 刘隶放

其实,Agent的概念并不新鲜。在大语言模型(LLM)尚未普及的早期阶段,Cloudera已在部分客户中探索过基于Agent的业务代理机制。那时的Agent更多依赖传统IT手段,通过规则引擎和交互式逻辑提升流程效率,本质上是流程自动化工具。随着技术演进,尤其是LLM的出现,Agent从“规则执行者”转向“语义理解者”和“流程协同者”,AI Agent由此真正具备了智能化基础。

“LLM的广泛应用不仅推动了生成式AI的成熟,也让AI Agent成为可能,甚至促成了Agentic AI方法论的进一步发展。”刘隶放认为,从本质上讲,LLM提升了Agent对复杂业务的理解与处理能力,使得“代理式智能体”的效率和执行力显著增强,成为企业提升生产效率与流程智能化的关键引擎。也正因此,AI Agent在企业中的热度迅速上升,成为几乎所有客户都在尝试的新方向。

Cloudera最近发布的《企业AI智能体的未来》报告显示,96%的受访企业正在加速部署AI Agent。尤其在中国,71%的企业表示过去在生成式AI上的投入已经为Agent部署打下基础。更重要的是,部署AI Agent的目的已从“探索新技术”转向“获取业务价值”:提升流程效率、增强客户响应、降低人力成本。

不过需要注意的是,关于AI Agent的落地有一个普遍误区:很多企业仍将重心放在“模型大不大、卡够不够、Agent是不是热的”这些表层指标上,而忽略了决定智能体是否可用的真正底层逻辑——数据。

“我们看过很多客户,GPU买了、模型装了,但真正落地时才发现‘巧妇难为无米之炊’。”刘隶放举例说,前不久他拜访了一家制造业客户,对方领导层对AI部署寄予厚望,但由于生产系统(OT)和管理系统(IT)数据割裂,导致缺乏可用于训练和推理的数据,“模型再强也没法发挥作用”。

相反,那些已在数据体系上投入多年、具备成熟数据资产的企业,往往能较早实现Agent的落地应用。例如银行、电商等拥有APP和用户交互系统的企业,已经习惯使用机器人进行前端应答。这类系统背后正是大量数据驱动的流程引擎,如今借助LLM与AI Agent技术,不仅响应更精准,也显著提升了运营效率。

也就是说,数据文化成为决定企业AI智能体成败的关键因素——企业必须先具备数据治理与分析的能力,形成“结构化、可管控、可追溯”的数据体系,否则智能体只能沦为“空中楼阁”。

在Cloudera的实践中,刘隶放的建议是“从简单可控场景入手,逐步推进”: 一是Chatbot类知识问答系统;二是基于IT系统运维的Agent自动化。前者因其模型门槛低、部署快,适合作为企业内部知识图谱的入口;而后者则因运维日志数据丰富、结构清晰,是训练与验证Agent行为的天然土壤。

在AI加速产业化的背景下,Cloudera正持续扩展其平台能力,从传统的数据分析厂商,演进为具备端到端AI能力的企业级平台提供者。刘隶放透露,早在AI热潮兴起之前,Cloudera就推出了CDSW数据科学工作台,为企业提供机器学习模型开发、测试和部署环境。

如今,Cloudera在此基础上构建了更完整的AI平台——Cloudera AI。这一平台不仅整合了CDSW,还引入了LLM DevOps、AI推理服务、低代码开发组件,以及面向AI Agent开发的专属Studio工具。通过模块化、拖拽式界面,企业开发者可以快速完成模型选择、微调、提示词工程、RAG增强、Agent流程编排等关键步骤,并将训练过程全程留痕、可溯源,为持续优化与合规治理提供支持。

此外,Cloudera AI支持企业级部署需求,如模型资源配额分配、多角色协同开发、Kubernetes原生运行环境等,确保模型从训练到生产部署过程中的统一调度与安全管理。平台还与NVIDIA深度合作,集成NIM推理微服务,并与Crew AI协同打造Agent Studio,实现从开源生态到企业应用的闭环连接。

刘隶放强调,Cloudera的目标不是构建“单点AI工具”,而是打造一个联通数据、模型与流程的完整AI平台,将机器学习、LLM能力与企业级Agent部署能力全面贯通,为企业构建可控、可演进的智能化基础设施。

与此同时,在AI Agent逐步走向生产化的进程中,企业对数据安全与治理的要求被推到了前所未有的高度。当前企业使用AI模型——无论是开源还是闭源——都绕不开一个核心问题:如何在可控、可信的环境中进行数据训练与推理。

企业往往需要将通用模型进行微调,以适应自身业务语境,这就必须将企业内部的数据引入模型训练流程中。然而,这一过程中存在诸多风险,包括敏感信息泄露、数据污染、语义偏见甚至政治不当内容的引入。尤其是在高合规行业,企业往往如履薄冰,“头上悬着一把剑”,必须确保每一步训练过程都是安全可追溯的。

为此,Cloudera提出了“全链路可溯源”的模型管理理念,不仅要求对训练数据来源、模型变更过程进行登记记录,还要支持多人协作环境下的角色权限控制和资源配额调度。在一些大型金融客户中,甚至已形成上千人同时协作开发与训练AI模型的作业规模,对平台安全性与可治理性提出极高要求。

这一理念也延伸到了数据平台的底层架构。刘隶放认为,AI智能体对数据调用的能力提出了新挑战:传统的数据仓库架构存在严重的数据孤岛问题,导致模型难以访问全量数据。为解决这一难题,Cloudera依托Iceberg等现代数据湖技术,构建了“湖仓一体”的数据底座,实现了统一的数据接入、元数据管理与治理机制。

“相比把数据分散在多个系统中统一调度,我们更鼓励客户把数据汇聚到一个可以集中处理、可控可追踪的统一平台。”刘隶放表示,这种集中的数据架构不仅降低了AI模型训练与推理的技术门槛,也为智能体在企业全流程应用中提供了坚实基础。

从数据训练到模型调度、从权限管理到资源分配,Cloudera希望通过湖仓一体架构+AI平台化能力,为企业构建一个真正“安全、合规、可持续”的AI智能体运行环境。这不仅是对技术能力的重塑,更是对AI可信体系的一次系统性构建。

尤其是大语言模型在企业中的加速应用,企业对于AI系统的安全性、准确性和可控性也提出了更高的要求。AI落地所面临的最大挑战,就是客户对数据隐私、模型偏差以及结果可信度的顾虑。

在许多企业场景中,95%的准确率听上去已足够优秀,但一旦涉及金融、医疗等高风险行业,这5%的误差可能意味着不可接受的后果。更复杂的是,人们在心理上可以容忍人的错误,却往往难以接受“机器犯错”。这种对完美性的苛求,成为AI智能体部署过程中的文化阻力。

基于此,Cloudera从平台设计上提供了一套完整的应对机制:首先鼓励客户采用可溯源的开源标准,以提升模型训练过程的透明性与可控性;其次,通过低代码工具降低人力与技术门槛,助力企业快速构建符合自身业务语义的模型;同时,Cloudera在平台中构建了封闭可管控的训练环境,配套完善的数据治理与溯源机制,确保训练过程在安全合规范围内可追踪、可验证。

刘隶放特别提醒,企业在部署AI智能体时切忌“头重脚轻”——即聚焦模型功能,却忽略数据底座。 “AI不是凭空产生洞察,它依赖于底层平台长期的数据积累和治理能力。”Cloudera坚持推进湖仓一体架构的现代化演进,将数据的查询效率、安全管控、数据质量提升与AI能力同步融合,为智能体的真实落地提供扎实的基础。

Cloudera也看到,客户的担忧并非阻力,反而是推动AI平台健康发展的动力。“当客户有忧虑,就意味着我们有机会去解决问题。”Cloudera持续通过版本迭代,推出如低代码RAG Studio、AI Studio等组件,降低客户开发门槛,加快从概念验证(POC)到生产部署的转化速度。

一个健康的AI生态,不仅需要强大的技术支持,更离不开客户开放、务实的心态与长期的系统建设。AI智能体的成功落地,不是某个模型的胜利,而是数据平台、开发工具、安全治理与组织机制共同进化的结果。

据了解,在AI智能体的行业应用中,金融与制造无疑是当前进展最为积极的两大领域。以银行为例,AI Agent已在多个场景中实现高ROI,如风险评估、反欺诈检测、保险承保辅助、投资建议生成等。这些任务原本高度依赖人力判断,如今通过Agent辅助,既提高了效率,也降低了出错率。

制造业则在产线优化、预测性维护、供应链管控等方向取得成效。一些头部制造企业已实现IT-OT一体化,使设备数据、质量指标、环境参数实时上传并触发智能响应流程。“比如设备温度异常,AI Agent可自动比对历史异常模式,推送给维修人员。”

不过,即便是头部行业,企业内部也仍面临人才、成本、合规等挑战。“我们这两个月接触了多家制造业客户,几乎每家都新成立了AI部门,负责人普遍很年轻、有工程背景,也具备一定的业务理解力。”刘隶放认为,这一代AI应用推动者,将成为企业智能化落地的核心驱动力。

值得注意的是,生成式AI与代理式AI并非割裂的技术路径,而是一个自然衔接、逐步演进的过程。生成式AI往往聚焦于解决特定任务,例如文本生成、语言理解、代码生成等,强调单点能力的表达;而代理式AI则在此基础上进一步发展,将多个“能力节点”以流程化方式串联起来,形成完整的业务执行链路。

刘隶放以Cloudera客户的典型案例为例,描绘了这一演进路径的实际落地过程。去年,许多客户已开始尝试使用生成式AI进行自然语言转SQL的功能(Text to SQL),用户只需输入一句话,平台便可自动生成标准SQL语句并完成查询。而随着智能体能力的增强,客户希望将这一过程进一步简化——不仅能生成查询语句,还能自动执行、展示结果,实现“从语言输入到结果输出”的闭环交互。

当然,不同企业的推进节奏会有所差异,有的企业选择先打磨前端应用场景,专注于优化与LLM的交互;有的则已开始尝试将多个模型能力以Agent方式整合,并推动业务流程自动化。在他看来,这两条路径并不冲突,而是相辅相成。每一个被LLM解决的“任务节点”,都可以成为智能体中的一个组件,最终通过Agent架构形成更加复杂的业务流和自动化决策网络。

写在最后

面对市场对AI Agent的狂热期待,刘隶放反复强调要保持谨慎乐观。“热情没错,但基础要打牢。否则今天买了AI一体机,明天发现没有数据,最后做不出东西,反而更挫败。”

技术总是在不断演进的,今天是大语言模型,明天可能是图模型。企业应该将更多精力投入到数据治理、知识体系建设与平台化能力培养中,构建一套能支持持续演进的底座。

总的来看,代理式AI所带来的不是一次简单的自动化升级,而是企业系统协同能力的一次重塑。它既考验数据能力,也挑战组织结构,更要求平台化思维与生态整合能力。

只有当AI Agent被嵌入业务血脉,企业智能化的飞跃才会真正到来。

标签:
版权声明:本文版权归数字商业时代所有,未经允许任何单位或个人不得转载,复制或以任何其他方式使用本文全部或部分,侵权必究。