专注于数字技术的商业观察者
登录×
科技
2025-01-07

生态圈:AI企业级应用的最后一公里

时间: 2025-01-07 编辑:

自从ChatGPT能够自如地与人类实现自然语言对话以来,人工智能已经从一项IT技术迅速成为全人类共同的“朋...

自从ChatGPT能够自如地与人类实现自然语言对话以来,人工智能已经从一项IT技术迅速成为全人类共同的“朋友”:不仅可以陪你练外语,还能替你写论文、为你规划旅行行程,甚至成为你的私人司机(自动驾驶)……似乎在这个时代,只要人类需要,那么AI就能代替人类做任何事情——在2C的领域,也许的确如此;但是在2B的领域,要想实现对AI的全面深入应用,显然还有很多难题需要解决。

事实上,任何的IT从技术研究领域到应用于产业,都需要经历一个完整且长期的落地过程;对于Ai而言,更是如此。与个人用户对AI算法和模型标准化需求比较低相比,AI的企业级应用更强调业务深度和行业专业性,其应用不仅受限于数据质量和行业间数据共享壁垒等纯技术性问题、数据隐私等伦理性问题,而且由于企业级应用需要更高的技术定制化能力,因此对于那些想要率先尝试在自身业务中应用AI的各个行业的领导者,遇到的最大问题是如何用更低的成本实现AI技术与自身应用场景的匹配。

“微软专注于大模型的质量、多模态的输出。但是我们都知道,当大模型应用到企业或最终客户时,会涉及到很多的工程学问题,例如需要通过开发将大模型整合到企业现有应用——这可以说是AI应用于企业的最后一公里——我们正在通过建立自己的生态圈来解决这样的问题:减少开发周期,降低开发难度和成本,迅速提高企业用户的体验。”田灼,微软大中华区副总裁、数字原生事业部总经理日前在谈到微软与声网的合作时强调,解决企业级AI应用,也许需要以一种更开放的心态去构建一个足够广泛的生态圈,才能真正解决相关企业AI应用过程中的成本、场景和用户体验等问题。在一个生态环境中,不同的企业各司其职,彼此明确各自的优势和强项,通过合作互补共同服务企业用户,才能真正做到以更小的成本解决所有可能出现的问题:“声网和微软专注的领域不同,我们的合作基础是互补的:最终我们交付给行业的,是一个针对不同行业应用场景的完美的AI应用解决方案。”

要建立一个以IT技术为主导的生态圈,首先需要一个强而有力的技术核心。作为全球最大的软件公司之一,微软对于AI技术研发的投入,以及其对于AI技术应用路径的不断探索,是其构建这样一个AI应用生态圈的基础。

从1991年成立研究院开始,微软事实上就已经开始涉足对于自然语言处理、机器学习和计算机视觉等领域的技术研发。虽然其1997年发布的Clippy智能助手,在市场上得到的反馈褒贬不一,但也的确是也是AI应用于具体产品的最早尝试。微软对AI的持续投入在10年后有了产品化的表现:2017年,微软在Azure云平台中加入AI工具包,帮助企业构建定制化AI解决方案,从而开启了其企业级AI应用的序幕。此后的2019年,微软更是直接投资OpenAI,与其建立战略合作关系,并且在2021年联合推出Azure OpenAI服务,将GPT模型能力引入企业级应用场景。此后,微软在一边持续加强AI技术研发创新的同时,一边努力尝试AI技术的产品化,并于2022年推出了AI驱动的Copilot功能,在2023年推出了Turing Bletchley多模态模型,支持对文本、图像、视频和音频的联合理解……应该说,作为全球最大的软件公司,微软对于AI技术的投入涵盖了从基础研究到行业应用的全链条布局。

而作为微软AI生态体系中的一员,声网是一家成立于2014年的实时音视频(RTC)技术服务提供商,其通过其自研的全球分布式实时通信网络(SD-RTN™),为开发者和企业提供低延迟、高可靠的音视频解决方案,支持在线教育、游戏直播、视频会议、社交娱乐等多种场景。“我们公司的愿景,就是让实时互动像空气和水一样,无处不在。我们希望实时互动能够随时进行,就像面对面交流一样自然:看得见、听得清。我们希望将业务扩展到各个方面,满足任何时间、设备和网络环境下的实时互动需求,同时成本不能过高。”刘斌,声网首席运营官如是说。经过十年的发展,目前声网已服务全球200多个国家和地区的客户。

应该说,与微软专注于AI技术研发和产品化相比,声网从本质上就更贴近用户的场景需求,更确切地说,是对用户在实时互动方面的需求,更专业、更垂直,也更深入。这事实上也是构建一个良性生态圈必备的另一条铁律:所有的参与者都需要是不同领域的领导者、领先者,这才能保证彼此的合作是对等且高效的。

“本质上,我们之间的合作是一种刚需驱动的合作模式。”田灼说:“因为我们的很多刚需类客户,他们原来可能需要分别找我们两家公司,再将API接口整合起来。但是这样以来,会因为我们两家公司的开发规范不一致,导致后续的应用存在很大的麻烦。既然如此,那么就不如我们之间直接合作,把完全无缝整合好的产品交付给客户,把客户的两个刚需结合在一起——包括SDK的整合就是这个目的。”显然,从某种意义上说,微软和声网的合作,事实上反应的是AI企业级应用不断深入各种业务场景的动态过程。

“声网和微软的共同使命,是将更好的针对性方案推广到B端客户。”刘斌认为,声网与微软的合作之所以能够为客户产生价值,“是因为我们的结合体验,足够优秀”。他强调说:从声网的角度看,沟通是人的基本需求,而音频和视频是沟通的重要组成部分。“我们多年积累在音频和视频领域的基本能力积累,使得目前大家突然发现我们与AI的关系非常深入:语音技术看似简单,但是稍微了解或者进入行业的人会知道,这方面的技术难度相当高。因此,如果没有长期积累,很难实现高质量的语音交互体验。例如一个会议屏想要把与会者的发言,让远端听清,就需要从采集、传输、播放全流程的技术保障,即使AI能力再强,如果没有深入的技术能力配合,在实际应用中依然会出现工程上的差距。而我们,恰好在这个位置有一些技术、知识和经验的积累。”

“微软和声网是两家专注于技术领域的公司,深耕的技术能力维度不同但又同时互补。 ”田灼说,微软与声网的合作始于双方的技术互补,因此在不断进阶的合作过程中,才能真正以更低的成本满足不同类型企业的各种应用场景,最终技术和商业层面,实现某种创新和突破。

而双方基于AI与RTC技术的跨界融合,不仅将AI技术引入了实时交互应用,为传统通信工具注入智能基因,而且事实上双方联合推出的工具包和集成解决方案,也有效降低了AI应用的技术门槛,让更多的中小企业和开发者能够以更低成本、更高效率地开发AI驱动的创新应用,从而推动技术的广泛普及,因此其价值不仅仅是带来了技术层面合作的模式,更重要的是通过双档的技术整合与资源共享,尝试了一种推进AI企业级应用模式的可能性。

“随着我们合作的不断深化,现有企业得以逐步优化,开发周期也相应缩短。我们非常期待与更多像声网这样的科技公司建立合作关系,并且在合作过程中发掘更多的合作契机:因为每个企业在其专注的领域内都有所建树,微软也一直在倡导成长型思维,鼓励不断学习和进步。我们希望建立一个生态的世界观,即每个人或企业都应专注于自己的优势领域,并与微软一起,全力以赴地为企业用户的各种业务需求提供解决方案。”田灼说:微软构建这样个生态圈最大的价值,就是能够让企业级AI应用解决方案可以变得更加完善,“通过与互补性强且关系紧密的技术合作伙伴,共同探讨创新点,实现共同进步——无论是微软的SaaS、PaaS服务,还是其他基于大模型的服务,我们都能碰撞出创新的火花。”

无论如何,从技术到应用,微软和声网正在尝试解决AI企业级应用的成本和应用场景这样“最后一公里”难题。畅想一下:也许未来的某一天,无论是怎样类型的企业提出的怎样的AI应用场景,都能够从这样的生态圈中迅速找到答案——就像今天针对个人用户的AI应用一样——而那一天,才真正有理由被称为“AI企业级应用”元年。

标签:
版权声明:本文版权归数字商业时代所有,未经允许任何单位或个人不得转载,复制或以任何其他方式使用本文全部或部分,侵权必究。