专注于数字技术的商业观察者
登录×
公司
2024-04-08

亚马逊云科技:铺就大模型到落地应用的坦途

时间: 2024-04-08 编辑:

2024年3月28日,亚马逊宣布完成对Anthropic 40亿美元的投资,这一次紧紧抓住了Anthropic! Anthropic成...

2024年3月28日,亚马逊宣布完成对Anthropic 40亿美元的投资,这一次紧紧抓住了Anthropic!

Anthropic成立于2021年,在短短几年时间里,Anthropic始终保持着快速的产品更新速度,从最初的Claude1到当前被称为“地标最强大模型”的Claude3仅仅花了一年多。

值得一提的是,在推出下一代模型Claude3的第一时间,Anthropic就已经完成了在Amazon Bedrock平台上的发布,并做出长期承诺,将通过Amazon Bedrock为世界各地的亚马逊云科技的客户提供访问其下一代基础模型的能力。

“生成式AI从产品的发布到现在已有一年多的时间,我们在合作中有一个深刻的体会:行各业的场景千变万化,即使大模型的技术能力再强,也不会有一个基础模型能适用所有业务场景。”亚马逊云科技大中华区产品部总经理陈晓建日前在接受笔者的采访时表示,基于这样的一个基础,亚马逊云科技在生成式AI领域为客户提供了三层架构:底层提供基础算力,包括英伟达最新推出的G200芯片、用于训练的Amazon Trainium芯片、以及推理芯片Amazon Inferentia和用于训练和推理的平台Amazon Sagemaker;中间层以Amazon Bedrock为代表,通过一个模型平台支持多种技术大模型;在应用层则是推出Amazon Q,并实现与亚马逊云科技的多个产品的有效结合,例如与智能商务服务Amazon QuickSight和Amazon Connect结合,以及与编程开发平台Amazon CodeWhisperer结合。通过这三层架构,不同的客户可以根据需求选择不同层级的产品来支持他们的业务。

据了解,Anthropic在Amazon Bedrock上提供的Claude 3系列模型是全球最领先的大模型之一,共包含三个模型:具有几乎即时响应能力且最紧凑的 Claude 3 Haiku;在技能与速度之间达到理想平衡的 Claude 3 Sonnet;以及为处理高度复杂任务设计的最智能模型 Claude 3 Opus。客户可以根据自己的商业需求,从中选择最合适的智能、速度和价格组合。

从产品的角度来看,Claude 3现已具备多模态能力——经过专门训练,它们非常擅长理解图片、图表、图形、技术图解及光学字符识别 (OCR);评估显示,Claude 3模型在图像输入能力方面与前沿模型相当,并且Claude 3 Haiku的速度优于所有能力相当的前沿模型。

另外,Claude 3模型兼具低延迟和强大的功能,在需要处理大量图像、图表、报告和其他视觉资产的企业用例中表现出色。与此同时Claude 3还能够降低幻觉,在处理挑战性开放问题(100Q Hard)上准确性明显提升,并且减少错误答案。

更重要的是,Claude 3系列模型均提供200K 超长上下文准确召回,此外针对某些特殊场景,会开放支持 1M token的上下文窗口;大海捞针(Needle In A Haystack, NIAH) 召回率表现优异;甚至还能识别出测试本身的局限,比如发现某“目标”句子明显是后来人为添加进原始文本的。

假如我们向Claude提出一个问题:“旧金山太鼓道馆的招牌是什么?”,Claude 2.1 会给出一个错误的答案,而Cladue 3 在给出一些介绍后,表示自己并不知道答案。

“在大部分业务场景中,幻觉的产生是非常难以避免的,可能与数据、模型结构以及训练算法有关,这在业界是一个非常普遍的问题。”陈晓建强调,任何一个客户希望将他的大模型能力与自身业务相结合,都不愿意见到幻觉的存在。Anthropic做了非常多的努力,相较于之前的模型,在最新的Claude3模型已经取得了非常大的进步。

从应用场景来看,Claude3“文能”实现内容续写,模仿小说家古龙的风格,基于 “月朗星稀” 续写小说;“武能” 代码辅助,提供详细了步骤的代码步骤,帮助程序员在服务管理平台Nacos中正确修改配置。在电商领域,其也能够根据商品的模特展示图精准捕捉产品细节,生成更准确的产品描述。

当前,亚马逊已经将大模型融入到自身业务中,推出了基于 GenAI的专业购物助理 Rufus,它能够基于人的习惯,通过自然语言实现个人自然交互的同时,背后建立一个基于亚马逊电商的完整庞大的知识库,通过这个能力,能够跟客户进行全方位的自然语言沟通。

“从模型能力到真正的运营生产之间,企业还需要增加很多辅助能力。Amazon Bedrock提供一系列广泛的能力,例如预置吞吐量功能以保障业务拥有稳定独享的底层资源,模型微调能够将自身的业务数据与大模型快速进行结合,以及能够全面监管大模型的Guardrails功能等,这些工程化的能力是企业在真正上生产环境时一定会需要的。”在陈晓建看来,大模型与业务结合必须要有非常强的数据基石——Data Foundation,也就是说,数据基石与大模型的能力同等重要。

为了消除一些复杂、重复的工作,亚马逊云科技在 Amazon Bedrock中 推出了 Knowledge Bases for Amazon Bedrock,即企业的知识库。

“大模型的能力是非常惊艳的,但是要把大模型的能力和客户业务相结合,必不可少的是要能够把自己内部业务知识和大模型结合在一起。”陈晓建透露,Knowledge Bases可以提供全方位的托管支持,大大降低了用户通过去把自己内部的私有数据和大模型结合,建立一个企业内部知识库所做的所有工作。同时,借助 Amazon Bedrock 知识库,客户可以在托管式服务中将 FM 连接到数据来源,从而实现检索增强生成(RAG),进一步提升 FM 本已十分强大的功能,更加了解企业自身的具体领域和组织。从 Amazon Bedrock 知识库检索到的所有信息均附有引文,可提高透明度并最大限度地减少幻觉。

代理功能 Agents for Amazon Bedrock使生成式 AI 应用能够使用自然语言来执行多步骤的业务任务。代理功能会使用基础模型的推理功能分解问题,并通过分步骤的方式解决用户提出的问题。Agent会利用推理功能将这个需求分解并逐步执行。

此外,Agent能够访问组织的企业系统、流程、知识库以及一些基础构建模块,进而制定出解决问题的逻辑步骤,确定调用哪些API以及调用时机,确保事务按照正确顺序完成。如果需要用户输入特定信息,Agent会主动询问,用自然语言获取所需的附加细节。最重要的是,Agent始终利用最新的信息,并在保证安全与隐私的前提下为用户提供解决方案。

除了功能之外,任何人都会关心整个大模型背后所需要的隐私性和安全性,为此亚马逊云科技提出了Responsible AI,承诺在提供所有生成式人工智能服务的背后,一定会做负责任的AI。

例如,推出加速实现负责任AI的Guardrails for Amazon Bedrock,可以允许客户根据应用程序特定要求和负责任的AI策略来管理用户体验。构建适合其应用场景且符合其安全和隐私要求的生成式人工智能应用程序,能够为Amazon Bedrock上的多种基础模型和代理提供保护;根据用户设置的负责任AI策略来配置有害内容过滤器;能够通过简短的自然语言描述来定义并拒绝生成被禁止的话题;能够在基础模型的回复结果中屏幕个人隐私数据。

在安全合规方面,Amazon Bedrock是基于全面的数据保护和隐私保护构建的,传输中数据和静态数据都会被加密,数据不会与模型提供者共享,也不会用于改进基础模型。Amazon Bedrock提供全面的监控和日志记录功能,为治理和审计需求提供支持。符合包括 ISO、SOC、CSA STAR 2级在内的常见合规标准,符合 HIPAA 资格,客户可以在符合 GDPR 的情况下使用 Amazon Bedrock。

“尽管大模型非常重要,但仅靠大模型对你的生产是远远不够的,企业需要一系列周边的能力来正确、合理、安全、高效地使用大模型,这就是亚马逊云科技一系列产品所提供的价值所在。”陈晓建如是说。

标签:
版权声明:本文版权归数字商业时代所有,未经允许任何单位或个人不得转载,复制或以任何其他方式使用本文全部或部分,侵权必究。