从登月计划到全球市场：一支AI"摇滚乐队"的远征

与月之暗面Kimi B端负责人黄震昕坐下来聊天，很容易先上一堂摇滚乐普及课。

公司的名字取自平克·弗洛伊德的传奇专辑《The Dark Side of the Moon》，会议室都以摇滚乐队命名——上午还在Radiohead开会，下午可能就换到了Beatles。黄震昕当天特意穿了一件印着“Moonshot”的黑色T恤，“Moonshot”是公司的英文名，意思是像登月一样，专门做有挑战性的事。

这种气质几乎渗透在公司的每一个细节里。

这家做出Kimi的AI公司，至今只有300多人。内部团队被称作“特工队”。创始团队早年在清华组建乐队的经历，也让这家公司比起传统互联网企业，更像一支带着明确目标的年轻乐队。

而如今，这支只有300多人的“乐队”，正在试图完成另一场Moonshot。

他们不仅希望与全球顶级大模型同台竞争，还希望借助亚马逊云科技，把中国AI模型真正送进全球企业的核心业务系统。

当下的大模型行业，一边是模型持续迭代、API价格不断波动，另一边则是企业AI落地开始进入深水区。越来越多企业发现，仅仅拥有一个参数规模庞大的模型，并不意味着能够解决真实业务问题。代码、视觉、推理能力割裂，智能体停留在Demo阶段，行业正在从“谁的模型更大”转向“谁能真正创造生产力”。

在这样的背景下，Kimi选择了一条并不算热闹的道路。不做娱乐，不追逐流量，而是将全部资源押注在生产力场景。

“和外界的印象一致，Kimi对生产力场景的执着几乎刻在了产品基因里。”黄震昕透露，C端用户熟悉的PPT生成、深度研究、最近发布的Kimi Work，以及可以同时让多个智能体一起干活的Kimi Agent集群，都在强化这一主线。而在B端，编程和Agent是当前最主要的落地场景。

这种战略定力，来自公司对技术路径的独特判断。过去一年，大模型行业关于Scaling Law能否持续下去的争论此起彼伏，Kimi的态度却异常坚定。“我们非常坚定地相信Scaling Law能持续向前，”黄震昕表示，“我们会一直努力解决里面遇到的任何卡点，包括模型架构层面。”

这种坚定，落在了具体的行动上。很多模型公司会把创新重心放在产品层联合设计、数据清洗和推理优化上，底层架构创新因为难度极大，常常被绕开。Kimi偏偏选择了迎接挑战。黄震昕透露，团队直接在底层模型架构上做突破，比如首次大规模应用Muon二阶优化器，让10T数据发挥出20T的效用，Token效率翻倍，Muon已经被GLM、DeepSeek V4等模型采用；而注意力残差连接，则重新审视深度学习架构的数学本质，把计算效率提升25%，为下一代大模型架构设计提供了新的思路。

另一项开源成果Kimi Linear，更是在长上下文场景中将成本从指数级暴涨压制为线性增长。“我们有自己的‘登月目标’，不会因为底层架构创新极难就绕开，只有在底层实现突破，才能承载更大的模型规模，让智能的上限不断往前推。”

这种技术上的“死磕”，正在让Kimi的模型能力变得有些特别。黄震昕提到了一个关键点：Kimi是一个“All in one”的模型，视觉理解、编程和Agent能力在预训练阶段就已经融合到一起，而不是简单地在外面套一个视觉模块。

这带来的一个杀手级应用是“Visual-to-Code”——把视觉动效直接用代码实现出来。在与字节跳动的Trae合作中上线的Visual Debug功能，则允许程序员直接录屏、截图、圈出bug，模型就能快速修复。“有大量程序员习惯抛张图或录屏让模型去debug，Kimi在这种图片加编程的混合场景上，有非常明显的领先优势。”

B端业务的打法，Kimi有自己的层次感。黄震昕将其总结为三层：模型层，持续打磨以K2.7 Code为代表的最强基础模型；服务层，提供搜索API、PPT API、深度研究API，以及Agent SDK，帮助企业基于Kimi的模型快速构建内部智能体；产品层，则推出了企业版，把C端的能力在安全增强后放到企业环境里，让企业可以直接使用Kimi Agent集群、Kimi Code、Kimi Work等工具。

但黄震昕也很清楚，模型厂商不可能把所有行业应用都自己做完。“企业内还是需要有最后一公里的服务，”在他看来，公司本身会“非常专注在模型上，不会做太重的交付工作”，因此正在积极寻找FDE（前沿部署工程师）合作伙伴，在Kimi的模型基础上给客户做端到端的交付。

与亚马逊云科技的合作，恰好补上了这块拼图。从合作模式来看，双方已经形成了一种立体的协同：在基础设施层，Kimi运行在亚马逊云科技全球数据中心上，获得稳定算力；在服务层，Kimi的多个模型已经登陆Amazon SageMaker，Amazon Bedrock也已经接入了Kimi K2.5等开源模型，未来Kimi正在积极推进接入更多最新模型，让用户无需管理底层设施就能直接调用模型，同时Amazon Bedrock Guardrails的安全能力会自动适用于Kimi，提供有害内容过滤和合规保障；在商业层，Kimi已上架亚马逊云科技Marketplace，直接触达全球数百万活跃企业客户，实现一键使用、按量付费。

“我们主要提供模型，亚马逊云科技是行业专家，有大量客户资源。”黄震昕表示，双方会由亚马逊云科技的解决方案架构师与Kimi团队一起，打造覆盖金融、医疗、制造等垂直行业的联合解决方案，包含基模接入、数据源配置等全套内容。

今年以来，大模型API价格普遍上涨，背后的核心原因是全球算力成本上扬，无论海外还是国内的芯片，都跟不上Token需求的爆发式增长。面对这一趋势，黄震昕的观点很明确：“Kimi一直以来的定位是希望做最高性能的模型，而不是最便宜的模型。”但他同时强调，团队在努力对冲成本影响，给终端用户提升性价比。

对冲的关键手段之一，是一种叫Mooncake的KVCache中心化解耦架构。通俗地说，就是把模型推理过程中可以被复用的部分缓存起来，用户下一次请求时如果命中缓存，就不需要重复计算，成本会大幅下降。黄震昕给出了一个让人印象深刻的数字：在第三方平台OpenRouter上，Kimi原厂的Cache命中率高达92.5%，排名第一。“实际测算，Cache率九十多和七八十相比，成本可能差好几倍。”借助这一优化，Kimi K2.7-code模型的有效输入价格降低了74%。

速度则是另一个正在被高强度优化的维度。黄震昕介绍，最新推出的K2.7-code-highspeed高速版，输出速度约180 Tokens/s，短上下文场景可达260 Tokens/s，已经能做到“十几秒输出200行代码”的极速编程体验。在他看来，虽然算力成本在上涨，但通过Cache优化、推理优化等技术努力，Token的实际成本正在被向下拉。“两股力量在同时做功，”他说，“只要给客户提供了性价比更高、更强的模型，即便价格有波动，整体体验和性价比其实是大幅提升的。

一个值得注意的细节是，对于刚刚上线的亚马逊云科技Marketplace渠道，Kimi会在TPM（每分钟Token配额）上给予重点资源倾斜，以保障其拥有充足稳定的供给。这一策略与当前全球大模型硬件紧缺、供不应求的背景有关，也折射出Kimi对合作渠道的重视。

交流中，黄震昕几次强调，Kimi从成立之初就希望做一家全球公司，“希望所有用户能平权得到AI赋能”。他强调，公司在技术推广、开源和服务上都是全球统一的，“不存在选择问题，Day 1我们就是这么来做的。”

这种全球化基因，在业务数据上已经有所体现。今年以来，Kimi的海外增长非常迅猛，开放平台上聚集了大量海外用户，场景覆盖编程、Agent等。在一些编程工具类平台上，Kimi的调用量一直居高不下。“很多全球领先的编程工具平台，会大量调用我们的模型，去服务他们的C端用户。”黄震昕说，在“能力强且具有一定性价比”这个赛道上，Kimi相当突出。

而在通往全球企业的核心业务流程这条路上，与亚马逊云科技的合作被寄予厚望。黄震昕称之为“飞轮式的合作”：一方面从亚马逊云科技采购全球云基础设施和算力，另一方面借助亚马逊云科技的渠道销售模型服务。虽然之前的爆发式增长期还没有接入亚马逊云科技Marketplace，但现在他期待，“借助亚马逊云科技在海外全球的品牌和合规能力，能让收入迎来一条更好的上升曲线。”

写在最后

回到组织本身，月之暗面的人才策略和它的名字一样充满个性。黄震昕的描述里，这家公司“与其说像一个传统的商业公司，不如说更像一个摇滚乐队”。各个团队向着一个共同的目标紧密协作。这种文化，与创始人在清华时就组建乐队的经历一脉相承。“我们希望每个人都是非常有审美的，做的东西是漂亮的，大家是有个性的。”

在人才招聘上，Kimi对标的是硅谷最顶尖AI公司的标准：招聘最有想法和动手能力的人，让他们去做创新。公司提供给研发人员的是“行业内最高的人均算力和卡数支持”，BD和技术团队里不乏哈佛、斯坦福、康奈尔等名校的毕业生。

“特别是在算法和模型底层研发这一块，”黄震昕说，“越年轻的研发人员，爆发出的创新力越强。”

这种年轻化和高人才密度，加上对底层创新的执着，让Kimi看起来的确不太像传统的软件公司，而更像一支充满探索欲和挑战精神的技术先锋队。黄震昕口中反复出现的“寻找能源转化成智能的最优解”这一愿景，或许正是这支乐队正在谱写的下一乐章。而在全球化与亚马逊云科技的深度绑定中，他们显然希望，这场演奏的听众远不止于一个市场。