与月之暗面Kimi B端负责人黄震昕坐下来聊天,很容易先上一堂摇滚乐普及课。
公司的名字取自平克·弗洛伊德的传奇专辑《The Dark Side of the Moon》,会议室都以摇滚乐队命名——上午还在Radiohead开会,下午可能就换到了Beatles。黄震昕当天特意穿了一件印着“Moonshot”的黑色T恤,“Moonshot”是公司的英文名,意思是像登月一样,专门做有挑战性的事。
这种气质几乎渗透在公司的每一个细节里。
这家做出Kimi的AI公司,至今只有300多人。内部团队被称作“特工队”。创始团队早年在清华组建乐队的经历,也让这家公司比起传统互联网企业,更像一支带着明确目标的年轻乐队。
而如今,这支只有300多人的“乐队”,正在试图完成另一场Moonshot。
他们不仅希望与全球顶级大模型同台竞争,还希望借助亚马逊云科技,把中国AI模型真正送进全球企业的核心业务系统。
当下的大模型行业,一边是模型持续迭代、API价格不断波动,另一边则是企业AI落地开始进入深水区。越来越多企业发现,仅仅拥有一个参数规模庞大的模型,并不意味着能够解决真实业务问题。代码、视觉、推理能力割裂,智能体停留在Demo阶段,行业正在从“谁的模型更大”转向“谁能真正创造生产力”。
在这样的背景下,Kimi选择了一条并不算热闹的道路。不做娱乐,不追逐流量,而是将全部资源押注在生产力场景。
“和外界的印象一致,Kimi对生产力场景的执着几乎刻在了产品基因里。”黄震昕透露,C端用户熟悉的PPT生成、深度研究、最近发布的Kimi Work,以及可以同时让多个智能体一起干活的Kimi Agent集群,都在强化这一主线。而在B端,编程和Agent是当前最主要的落地场景。
这种战略定力,来自公司对技术路径的独特判断。过去一年,大模型行业关于Scaling Law能否持续下去的争论此起彼伏,Kimi的态度却异常坚定。“我们非常坚定地相信Scaling Law能持续向前,”黄震昕表示,“我们会一直努力解决里面遇到的任何卡点,包括模型架构层面。”
这种坚定,落在了具体的行动上。很多模型公司会把创新重心放在产品层联合设计、数据清洗和推理优化上,底层架构创新因为难度极大,常常被绕开。Kimi偏偏选择了迎接挑战。黄震昕透露,团队直接在底层模型架构上做突破,比如首次大规模应用Muon二阶优化器,让10T数据发挥出20T的效用,Token效率翻倍,Muon已经被GLM、DeepSeek V4等模型采用;而注意力残差连接,则重新审视深度学习架构的数学本质,把计算效率提升25%,为下一代大模型架构设计提供了新的思路。
另一项开源成果Kimi Linear,更是在长上下文场景中将成本从指数级暴涨压制为线性增长。“我们有自己的‘登月目标’,不会因为底层架构创新极难就绕开,只有在底层实现突破,才能承载更大的模型规模,让智能的上限不断往前推。”
这种技术上的“死磕”,正在让Kimi的模型能力变得有些特别。黄震昕提到了一个关键点:Kimi是一个“All in one”的模型,视觉理解、编程和Agent能力在预训练阶段就已经融合到一起,而不是简单地在外面套一个视觉模块。
这带来的一个杀手级应用是“Visual-to-Code”——把视觉动效直接用代码实现出来。在与字节跳动的Trae合作中上线的Visual Debug功能,则允许程序员直接录屏、截图、圈出bug,模型就能快速修复。“有大量程序员习惯抛张图或录屏让模型去debug,Kimi在这种图片加编程的混合场景上,有非常明显的领先优势。”
B端业务的打法,Kimi有自己的层次感。黄震昕将其总结为三层:模型层,持续打磨以K2.7 Code为代表的最强基础模型;服务层,提供搜索API、PPT API、深度研究API,以及Agent SDK,帮助企业基于Kimi的模型快速构建内部智能体;产品层,则推出了企业版,把C端的能力在安全增强后放到企业环境里,让企业可以直接使用Kimi Agent集群、Kimi Code、Kimi Work等工具。
但黄震昕也很清楚,模型厂商不可能把所有行业应用都自己做完。“企业内还是需要有最后一公里的服务,”在他看来,公司本身会“非常专注在模型上,不会做太重的交付工作”,因此正在积极寻找FDE(前沿部署工程师)合作伙伴,在Kimi的模型基础上给客户做端到端的交付。
与亚马逊云科技的合作,恰好补上了这块拼图。从合作模式来看,双方已经形成了一种立体的协同:在基础设施层,Kimi运行在亚马逊云科技全球数据中心上,获得稳定算力;在服务层,Kimi的多个模型已经登陆Amazon SageMaker,Amazon Bedrock也已经接入了Kimi K2.5等开源模型,未来Kimi正在积极推进接入更多最新模型,让用户无需管理底层设施就能直接调用模型,同时Amazon Bedrock Guardrails的安全能力会自动适用于Kimi,提供有害内容过滤和合规保障;在商业层,Kimi已上架亚马逊云科技Marketplace,直接触达全球数百万活跃企业客户,实现一键使用、按量付费。
“我们主要提供模型,亚马逊云科技是行业专家,有大量客户资源。”黄震昕表示,双方会由亚马逊云科技的解决方案架构师与Kimi团队一起,打造覆盖金融、医疗、制造等垂直行业的联合解决方案,包含基模接入、数据源配置等全套内容。
今年以来,大模型API价格普遍上涨,背后的核心原因是全球算力成本上扬,无论海外还是国内的芯片,都跟不上Token需求的爆发式增长。面对这一趋势,黄震昕的观点很明确:“Kimi一直以来的定位是希望做最高性能的模型,而不是最便宜的模型。”但他同时强调,团队在努力对冲成本影响,给终端用户提升性价比。
对冲的关键手段之一,是一种叫Mooncake的KVCache中心化解耦架构。通俗地说,就是把模型推理过程中可以被复用的部分缓存起来,用户下一次请求时如果命中缓存,就不需要重复计算,成本会大幅下降。黄震昕给出了一个让人印象深刻的数字:在第三方平台OpenRouter上,Kimi原厂的Cache命中率高达92.5%,排名第一。“实际测算,Cache率九十多和七八十相比,成本可能差好几倍。”借助这一优化,Kimi K2.7-code模型的有效输入价格降低了74%。
速度则是另一个正在被高强度优化的维度。黄震昕介绍,最新推出的K2.7-code-highspeed高速版,输出速度约180 Tokens/s,短上下文场景可达260 Tokens/s,已经能做到“十几秒输出200行代码”的极速编程体验。在他看来,虽然算力成本在上涨,但通过Cache优化、推理优化等技术努力,Token的实际成本正在被向下拉。“两股力量在同时做功,”他说,“只要给客户提供了性价比更高、更强的模型,即便价格有波动,整体体验和性价比其实是大幅提升的。
一个值得注意的细节是,对于刚刚上线的亚马逊云科技Marketplace渠道,Kimi会在TPM(每分钟Token配额)上给予重点资源倾斜,以保障其拥有充足稳定的供给。这一策略与当前全球大模型硬件紧缺、供不应求的背景有关,也折射出Kimi对合作渠道的重视。
交流中,黄震昕几次强调,Kimi从成立之初就希望做一家全球公司,“希望所有用户能平权得到AI赋能”。他强调,公司在技术推广、开源和服务上都是全球统一的,“不存在选择问题,Day 1我们就是这么来做的。”
这种全球化基因,在业务数据上已经有所体现。今年以来,Kimi的海外增长非常迅猛,开放平台上聚集了大量海外用户,场景覆盖编程、Agent等。在一些编程工具类平台上,Kimi的调用量一直居高不下。“很多全球领先的编程工具平台,会大量调用我们的模型,去服务他们的C端用户。”黄震昕说,在“能力强且具有一定性价比”这个赛道上,Kimi相当突出。
而在通往全球企业的核心业务流程这条路上,与亚马逊云科技的合作被寄予厚望。黄震昕称之为“飞轮式的合作”:一方面从亚马逊云科技采购全球云基础设施和算力,另一方面借助亚马逊云科技的渠道销售模型服务。虽然之前的爆发式增长期还没有接入亚马逊云科技Marketplace,但现在他期待,“借助亚马逊云科技在海外全球的品牌和合规能力,能让收入迎来一条更好的上升曲线。”
写在最后
回到组织本身,月之暗面的人才策略和它的名字一样充满个性。黄震昕的描述里,这家公司“与其说像一个传统的商业公司,不如说更像一个摇滚乐队”。各个团队向着一个共同的目标紧密协作。这种文化,与创始人在清华时就组建乐队的经历一脉相承。“我们希望每个人都是非常有审美的,做的东西是漂亮的,大家是有个性的。”
在人才招聘上,Kimi对标的是硅谷最顶尖AI公司的标准:招聘最有想法和动手能力的人,让他们去做创新。公司提供给研发人员的是“行业内最高的人均算力和卡数支持”,BD和技术团队里不乏哈佛、斯坦福、康奈尔等名校的毕业生。
“特别是在算法和模型底层研发这一块,”黄震昕说,“越年轻的研发人员,爆发出的创新力越强。”
这种年轻化和高人才密度,加上对底层创新的执着,让Kimi看起来的确不太像传统的软件公司,而更像一支充满探索欲和挑战精神的技术先锋队。黄震昕口中反复出现的“寻找能源转化成智能的最优解”这一愿景,或许正是这支乐队正在谱写的下一乐章。而在全球化与亚马逊云科技的深度绑定中,他们显然希望,这场演奏的听众远不止于一个市场。



京公网安备 11010202008829号