首页 > 车圈原创 > 车圈原创 > K2 Thinking横空出世引热议:月之暗面高管亲自回应技术、效率与成本问题

K2 Thinking横空出世引热议:月之暗面高管亲自回应技术、效率与成本问题

发布时间:2025-11-13 15:38:03来源: 13041198719

本周,人工智能初创公司月之暗面(Moonshot AI)的核心高管在“美版贴吧”Reddit上举行了一场AMA(可以问我任何问题)活动,回应了多项业界热点议题。

参与这项活动的三位高管分别为杨植麟(论坛用户名:ComfortableAsk4494)、周昕宇(zxytim)和吴育昕(ppwwyyxx),三人在24小时内持续回答了论坛上网友提出的问题。

上周,月之暗面发布了Kimi K2 Thinking,公司称其为“迄今能力最强的开源思考模型”。因此,AMA活动上的大多数问题与K2 Thinking有关,有点像是该模型线上发布会的问答环节。

图片

 

有人询问,为什么K2 Thinking能在单次推理中实现如此长的推理时间和推理链,而GPT5却做不到?GPT5 Pro通过智能体来延长推理时间,但推理效果仍然不如K2 Thinking单次长时间推理。未来是否会考虑进一步提升基础模型的推理速度?

杨植麟回答道:“我认为推理时间取决于API的吞吐量,而推理令牌的数量则取决于模型的训练方式。我们训练K2 Thinking的方式倾向于使用相对更多的推理令牌以获得最佳结果。我们的Turbo API应该会快得多。此外,K2原生支持INT4类型,这进一步加快了推理过程。”

当被问及“FP4相对于INT4的改进是否真的意义重大?”时,周昕宇称,选择INT4是为了更好地兼容“非Blackwell GPU”,同时利用现有的INT4推理marlin内核。

吴育昕在另一个问题下称,“我们使用配备Infiniband的H800 GPU;它不如美国的高端GPU那么好,而且我们的显卡数量也处于劣势,但我们充分利用了每一张显卡!

有网友称,K2 Thinking似乎使用了过多的代币。杨植麟承认了这一现象,并解释道“当前版本中,我们优先考虑的是绝对性能而非代币效率。我们会尝试将效率纳入奖励机制,以便它能学习如何简化思考过程。”

有人质疑,K2 Thinking通过专门训练,以达到在高水平逻辑推理(HLE)测试中取得好成绩,但“它的高分似乎与实际使用中的智能水平不太相符。”

杨植麟回应称,“我们在提升智能体推理能力方面取得了一些进展,使其在HLE测试中得分较高。我们正在努力进一步提升其通用能力,以便在更多实际应用场景中充分发挥智能的作用。”

当网友询问“K2 Thinking培训费用只有460万美元是真的吗?”杨植麟回答道:“这并非官方数据,因为培训成本很难量化,其中很大一部分用于研究和实验。”

在点赞最多的回答中,周昕宇透露,公司的新架构KDA(Kernel Attention Dual Architecture)能让模型获得更高的基准测试分数,而且速度更快、效率更高,从而使我们能够更快地进行预训练、更快地部署到强化学习中,并服务更多用户。

周昕宇表示,“我们正在开发更多改进方案,完成后会与大家分享。”杨植麟也补充道:“KDA是我们最新的实验性架构,与KDA相关的想法很可能会在K3中得到应用。”

在被追问何时推出K3模型的问题中,杨植麟还调侃了OpenAI的首席执行官萨姆·奥尔特曼,他回应称,肯定能在“萨姆价值万亿美元的数据中心建成之前”推出K3模型。

有网友询问对“OpenAI为什么会烧掉这么多钱”的看法,周昕宇称“不知道。只有萨姆自己知道。我们有自己的方式和节奏。”周昕宇还提到,月之暗面没有人工智能浏览器的计划,因为“不需要去套一层新的Chromium壳”。

当被问及公司有没有“视觉-语言模型(VL)的计划时”,杨植麟写道:“是的,我们正在努力。敬请期待!”

车圈原创更多>>

欧盟委员会正式公布《工业加速法案》(IAA),以“提升低碳转型竞争力”为名,推出严格的战略产业本地含量要求 沃尔沃汽车12月至2月销量下滑10% 在鸿蒙智行技术焕新发布会上,华为产品负责人宣布问界M9全系累计交付量突破28万台 华为乾崑发布最高896线激光雷达,将首搭尊界S800与问界M9 宝马工厂人形机器人,电爪来自中国 奇瑞汽车正式发布瑞虎7L官方图片,新车定位紧凑型SUV,将于2026年一季度正式上市 奔驰GLC终端让利大幅加码,多地经销商报出最高优惠12.5万元,入门版裸车价下探至27万出头 iCAR V27完整配置正式曝光,凭借越级智能与硬核实力,迅速成为硬派方盒子SUV市场焦点 OPPO Find N6真机现身,折痕控制很不错! IDC:智能手机市场恐将因存储芯片供应短缺而下滑13% 魅族确认放弃手机业务:后续聚焦AI驱动软件产品 OPPO Find N6确认配备AI手写笔,其搭载行业首发AI功能! 蓝厂最强旗舰来了!vivo X300 Ultra官宣:全大底三主摄加持 影像灭霸 博通发布多维堆叠芯片平台 高管扬言今明两年能卖出100万颗 百度2.0:一场由AI驱动的核心价值重构 京东APP正式上线「百亿超市」,剑指即时零售 2026年印尼汽车购置激励政策尚未明确,消费者延后购车,政府拟将资金转向国产车开发 3M凭借其材料科学领域的创新技术,正为汽车行业提供更加安全、环保与高效的解决方案 格兰海芬嘉定基地扩产增能项目签约,预计2026年实现产值约4.7亿 新合作!泉州市与宁德时代合作共建智能零碳电池工厂 上海2026汽车以旧换新政策落地,最高补贴2万元 流媒体后视镜风口正劲,华阳前装配套量同比激增近400% 单张不到五毛钱!谷歌深夜发布Nano Banana 2,没有颠覆性,但量大管饱! AI智能体不是越多越强:信息冗余构成了LLM Agent Scaling的瓶颈 特斯拉官宣进军摩洛哥市场,向这个北非国家推出Model 3和Model Y两款车型 保时捷992代911 GT3 RS首台车在越南正式上路 苹果硬抗内存飙升压力!iPhone 18 Pro/Pro Max起售价不变 2025年全球手机存量报告:苹果、三星破10亿断层领先 小米第三 iPhone 17 Pro Max续航测试:WiFi比5G多约3小时使用时长 三星官宣2月26日举办Galaxy Unpacked发布会