美国花了三年、动用了四轮出口管制、涉及 24 类半导体设备和超过 140 个实体清单,试图切断中国获取先进 AI 芯片的通道。但据美中经济安全审查委员会(USCC)3 月 24 日发布的报告,80% 的美国 AI 创业公司正在使用中国开源模型。
墙建在硬件层。门开在软件层。
这组矛盾不是抽象的政策讨论。就在上周,估值 293 亿美元的 AI 编程工具 Cursor 被发现,其旗舰功能 Composer 2 的底层基座来自月之暗面的 Kimi K2.5。一家中国公司的模型,正在驱动美国最头部的 AI 开发工具。
与此同时,五角大楼把「供应链风险」的标签贴给了 Anthropic,一家美国公司。
管制的方向和实际依赖的方向,完全相反。
从 2022 年 10 月 BIS 首轮限制 A100/H100 级芯片出口开始,美国的芯片管制持续加码。2023 年堵上 H800 漏洞,扩大性能密度管制指标。2024 年 12 月再加一轮,新增 24 类半导体设备管制、将 140 个中国实体列入黑名单,连高带宽内存(HBM)和 DRAM 也被纳入限制范围。2025 年 1 月,商务部甚至推出了一个「AI 扩散框架」,试图从模型层面建立全球管制体系,但这个框架在正式生效前两天被自己撤销了。到 2025 年 12 月,特朗普又调转方向,允许 H200 芯片向中国批准客户出口。
在这条管制时间线的下半段,中国开源模型的发布节奏不断加速。2024 年,DeepSeek-V2 和 Qwen 2.5 系列相继开源。2025 年 1 月 20 日,DeepSeek-R1 和 Kimi K1.5 同日发布,前者一度登顶美国 App Store 下载榜,超越 ChatGPT。2025 年下半年 Kimi-K2 和 GLM-4.5 跟进。2026 年初,字节跳动的豆包 2.0 已拥有 1.55 亿周活用户,Kimi K2.5 则被 Cursor 直接采用。管制越紧,模型越多。
据 HuggingFace 官方数据,中国开源模型在全球下载中的占比从 2024 年底的约 1.2% 飙升至 2026 年初的约 30%。阿里 Qwen 系列的累计下载量在 2026 年 1 月突破 7 亿次,正式超越 Meta 的 Llama。芯片管制没有阻止中国 AI 的软件输出,反而可能加速了开源路线的战略转向。
这不是偶然的数据巧合。USCC 报告用了一个精确的框架来描述这个现象:「双循环」。硬件循环中,中国受制于芯片供应瓶颈。软件循环中,中国通过开源模型反向渗透全球 AI 基础设施,形成下游依赖。两个循环的力量方向相反,但互相强化。管制限制了我们获取顶级算力的能力,但也倒逼出一条用更少算力做更多事的技术路线。DeepSeek-R1 以远低于 GPT-4o 的推理成本达到前沿性能,就是这条路线的产物。
HuggingFace 上的变化肉眼可见。据平台统计数据,2024 年底 Llama 衍生模型占新增语言模型约六成,Qwen 仅占一成出头。到 2025 年年中,交叉点出现,据 HuggingFace 官方博客,Qwen 衍生占比飙升至 40% 以上,Llama 跌至约 15%。2026 年初,Qwen 衍生已接近半数,Llama 继续收缩至约 12%。
这个交叉的速度超出了大多数人的预期。两年前,开源 AI 几乎等同于 Meta 的 Llama 生态。全球开发者基于 Llama 做微调、做部署、做产品。现在,同样的事情正在 Qwen 生态上重演,只是速度更快、覆盖更广。
这意味着全球开发者在构建 AI 应用时,越来越多地选择中国模型作为底层基座。不是因为政治立场,而是因为性能和开放程度。Qwen 2.5 系列覆盖 0.5B 到 72B 参数量,开发者可以在自己的硬件上微调部署,不需要向 OpenAI 或 Anthropic 付费调用 API。开源消除了供应商锁定,也消除了国界。
一个值得注意的细节是,据 MIT Technology Review 2 月报道,中国 AI 公司在开源策略上正在形成差异化竞争。DeepSeek 走极致成本效率路线,Kimi 主攻长上下文和代码能力,Qwen 追求全参数量覆盖。这种多路线并进的态势,让全球开发者的选择越来越丰富。我们的开源模型正在用实力重新定义全球 AI 供应链。
但这条供应链的终端长什么样?
3 月 19 日,开发者 @fynnso 在 Cursor 代码中发现了模型 ID accounts/anysphere/models/kimi-k2p5-rl-0317-s515-fast。Cursor 联合创始人 Aman Sanger 随后承认 Composer 2 基于 Kimi K2.5 构建。据 Cursor VP Lee Robinson 的说法,「基座模型只贡献了约四分之一的计算量,其余来自我们自己的训练」。但底座就是底座。293 亿美元估值的产品,基座模型来自月之暗面,一家由阿里巴巴和红杉(HongShan)投资的中国公司。
把这条依赖链和五角大楼的动作放在一起看,荒诞感更明显。3 月 5 日,五角大楼正式将 Anthropic 标记为「供应链风险」。据 NPR 报道,原因是 Anthropic CEO Dario Amodei 拒绝在两条红线上让步,即 AI 用于自主武器和大规模监控美国公民。特朗普给军方 6 个月时间淘汰 Claude,而 Claude 已深度嵌入军事和国家安全平台。Anthropic 随后在 3 月 9 日起诉五角大楼。
一边是美国政府把「供应链风险」标签贴给自家公司,另一边是 80% 的美国创业公司跑着中国模型。前者是政治博弈,后者是技术现实。两者之间没有交集。
80% 的美国创业公司跑着中国模型,五角大楼的风险标签贴在了一家美国公司身上。管制在硬件层层叠加,依赖在软件层悄然生长。三年芯片围墙的另一面,是一个正在成型的新事实:中国开源 AI 已经不是「追赶者」,而是全球 AI 基础设施的供给侧。
