从 ChatGLM-6B 到 GLM-4：10 万颗 Star 背后，中国大模型开源生态是如何被点燃的？

ChatGLM-6B 对中国大模型生态的意义，就像 Linux 对开源操作系统的意义——它证明了「普通人也能玩得起」。

2023 年春天：ChatGLM-6B 引爆中国大模型热潮

2023 年 3 月，ChatGPT 在全球爆火几个月之后，中国开发者社区弥漫着一种焦虑：大模型这么厉害，但只有 OpenAI 有，我们怎么办？

就在这个节骨眼上，智谱发布了 ChatGLM-6B——一个开源的、只需要一张消费级显卡就能运行的中英双语对话大模型。

这个发布的时机和定位都恰到好处。「6B」代表 60 亿参数，这个规模意味着它可以在一张 RTX 3090（当时售价约 1 万元）上流畅运行。相比之下，ChatGPT 背后的模型有 1750 亿参数，需要一个由数百张专业 GPU 组成的集群才能运行。

ChatGLM-6B 的意义不在于它有多强——坦率地说，6B 参数的模型在能力上和 ChatGPT 有明显差距——而在于它让大模型从「只有大公司才能做」变成了「每个开发者都能玩」。这种「可及性」引爆了中国的大模型热潮。

启蒙者的角色：一个模型如何培养了一个社区

ChatGLM-6B 发布后的几个月，发生了一些有趣的连锁反应。

首先是教程爆发。B 站、知乎、CSDN 上涌现了大量「手把手教你部署 ChatGLM-6B」的教程。这些教程把大模型的部署门槛从「需要 ML 工程师」降低到了「会装 Python 就行」。数以万计的开发者通过这些教程，第一次在自己的电脑上跑通了大模型。

然后是微调实验。ChatGLM-6B 支持 LoRA 等低成本微调方法，开发者可以用少量数据把它调教成各种垂直领域的专家——法律咨询、医疗问答、代码助手、客服机器人。GitHub 上涌现了数百个基于 ChatGLM-6B 的微调项目。

最后是产品化尝试。一些创业团队直接基于 ChatGLM-6B 构建了初版产品，虽然效果有限，但足以验证商业模式、获取种子用户。这些团队中的一部分后来成长为有规模的 AI 应用公司。

可以说，ChatGLM-6B 单枪匹马地培养了中国第一批「大模型原住民」——这些人后来成为了中国 AI 产业的骨干力量。

从 6B 到 GLM-4：持续进化的开源路线

ChatGLM-6B 之后，智谱持续更新开源模型系列。ChatGLM2-6B 在性能上有了显著提升；ChatGLM3 引入了工具调用和代码解释器等高级功能；GLM-4 开源版则在各个维度上接近了商业闭源模型的水平。

这个进化路线展现了智谱的一个重要战略：开源不是一次性的营销行为，而是长期的生态投资。每一代开源模型的发布，都在强化智谱在开源社区中的影响力和信任度。

截至目前，智谱的 GLM 系列开源模型在 GitHub 上累计获得超过 10 万颗 Star，是中国最受欢迎的开源大模型系列。这个数字的含义是：超过 10 万人对智谱的模型感兴趣，其中相当一部分是活跃的开发者。

开源与商业的平衡术

一个常被问到的问题是：智谱把模型开源了，怎么赚钱？

答案是「分层策略」。智谱开源的是基础版模型，商业化的是高级版模型和服务。就像 Red Hat 靠企业版 Linux 赚钱，而不是靠 Linux 内核本身。

具体来说，开源模型吸引开发者了解和使用智谱的技术，当他们的需求超过开源版的能力时，自然会转向智谱的付费 API 或企业级解决方案。开源版本相当于「最强的市场营销工具」——它的获客成本几乎为零，但转化效率极高，因为用户已经验证了你的技术实力。

对中国 AI 生态的深远影响

ChatGLM-6B 的影响远超智谱自身。它催化了整个中国大模型开源生态的繁荣。在 ChatGLM-6B 之后，百川、通义千问等更多中国大模型纷纷走上开源路线。可以说，ChatGLM-6B 开创了中国大模型「开源竞争」的先河。

更深远的影响在于人才培养。通过 ChatGLM-6B 入门大模型的开发者，后来分散到了中国 AI 产业的各个角落——他们中有人加入了大模型公司，有人创办了 AI 应用企业，有人在传统企业推动 AI 转型。这种「星星之火」的人才培养效应，可能是 ChatGLM-6B 最持久的贡献。

编辑点评

如果要选一个对中国大模型生态影响最大的单一事件，ChatGLM-6B 的发布绝对是候选之一。它做对了一件关键的事：在正确的时间，以正确的方式，降低了大模型的参与门槛。技术进步的真正意义，不在于少数人做出了多强的模型，而在于多少人能够参与到这场变革中来。ChatGLM-6B 让这个数字从「数百人」变成了「数万人」——这才是它最大的贡献。10 万颗 Star 不只是一个虚荣指标，它代表了一个被点燃的开发者社区。

原文链接

从 ChatGLM-6B 到 GLM-4：10 万颗 Star 背后，中国大模型开源生态是如何被点燃的？

2023 年春天：ChatGLM-6B 引爆中国大模型热潮

启蒙者的角色：一个模型如何培养了一个社区

从 6B 到 GLM-4：持续进化的开源路线

开源与商业的平衡术

对中国 AI 生态的深远影响

编辑点评

相关推荐

AutoGLM 深度拆解：AI 是怎么学会自己点外卖、订机票的？

Kimi 智能体平台：人人都能创建 AI 助手的时代，真的来了吗？

MiniMax M2.5：1 美元 1 小时的 AI 编程搭档，用真实世界训练出来的硬实力