资讯预计阅读 5 分钟

从 ChatGLM-6B 到 GLM-4:10 万颗 Star 背后,中国大模型开源生态是如何被点燃的?

从 ChatGLM-6B 到 GLM-4,智谱的开源大模型系列在 GitHub 上累计获得超过 10 万颗 Star。ChatGLM-6B 更是中国大模型开源生态的启蒙者——它让无数开发者第一次在自己的电脑上跑通了大模型。

#智谱AI#ChatGLM-6B#GLM-4#开源#大模型生态
从 ChatGLM-6B 到 GLM-4:10 万颗 Star 背后,中国大模型开源生态是如何被点燃的?

ChatGLM-6B 对中国大模型生态的意义,就像 Linux 对开源操作系统的意义——它证明了「普通人也能玩得起」。

2023 年春天:ChatGLM-6B 引爆中国大模型热潮

2023 年 3 月,ChatGPT 在全球爆火几个月之后,中国开发者社区弥漫着一种焦虑:大模型这么厉害,但只有 OpenAI 有,我们怎么办?

就在这个节骨眼上,智谱发布了 ChatGLM-6B——一个开源的、只需要一张消费级显卡就能运行的中英双语对话大模型。

这个发布的时机和定位都恰到好处。「6B」代表 60 亿参数,这个规模意味着它可以在一张 RTX 3090(当时售价约 1 万元)上流畅运行。相比之下,ChatGPT 背后的模型有 1750 亿参数,需要一个由数百张专业 GPU 组成的集群才能运行。

ChatGLM-6B 的意义不在于它有多强——坦率地说,6B 参数的模型在能力上和 ChatGPT 有明显差距——而在于它让大模型从「只有大公司才能做」变成了「每个开发者都能玩」。这种「可及性」引爆了中国的大模型热潮。

启蒙者的角色:一个模型如何培养了一个社区

ChatGLM-6B 发布后的几个月,发生了一些有趣的连锁反应。

首先是教程爆发。B 站、知乎、CSDN 上涌现了大量「手把手教你部署 ChatGLM-6B」的教程。这些教程把大模型的部署门槛从「需要 ML 工程师」降低到了「会装 Python 就行」。数以万计的开发者通过这些教程,第一次在自己的电脑上跑通了大模型。

然后是微调实验。ChatGLM-6B 支持 LoRA 等低成本微调方法,开发者可以用少量数据把它调教成各种垂直领域的专家——法律咨询、医疗问答、代码助手、客服机器人。GitHub 上涌现了数百个基于 ChatGLM-6B 的微调项目。

最后是产品化尝试。一些创业团队直接基于 ChatGLM-6B 构建了初版产品,虽然效果有限,但足以验证商业模式、获取种子用户。这些团队中的一部分后来成长为有规模的 AI 应用公司。

可以说,ChatGLM-6B 单枪匹马地培养了中国第一批「大模型原住民」——这些人后来成为了中国 AI 产业的骨干力量。

从 6B 到 GLM-4:持续进化的开源路线

ChatGLM-6B 之后,智谱持续更新开源模型系列。ChatGLM2-6B 在性能上有了显著提升;ChatGLM3 引入了工具调用和代码解释器等高级功能;GLM-4 开源版则在各个维度上接近了商业闭源模型的水平。

这个进化路线展现了智谱的一个重要战略:开源不是一次性的营销行为,而是长期的生态投资。每一代开源模型的发布,都在强化智谱在开源社区中的影响力和信任度。

截至目前,智谱的 GLM 系列开源模型在 GitHub 上累计获得超过 10 万颗 Star,是中国最受欢迎的开源大模型系列。这个数字的含义是:超过 10 万人对智谱的模型感兴趣,其中相当一部分是活跃的开发者。

开源与商业的平衡术

一个常被问到的问题是:智谱把模型开源了,怎么赚钱?

答案是「分层策略」。智谱开源的是基础版模型,商业化的是高级版模型和服务。就像 Red Hat 靠企业版 Linux 赚钱,而不是靠 Linux 内核本身。

具体来说,开源模型吸引开发者了解和使用智谱的技术,当他们的需求超过开源版的能力时,自然会转向智谱的付费 API 或企业级解决方案。开源版本相当于「最强的市场营销工具」——它的获客成本几乎为零,但转化效率极高,因为用户已经验证了你的技术实力。

对中国 AI 生态的深远影响

ChatGLM-6B 的影响远超智谱自身。它催化了整个中国大模型开源生态的繁荣。在 ChatGLM-6B 之后,百川、通义千问等更多中国大模型纷纷走上开源路线。可以说,ChatGLM-6B 开创了中国大模型「开源竞争」的先河。

更深远的影响在于人才培养。通过 ChatGLM-6B 入门大模型的开发者,后来分散到了中国 AI 产业的各个角落——他们中有人加入了大模型公司,有人创办了 AI 应用企业,有人在传统企业推动 AI 转型。这种「星星之火」的人才培养效应,可能是 ChatGLM-6B 最持久的贡献。

编辑点评

如果要选一个对中国大模型生态影响最大的单一事件,ChatGLM-6B 的发布绝对是候选之一。它做对了一件关键的事:在正确的时间,以正确的方式,降低了大模型的参与门槛。技术进步的真正意义,不在于少数人做出了多强的模型,而在于多少人能够参与到这场变革中来。ChatGLM-6B 让这个数字从「数百人」变成了「数万人」——这才是它最大的贡献。10 万颗 Star 不只是一个虚荣指标,它代表了一个被点燃的开发者社区。

原文链接


相关推荐