清华ChatGLM2-6B模型允许免费商用开启 AI 研究新纪元

清华大学的 NLP 团队与智谱 AI 及清华 KEG 实验室宣布，他们的 ChatGLM-6B 和 ChatGLM2-6B 模型现已完全开放权重，允许学术研究和商业使用。这两个模型在人工智能研究领域具有重要意义。

ChatGLM-6B 是一个开源的、支持中英双语的对话语言模型，基于 General Language Model (GLM) 架构，具有 62 亿参数。结合模型量化技术，用户可以在消费级的显卡上进行本地部署（INT4 量化级别下最低只需 6GB 显存）。 ChatGLM-6B 使用了和 ChatGPT 相似的技术，针对中文问答和对话进行了优化。经过约 1T 标识符的中英双语训练，辅以监督微调、反馈自助、人类反馈强化学习等技术的加持，62 亿参数的 ChatGLM-6B 已经能生成相当符合人类偏好的回答，更多信息请参考我们的博客。欢迎通过 chatglm.cn 体验更大规模的 ChatGLM 模型。

GitHub – THUDM/ChatGLM-6B: ChatGLM-6B: An Open Bilingual Dialogue Language Model | 开源双语对话语言模型

2. ChatGLM-6B模型介绍及训练自己数据集实战 – 知乎 (zhihu.com)

原创文章，作者：奋斗，如若转载，请注明出处：https://blog.ytso.com/296906.html

清华ChatGLM2-6B模型允许免费商用 开启 AI 研究新纪元

相关推荐

发表回复

清华ChatGLM2-6B模型允许免费商用开启 AI 研究新纪元