部署国产ChatGPT仅需6G显存！ChatYuan模型开放下载：业内首个功能型对话开源中文大模型

程序猿 • 2025年11月10日 03:11:25 • 用户投稿 • 阅读 1

前段时间，元语智能开发团队训练了一个类似ChatGPT的功能型对话大模型ChatYuan，并在网页版中开放了试玩接口。

现在你也可以在自己的机器上部署一个ChatYuan了！

模型可用于问答场景，能够结合上下文做对话、做各种生成任务，包括创意性写作，也能回答法律、新冠等领域类问题。

并且在全中文任务中支持零样本学习，用户可以通过提供prompt的方式来使用，支持文本生成、信息抽取和理解大类下近30多种中文任务。

ChatYuan基于PromptCLUE-large结合数亿条功能问答和多轮对话数据进一步训练得到，模型参数量7.7亿，显存6G左右，一张民用显卡即可加载使用，目前模型已开放下载。

PromptCLUE在1000亿token中文语料上预训练，累计学习1.5万亿中文token，并且在数百种任务上进行Prompt任务式训练。

针对理解类任务，如分类、情感分析、抽取等，可以自定义标签体系；针对多种生成任务，可以进行采样自由生成。

如何使用

1. Github

项目地址：https://github.com/clue-ai/ChatYuan

2. Huggingface

项目地址：https://huggingface.co/ClueAI/ChatYuan-large-v1

3. ModelScope

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

项目地址：https://modelscope.cn/models/ClueAI/ChatYuan-large

加载模型：

使用模型进行预测推理方法：

天工大模型

中国首个对标ChatGPT的双千亿级大语言模型

115 查看详情

4. PaddlePaddle

项目地址：https://aistudio.baidu.com/aistudio/projectdetail/5404182

模型地址：https://huggingface.co/ClueAI/ChatYuan-large-v1-paddle

使用自有数据训练模型

1. 组织数据

将数据组织成统一的格式，由两部分构成：输入（Input）和输出（Output）。

针对单轮问答或生成：

输入（Input）：任务描述+输入文本

输出（Output）：系统需要预测的文本，如下图中「小元」后的内容。

针对多轮对话：

输入（Input）：任务描述+上文+输入文本

输出（Output）：系统需要预测的文本，如下图中「小元」后的内容。

单轮对话数据格式：

多轮对话数据格式：

2. 训练模型

训练代码可以参考：

使用pCLUE数据集进行训练、预测和效果验证, pytorch实现——在线colab。

Github项目：https://colab.research.google.com/drive/1lEyFhEfoc-5Z5xqpEKkZt_iMaojH1MP_?usp=sharing

举个例子

==========示例1==========

用户：

你能干什么

小元：

您好！我是元语AI。我可以回答您的问题、写文章、写作业、翻译，对于一些法律等领域的问题我也可以给你提供信息。

==========示例2==========

用户：

写一个诗歌，关于冬天

小元：

冬夜寂静冷，

云在天边飘，

冰封白雪上，

寒冷像一场雪。

雪花融化成冰，

像那雪花飘洒，

在寒冷的冬天，

感受春天的喜悦。

冬日里，

风雪渐消，

一片寂静，

把快乐和温暖带回家。

==========示例3==========

用户：

学前教育专业岗位实习中，在学生方面会存在问题，请提出改进措施。800字

小元：

在学前教育专业岗位实习中，在学生方面会存在一些问题，如学生缺少专业知识、缺乏合作意识、缺乏基本的责任心等等，需要我们采取措施，来解决这些问题。

首先，在实习过程中，我们需要培养学生的团队意识，加强学生与老师之间的合作，加强与家长之间的沟通，提高他们的沟通能力。另外，我们也需要加强学生的独立性，让学生学会独立思考，学会和老师、家长进行沟通，培养其独立性。

此外，在日常的工作中，我们也要为学生提供适当的机会和机会，让学生多接触社会、多参加社会活动，加深他们对社会、学校的认识，培养他们主动、积极和创新的精神。

最后，我们还需要重视学生在实习中出现的问题，尤其是学生缺乏合作，有依赖心理，不懂得分享，有拖延行为等，这些学生应该引起我们的重视，制定合理的改进措施，改善这些问题。

技术与训练过程

ChatYuan是在PromptCLUE基础上进一步训练获得的模型。它去掉了文本理解、信息抽取类任务，加强了问答、对话和各种生成式任务的学习和训练；

针对多轮对话容易受到上下文的干扰，加入了抗干扰数据使得模型可以在必要时忽略无关的上下文；加入了用户反馈数据的学习，使得模型不仅具有一定的通用语言理解能力、特定任务上的生成能力，也能更好的响应用户的意图。

PromptCLUE的学习过程

三大统一：统一模型框架（text-to-text），统一任务形式（prompt），统一应用方式（zero-shot/few-shot）（T0）大规模预训练：在t5-large版基础上，使用数百G中文语料，训练了100万步，累积训练了1.5万亿个中文字词级别token大规模任务数据：使用了16种任务类型，数百种任务，累积亿级别任务数据混合预训练：一方面将下游任务作为预训练语料，另一方面将下游任务和预训练语料一起训练，减少任务灾难遗忘以及缩短预训练和下游任务的距离，更好的适应下游任务（ExT5）混合采样：针对众多数据量差异极大的任务，采用在每个训练batch内对所有的任务进行按照比例采样，根据任务的数据量进行平滑采样，并且同时限制任务数据量采样池的上限。平滑采样可以减少任务训练有偏危害，在每一batch内训练可以减少异质任务之间训练负迁移的情况（T5）分阶段训练：一方面指在预训练分阶段，涉及训练序列长度的分阶段（128和512），加快预训练速度（Bert）；另一方面，在下游训练分阶段，涉及学习率和序列长度的变化以及递减式对下游任务的数据量限制，更好的适应下游的不同任务。增加语言模型的训练：参考t5.1.1, 除了使用Span Corrpution构建的方式进行无监督训练，同时在使用prefix LM的方式训练，增强生成任务的能力（LM adapted）增加对模型的encoder以及decoder的训练：根据下游任务数据分别构建Data_text,Data_target预训练数据语料，加入到预训练中，分别增强模型的encoder理解能力和 decoder的生成能力（见UIE）重新构建模型中文字典：使用sentencepiece上在千亿token上学习并构建模型字典，更加符合中文语言习惯

后续工作

目前版本可以进行问答、对话和各种创意性写作或文本生成，相对于线上的版本，它的意图理解和生成能力在一些场合还有比较大的提升空间；它也还不能较好实现推理或复杂的任务。之后，会根据反馈进一步改进现有版本。

以上就是部署国产ChatGPT仅需6G显存！ChatYuan模型开放下载：业内首个功能型对话开源中文大模型的详细内容，更多请关注创想鸟其它相关文章！

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 chuangxiangniao@163.com 举报，一经查实，本站将立刻删除。
发布者：程序猿，转转请注明出处：https://www.chuangxiangniao.com/p/565408.html

打赏

微信扫一扫

支付宝扫一扫

0 0

关于作者

程序猿签约作者

414.1K 文章

0 评论

2 粉丝

这个人很懒，什么都没有留下～

windows10键盘部分按键失灵如何处理_windows10键盘故障排查技巧

上一篇 2025年11月10日 03:11:21

windows10电脑蓝屏怎么解决

下一篇 2025年11月10日 03:11:35

好文分享

ai做html怎么运行_AI生成html运行步骤【教程】

答案是使用AI生成HTML代码后，将其保存为.html文件并用浏览器打开即可运行。具体步骤为：1. 在AI工具中输入需求生成HTML代码；2. 将代码复制到文本编辑器并另存为index.html，编码选UTF-8，类型选“所有文件”；3. 双击该文件用浏览器打开，若无法正常显示需检查文件后缀、编码及…

程序猿
2025年12月23日
0000
好文分享

如何用HTML插入标签云组件_HTML CSS3变换与随机颜色生成算法

使用HTML构建标签结构，CSS3添加旋转与过渡效果，JavaScript生成随机HSL颜色并设置字体大小，实现动态交互的标签云组件。要在网页中实现一个动态的标签云组件，结合 HTML、CSS3 变换和随机颜色生成算法，可以按照以下步骤操作。这个组件不仅能提升页面视觉效果，还能通过色彩和旋转增加交…

程序猿
2025年12月23日
0000
好文分享

如何在Go Gin应用中集成前端JavaScript模块（如Sentry）

本文探讨了在Go Gin框架下，通过HTML模板服务前端页面时，如何有效集成JavaScript模块（如Sentry）。针对浏览器不直接支持Node.js模块导入语法的问题，文章详细阐述了利用CDN引入Sentry SDK的解决方案，并提供了具体的代码示例，帮助开发者实现前端错误监控功能，避免了复杂…

程序猿
2025年12月23日
0000
好文分享

html官网浏览入口_html网站设计免费平台

html官网浏览入口在https://www.codepen.io，该平台支持实时预览代码、创建Pen项目、Fork开源示例，可添加外部资源，具备点赞评论收藏等社区互动功能，设有挑战活动与作品集分类，开放API接口，界面简洁适合初学者，在线编写无需配置环境，支持多种预处理器和响应式测试。 html官…

程序猿
2025年12月23日
0000
好文分享

html如何修改日期样式

在html中，可以使用“::-webkit-datetime-edit”伪元素选择器来修改日期格式，只需要用该选择器选中元素，在设置具体样式即可，具体语法为“::-webkit-datetime-edit{属性:属性值}”。本教程操作环境：windows7系统、CSS3&&HTML…

程序猿
2025年12月21日
1000
好文分享

单选框的type属性值为什么

单选框的type属性值为“radio”。html type属性可以规定要显示的输入框“”元素的类型；值为“radio”时显示为单选框、“checkbox”时显示为复选框、“select”时显示为下拉式选框等等。本教程操作环境：windows7系统、HTML5版、Dell G3电脑。在HTML中，…

程序猿
2025年12月21日
0000
好文分享

HTML中type是什么意思

在HTML中，type是类型的意思，是一个标签属性，主要用于定义标签元素的类型或文档（脚本）的MIME类型；例在input标签中type属性可以规定input元素的类型，在script标签中type属性可以规定脚本的MIME类型。本教程操作环境：windows7系统、html5版、Dell G3电…

程序猿
2025年12月21日
0000
HTML中ul标签如何去掉点？HTML无序列表的样式实例解析

本篇文章主要讲述的是关于html中的ul标签的默认小点给取消掉，还有关于html的无序列表ul标签的样式解释，给出了ul标签中的type属性三种值的介绍。现在就让我们一起来看本篇文章吧首先这篇文章一开始我们就开始介绍在html中是怎么把ul标签的点给去掉的：大家应该都使用过ul无序列表标签，ul…

程序猿
2025年12月21日 • 好文分享
1000
html中的ol标签如何去掉标号呢？标签的使用方法总结

本篇文章介绍了html的ol标签是怎么去掉序号标号的，这里还有代码的详细解释，还有介绍了关于html ol有序列表标签如何更改序号，下文介绍了三种序号，大家也可以自己去想填写怎样的序号。现在来看这篇文章吧一、我们先看看html中的ol标签是如何去掉标号的呢：我们都知道html的ol标签是个有序列…

程序猿
2025年12月21日 • 好文分享
0000
好文分享

HTML ul标签的什么意思？HTML ul标签的作用详解

本篇文章主要的为大家讲解了关于html ul标签的三种重要的用法，还有关于html ul标签的解释，包含li标签的还有type属性对ul标签的使用情况，好了，下面大家一起来看文章吧首先让我们先来解释一下HTML ul标签的意思： ul标签定义的是表格当中无序列表，表格当中的无序列表都是在标签之中…

程序猿
2025年12月21日
0000
好文分享

javascript框架和库是什么_如何选择React、Vue或Angular？

JavaScript框架与库分别提供按需调用的功能集合和约束性开发结构；React是UI组件库，生态灵活但需自行整合工具；Vue渐进式易上手，兼顾原型与工程化；Angular是全功能TypeScript框架，适合强规范企业级项目。 JavaScript框架和库是封装好的代码集合，用来简化前端开发——…

程序猿
2025年12月21日
0000
好文分享

React应用生产环境环境变量配置深度指南

本文针对react应用在生产环境中无法读取`.env`文件配置的环境变量问题，深入剖析其工作原理、常见原因及排查方法。通过详细的步骤和示例代码，指导开发者正确配置和使用环境变量，解决api调用层面的`null`响应问题，确保应用在生产环境下的稳定运行。在React应用开发中，环境变量（如API密钥…

程序猿
2025年12月21日
0000
好文分享

p5.js中类方法声明的语法解析与常见错误修复指南

本文旨在解决从java processing迁移至p5.js时常见的语法错误，特别是类内部方法声明不当引发的问题。我们将深入探讨javascript中全局函数与类方法声明的语法差异，提供清晰的示例代码，并指导如何识别和修复“unexpected token”及“declaration or stat…

程序猿
2025年12月21日
0000
好文分享

p5.js中类方法声明的语法修正与迁移指南

本文深入探讨了将Processing/Java代码转换为p5.js时，因JavaScript类方法声明语法差异而引发的常见错误。我们将重点解析`Unexpected token`和`Declaration or statement expected`等错误信息，明确全局函数与类成员方法在JavaSc…

程序猿
2025年12月21日
0000
好文分享

JS注解怎么实现文档化_ JS注解生成开发文档的流程与工具

JSDoc是一种JavaScript结构化注释规范，通过@param、@returns等标签描述代码元素，并借助工具生成HTML文档，结合IDE支持和CI/CD可提升团队协作效率。 JavaScript本身不支持原生注解（Annotation）像Java那样的语法，但通过约定的注释格式和配套工具，可…

程序猿
2025年12月21日
0000
好文分享

TypeScript泛型函数中复杂对象结构类型推断的精确控制

本文探讨了在typescript中处理复杂嵌套对象结构时，如何为泛型函数实现精确的类型推断。通过一个具体的汽车品牌和车型数据场景，我们分析了`object.values`等操作可能导致类型信息丢失的问题。核心解决方案是利用映射类型（mapped types）重构数据结构，以显式地建立泛型键与对应值之…

程序猿
2025年12月21日
0000
好文分享

JS注解怎么标注联合类型_ JS联合类型的注解书写与使用技巧

在JavaScript中可通过JSDoc使用联合类型注解，如string|number表示多类型支持，结合@param、@typedef等标签提升代码可读性与编辑器提示，适用于函数参数、返回值等场景。在JavaScript中，虽然原生不支持类型注解，但在使用JSDoc配合现代编辑器（如VS Cod…

程序猿
2025年12月21日
0000
好文分享

VS Code主题开发：告别JSON，拥抱脚本化生成

vs code主题扩展最终需json格式定义，但开发者可通过javascript或typescript等脚本语言生成此json文件。这种方法有效解决了大型json文件难以维护、不支持注释等问题，并能实现颜色动态计算，显著提升主题开发的灵活性与效率。为什么选择脚本化生成VS Code主题？在开发V…

程序猿
2025年12月20日
0000
好文分享

解决 ChatGPT 扩展选择器失效问题：一个实战教程

本文旨在帮助开发者解决 ChatGPT 网页更新导致扩展选择器失效的问题。通过分析问题原因，提供利用开发者工具查找新选择器的方法，并展示了使用 getElementsByClassName() 替代 querySelector() 的解决方案，以确保扩展功能在 ChatGPT 最新版本中正常运行。 …

程序猿
2025年12月20日
1000
好文分享

ChatGPT 扩展失效：定位新版选择器并修复

本文旨在帮助开发者解决因 ChatGPT 网页更新导致扩展失效的问题。通过分析失效原因，提供利用开发者工具定位新版选择器的实用方法，并给出示例代码，帮助开发者快速修复扩展，恢复其功能。当 ChatGPT 网页更新时，依赖于特定 CSS 选择器的扩展程序可能会失效。这通常是因为网页结构的改变导致原有…

程序猿
2025年12月20日
0000