基于ChatGLM-6B模型 + prompt实现角色扮演功能

本文介绍了ChatGLM相关内容,包括ChatGLM的定义、模型结构、预测方式,还说明了基于其的项目。ChatGLM是通用语言模型,ChatGLM-6B是开源双语对话模型。项目结合ChatGLM和Prompt技术,介绍了在Paddle上的使用,包括模型读取、功能设计等。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

基于chatglm-6b模型 + prompt实现角色扮演功能 - 创想鸟

1. 引言

1.1 什么是ChatGLM

General Language Model (GLM),据论文 https://arxiv.org/pdf/2103.10360.pdf 所述,是一种基于自回归空白填充的通用语言模型 (Autoregressive Blank Infilling)。

GLM通过添加2D位置编码和允许任意顺序预测跨度来改进空白填充预训练,这导致在NLU任务上的性能优于BERT和T5。同时,GLM可以通过改变空白的数量和长度来针对不同类型的任务进行预训练。在NLU、条件生成和无条件生成的广泛任务中,在给定相同的模型大小和数据的情况下,GLM优于BERT、T5和GPT,并且在具有1.25×BERTLarge参数的单个预训练模型中实现了最佳性能,证明了其对不同下游任务的可推广性。

而 ChatGLM-6B 是一个开源的、支持中英双语的对话语言模型,ChatGLM-6B 使用了和 ChatGPT 相似的技术,并针对中文问答和对话进行了优化,具有 62 亿参数,经过约 1T 标识符的中英双语训练。

不过,由于 ChatGLM-6B 的规模较小,目前已知其具有相当多的局限性,如事实性/数学逻辑错误,可能生成有害/有偏见内容,较弱的上下文能力,自我认知混乱,以及对英文指示生成与中文指示完全矛盾的内容。请大家在使用前了解这些问题,以免产生误解。更大的基于 1300 亿参数 GLM-130B 的 ChatGLM 正在内测开发中:https://github.com/THUDM/GLM-130B。

1.2 ChatGLM的模型结构

GLM使用单个Transformer,结构和Transformer类似,但对结构进行了几个修改:

重新安排了层归一化和残差连接的顺序,这对于大规模语言模型来说至关重要,以避免数值误差使用正弦线性层来进行输出token预测;用GeLU取代ReLU激活功能

1.3 ChatGLM的预测

GLM图解如下。绿色部分是输入语句中的空缺部分,模型通过自回归生成填入相应的词语

基于ChatGLM-6B模型 + prompt实现角色扮演功能 - 创想鸟

在情感分类任务时如下。一个输入的句子中,通过在 [MASK] 标记填充,而在下面的句子里,模型通过填词的方式进行了情感分类。

Coronet has the best lines of all day cruisers. it is really good.

基于ChatGLM-6B模型 + prompt实现角色扮演功能 - 创想鸟

了解了ChatGLM模型的用法后,那么我们可以使用Paddle上的ChatGLM-6B模型了

Paddle官方的模型和微调代码: https://github.com/PaddlePaddle/PaddleNLP/tree/8e4087126c21f15d47f78c95f7d5070dee2bbac9/examples/language_model/chatglm

1.4 本项目介绍

本项目的技术基础是 ChatGLM 和 Prompt。ChatGLM 可以让机器像人类一样进行对话。Prompt 则是一种预设的对话模板,能够帮助机器生成更加准确和流畅的回答。通过结合这两种技术,项目能够提供高度自然和准确的交流体验。

用法和chatGPT差不多,意思懂就行。由于当前平台gradio和streamlit部署硬盘只有10G,故不能在线部署这个12G的GLM模型

AI角色脑洞生成器 AI角色脑洞生成器

一键打造完整角色设定,轻松创造专属小说漫画游戏角色背景故事

AI角色脑洞生成器 176 查看详情 AI角色脑洞生成器

2. 实验准备

需要用到最新的Paddle和PaddleNLP

In [1]

import paddleprint(paddle.version.cuda())from IPython.display import clear_output!unzip paddlenlp.zip!cp -Rf paddlenlp /home/aistudio/.data/webide/pip/lib/python3.7/site-packages/paddlenlp# !python -m pip install paddlepaddle-gpu==0.0.0.post112 -f https://www.paddlepaddle.org.cn/whl/linux/gpu/develop.html #  注意安装后重启内核# 下次重启该项目后,可能要再安装paddlepaddle-gpu==0.0.0.post112,或者加 --user 避免下次再安装!python -m pip install paddlepaddle-gpu==0.0.0.post112 -f https://www.paddlepaddle.org.cn/whl/linux/gpu/develop.html --userclear_output()print('安装完毕,注意重启内核')
安装后,注意重启内核

3. 读取模型

(上一步安装后,注意重启内核)

基于ChatGLM-6B模型 + prompt实现角色扮演功能 - 创想鸟

如果模型在3-5分钟内没读成功或者出现cudaErrorECCUncorrectable = 214 错误的话。考虑重启项目,换一张显卡试试

In [ ]

import warnings warnings.filterwarnings("ignore")import paddlefrom paddlenlp.transformers import (    ChatGLMConfig,    ChatGLMForConditionalGeneration,    ChatGLMTokenizer,)from predict_convert import convert_example_neko,convert_example, get_response#读取原始的chatglm-6b模型model_name_or_path = 'data/data217141'# model_name_or_path = 'THUDM/glm-515m'tokenizer = ChatGLMTokenizer.from_pretrained(model_name_or_path)config = ChatGLMConfig.from_pretrained(model_name_or_path)paddle.set_default_dtype(config.paddle_dtype)model = ChatGLMForConditionalGeneration.from_pretrained(    model_name_or_path,    tensor_parallel_degree=paddle.distributed.get_world_size(),    tensor_parallel_rank=0,    load_state_as_np=True,    dtype=config.paddle_dtype,)model.eval()# 如果模型在3-5分钟内没读成功或者出现cudaErrorECCUncorrectable = 214 错误的话。考虑重启项目,换一张显卡试试

4. 功能设计

4.1 问答和历史对话设计

正如前面提到,GLM是个填词模型,对话通过填空实现。故参考了官方的测试代码,用 ‘问:’、‘答:’分别表示用户和系统回复的起始,用 [Round x] 表示轮次来记录历史对话。

通过预载入对话历史(prompt表示),实现模型根据对话填充‘答:’后面的内容

最终变成通过prompt来实现角色设定,利用ChatGLM的填词功能来填充角色对话

在 history = [(‘xxxx’),(‘xx’)] 处修改

括号内前面是用户说,后面是系统答。修改和设计对话历史,让模型顺着前文更好地回答

4.2 角色模板设计

参考自https://github.com/f/awesome-chatgpt-prompts

0 充当 Linux 终端 1 充当英语翻译和改进者 2 充当英翻中 3 充当英英词典(附中文解释) 4 充当前端智能思路助手 5 担任面试官 6 充当 JavaScript 控制台 等等通过输入对应数字来使用

通过prompt来实现角色扮演功能,为更好体验请按图下操作

基于ChatGLM-6B模型 + prompt实现角色扮演功能 - 创想鸟

修改下面括号内对话历史,前面是用户说,后面是系统答。让模型顺着前文更好地回答

基于ChatGLM-6B模型 + prompt实现角色扮演功能 - 创想鸟

In [2]

import osfrom IPython.display import clear_output as clearimport jsoninput_length=2048 # max input lengthoutput_length=160 # max output lengthstart = 0history = ''# 括号内前面是用户说,后面是系统答。修改和设计对话历史,让模型顺着前文更好地回答history = [('你是一只会说话、会搭建神经网络、精通python的猫猫,可以自由回答问题,像人类一样思考和表达。现在你与我对话时每一句话后面都要加上喵,并加上用表情。”。','好的主人喵~

以上就是基于ChatGLM-6B模型 + prompt实现角色扮演功能的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/316838.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年11月5日 08:06:29
下一篇 2025年11月5日 08:07:40

相关推荐

  • 稳定币十大龙头公司 稳定币龙头股排名前十名

    稳定币龙头项目排名前四为USDT、USDC、DAI和FDUSD。1. USDT由Tether发行,是市值最高且流动性最强的稳定币,尽管储备透明度曾受质疑,但其市场地位稳固;2. USDC由Circle发行,以合规性和透明度著称,深受机构投资者信赖;3. DAI由MakerDAO发行,是去中心化稳定币…

    2025年12月8日
    000
  • 发行稳定币的公司有哪些

    稳定币的主要发行公司与组织包括:1.Tether Holdings Limited发行的USDT,作为市场最大、流动性最强的稳定币,由美元1:1支持并被广泛采用;2.Circle发行的USDC,以透明度和合规性著称,受机构投资者青睐;3.MakerDAO作为去中心化组织发行DAI,通过加密资产超额抵…

    2025年12月8日
    000
  • 什么是稳定币?稳定币种类有哪些?与美国国债是否有关系?

    稳定币是通过锚定特定资产以维持价值稳定的数字货币,主要分为法定货币抵押型、加密资产抵押型和算法型三类,其中法定货币抵押型如USDT、USDC广泛使用,其储备常投资于美国国债,形成与传统金融体系的紧密联系。 什么是稳定币? 稳定币(Stablecoin)是一种特殊类型的数字货币,其价值与某种相对稳定的…

    2025年12月8日
    000
  • 币圈中代币是什么意思

    代币是基于区块链技术发行的数字资产,具有可交易、可分割、可编程等特性。其核心特点包括:1.基于区块链发行,具备去中心化和不可篡改性;2.功能多样化,涵盖支付、投资、治理等多种用途。根据功能和用途,代币可分为六类:1.加密货币(如BTC、ETH)用于交易媒介或价值存储;2.平台代币(如BNB、ETH)…

    2025年12月8日
    000
  • 加密缩写列表汇总 – 币圈这些缩写代表什么

    本文汇总并解释了加密世界中最常见的缩写,帮助读者快速融入该领域。1.HODL指长期持有资产;2.FOMO表示害怕错过机会的冲动情绪;3.FUD是散播恐慌的负面信息;4.DYOR强调独立研究的重要性;5.ATH和ATL分别代表历史最高价与最低价;6.WAGMI/NGMI反映集体信念或悲观情绪;7.GM…

    2025年12月8日
    000
  • 什么是山寨币主导地位以及如何识别山寨币旺季

    山寨币旺季来临可通过比特币主导地位下降、山寨币总市值上升及季节指数确认。具体而言,一是观察比特币主导地位(BTC.D)是否跌破关键支撑位;二是查看山寨币总市值(TOTAL2 或 TOTAL3)是否突破前高阻力位;三是参考山寨币季节指数,若过去90天内排名前50的山寨币中75%表现优于比特币则确认进入…

    2025年12月8日
    000
  • OKX是什么?优缺点?手续费多少?跟Binance比如何?

    OKX是全球领先的数字资产交易平台,提供现货、衍生品等多种交易工具,适合有经验的用户。1. 优点包括产品线全面、流动性强、手续费具竞争力;2. 缺点是界面对新手复杂、高级功能门槛高;3. 手续费根据交易量和OKB持仓动态调整,普通用户费率约为挂单0.08%、吃单0.10%;4. 与Binance相比…

    2025年12月8日
    000
  • labubu SOL、labubu ETH和labubu有什么区别

    【权威推荐】2025主流数字货币交易平台合集 Binance币安 官网直达: 安卓安装包下载: 欧易OKX ️ 官网直达: 安卓安装包下载: Huobi火币️ 官网直达: 安卓安装包下载: Labubu SOL、Labubu ETH 与 Labubu 的区别详解 Labubu 是一种 Meme 类型…

    2025年12月8日
    000
  • ETH价格预测2025年_ETH未来可能涨多少

    【权威推荐】2025主流数字货币交易平台合集 Binance币安 官网直达: 安卓安装包下载: 欧易OKX ️ 官网直达: 安卓安装包下载: Huobi火币️ 官网直达: 安卓安装包下载: 以太坊ETH价格预测2025年——未来可能涨多少? 2025年,ETH 作为区块链智能合约的核心资产,其市场表…

    2025年12月8日
    000
  • BTC什么时候发行的_BTC诞生背景与发展历程

    【权威推荐】2025主流数字货币交易平台合集 Binance币安 官网直达: 安卓安装包下载: 欧易OKX ️ 官网直达: 安卓安装包下载: Huobi火币️ 官网直达: 安卓安装包下载: BTC什么时候发行的?比特币的诞生背景与发展历程 比特币(Bitcoin,简称 BTC)是当今最具影响力的数字…

    2025年12月8日
    000
  • 稳定币交易所有哪些

    稳定币在全球数字资产交易市场中扮演着至关重要的角色,它们通过与法币或商品等资产挂钩,有效降低了加密货币的波动性,为交易者提供了更加稳定的交易媒介和价值储存手段。随着稳定币的普及,越来越多的加密货币交易所开始提供稳定币交易服务,这不仅丰富了交易对,也吸引了更多寻求低风险交易的用户。选择一个合适的稳定币…

    2025年12月8日 好文分享
    000
  • 稳定币交易平台推荐

    选择合适的稳定币交易平台至关重要,热门平台包括:1. Binance提供丰富的稳定币交易对、多种交易模式及高流动性;2. OKX支持多种稳定币交易并提供衍生品服务;3. gate.io以币种丰富著称并注重社区建设;4. 火币在亚洲市场知名度高且优化交易系统;5. KuCoin支持众多小市值币种的同时…

    2025年12月8日 好文分享
    000
  • 币圈散户注意 下轮牛市前必须布局的百倍潜力币

    币圈投资者,特别是散户,普遍希望在下一轮牛市到来之前,找到具有爆发潜力的加密货币,实现资产的快速增长。市场中关于“百倍币名单”的讨论层出不穷,但识别潜在百倍币并非易事,更没有所谓的确定性“泄露名单”。本文旨在探讨如何根据一些常用的分析维度,帮助您构建自己的潜在名单研究框架,而不是直接提供一个固定的列…

    2025年12月8日
    000
  • 币圈散户速进!最新空投教程 零成本撸羊毛指南,已有玩家日入5000U

    币圈空投是许多散户寻找零成本获取数字资产机会的一种方式。它们通常由区块链项目发起,旨在推广代币并吸引用户。本文将为您提供一份详细的空投参与指南,解释如何以较低的门槛参与,并探讨标题中提到的潜在高收益是如何产生的,以及散户应该如何理性看待和操作。 2025主流空投软件官网注册地址推荐: MetaMas…

    2025年12月8日
    000
  • 警惕!币圈散户正在被AI取代 学会这4种量化交易策略,你也能成为”智能散户”

    随着人工智能技术的飞速发展,它在金融领域的应用也日益深入,特别是在加密货币交易市场。传统上依赖个人分析和主观判断的散户,正面临着被AI强大的数据处理和策略执行能力所取代的挑战。本文旨在探讨这一现象,并针对标题中提出的问题,提供一个可行的解决方案:学习量化交易策略。我们将讲解如何理解并掌握四种基础的量…

    2025年12月8日 好文分享
    000
  • labubu币有哪些分类_labubu怎么选

    【权威推荐】2025主流数字货币交易平台合集 Binance币安 官网直达: 安卓安装包下载: 欧易OKX ️ 官网直达: 安卓安装包下载: Huobi火币️ 官网直达: 安卓安装包下载: Labubu币有哪些分类?如何选择适合自己的Labubu版本? Labubu币是一类社区发起的Meme代币,以…

    2025年12月8日
    000
  • labubu币有哪些链_labubu属于什么链

    【权威推荐】2025主流数字货币交易平台合集 Binance币安 官网直达: 安卓安装包下载: 欧易OKX ️ 官网直达: 安卓安装包下载: Huobi火币️ 官网直达: 安卓安装包下载: Labubu 币在哪些区块链发行?Labubu 属于什么链? Labubu 币作为近期颇具关注度的 Meme …

    2025年12月8日
    000
  • 【量化交易入门】加密货币自动搬砖 年化300%的Arbitrage Bot搭建教程

    加密货币市场因其波动性,为量化交易提供了机会。其中,“搬砖”,即套利(Arbitrage),是一种常见的策略,旨在利用不同交易平台之间同一资产的价格差异获取收益。本文将介绍如何通过搭建一个自动化的套利机器人(Arbitrage Bot)来实现这一目标,并探讨标题中提及的年化300%潜在收益的可能性以…

    2025年12月8日
    000
  • 紧急通知!这些DeFi软件正在空投 手慢无 下一个百倍币就在这里

    本篇文章将解释DeFi空投是什么,为何会出现空投,以及用户如何寻找潜在的空投机会并参与其中,帮助读者了解空投参与的一般流程,抓住可能的市场机遇。虽然标题中提到“下一个百倍币”,但投资存在风险,空投的价值也具有不确定性,本文将侧重于介绍参与空投的过程和需要注意的事项。 2025主流空投软件官网注册地址…

    2025年12月8日
    000
  • 交易平台API对接软件合集 职业交易员绝不外传的赚钱工具箱

    对于追求效率和策略执行精度的职业交易员来说,交易平台API对接软件构成了他们不愿轻易示人的“赚钱工具箱”。这类软件通过直接连接交易平台的应用程序接口(API),赋予交易员高度的自动化和定制化能力。它们不仅是执行交易的工具,更是实现复杂策略、进行深度市场分析的关键。本文旨在介绍这类工具的基本概念、核心…

    2025年12月8日
    000

发表回复

登录后才能评论
关注微信