【AI达人特训营】PaddleNLP实现聊天问答匹配

【飞桨领航团】AI达人特训营:PaddleNLP实现聊天问答匹配

1. 项目背景

本项目是ai达人特训营的选题,目测该选题来自这个比赛:房产行业聊天问答匹配

背景: 贝壳找房是以技术驱动的品质居住服务平台,“有尊严的服务者、更美好的居住”,是贝壳的使命。在帮助客户实现更美好的居住过程中,客户会和服务者(房产经纪人)反复深入交流对居住的要求,这个交流发生在贝壳APP上的IM中。
IM交流是双方建立信任的必要环节,客户需要在这个场景下经常向服务者咨询许多问题,而服务者是否为客户提供了感受良好、解答专业的服务就很重要,贝壳平台对此非常关注。因此,需要准确找出服务者是否回答了客户的问题,并进一步判断回答得是否准确得体,随着贝壳平台规模扩大,需要AI参与这个过程。

任务:
赛题任务:给定IM交流片段,片段包含一个客户问题以及随后的经纪人若干IM消息,从这些随后的经纪人消息中找出一个是对客户问题的回答。
任务要点:

数据来自一个IM聊天交流过程;选取的客户问题之前的聊天内容不会提供;提供客户问题之后的经纪人发送的内容;如果在这些经纪人发送内容之间原本来穿插了其他客户消息,不会提供;这些经纪人发送内容中有0条或多条对客户问题的回答,把它找出来。

结果:

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

【AI达人特训营】PaddleNLP实现聊天问答匹配 - 创想鸟        

说明:比赛已经比较久了,现在只能获取长期公开赛的评分排名,而且没什么人,不过用来学习文本匹配思路还是不错的。

2. 数据集

2.1 数据说明

一共有三份数据:训练集、测试集和提交示例。

训练集包含客户问题文件和经纪人回复两个文件,涉及6000段对话(有标签答案)。

测试集包含客户问题文件和经纪人回复两个文件,涉及14000段对话(无标签答案)。

2.2 数据示例

解压训练集和测试集

In [1]

!unzip data/data144231/train.zip -d ./data && unzip data/data144231/test.zip -d ./data

       

Archive:  data/data144231/train.zip   creating: ./data/train/  inflating: ./data/train/train.query.tsv    inflating: ./data/train/train.reply.tsv  Archive:  data/data144231/test.zip   creating: ./data/test/  inflating: ./data/test/test.query.tsv    inflating: ./data/test/test.reply.tsv

       

查看数据示例

In [2]

import pandas as pdtrain_query = pd.read_csv("data/train/train.query.tsv", sep='t', header=None)train_query.columns = ['query_id', 'sentence']# query 文件有 2 列,分别是问题 Id 和客户问题,同一对话 Id 只有一个问题,已脱敏print(train_query.head())train_reply = pd.read_csv("data/train/train.reply.tsv", sep='t', header=None)train_reply.columns = ['query_id', 'reply_id', 'sentence', 'label']# reply 文件有 4 列,分别是:# 对话id,对应客户问题文件中的对话 id # 经纪人回复 Id,Id 对应真实回复顺序# 经纪人回复内容,已脱敏# 经纪人回复标签,1 表示此回复是针对客户问题的回答,0 相反print(train_reply.head())# 训练集文件结构与测试集相同,只不过 reply 文件没有回复标签test_query = pd.read_csv("data/test/test.query.tsv", sep='t', header=None, encoding='gb18030')test_query.columns = ['query_id', 'sentence']print(test_query.head())test_reply = pd.read_csv("data/test/test.reply.tsv", sep='t', header=None, encoding='gb18030')test_reply.columns = ['query_id', 'reply_id', 'sentence']print(test_reply.head())

       

   query_id            sentence0         0            采荷一小是分校吧1         1                毛坯吗?2         2  你们的佣金费大约是多少和契税是多少。3         3             靠近川沙路嘛?4         4      这套房源价格还有优惠空间吗?   query_id  reply_id                     sentence  label0         0         0  杭州市采荷第一小学钱江苑校区,杭州市钱江新城实验学校。      11         0         1                           是的      02         0         2                         这是5楼      03         1         0                   因为公积金贷款贷的少      04         1         1                           是呢      0   query_id      sentence0         0  东区西区?什么时候下证?1         1          小学哪个2         2          看哪个?3         3     面积多少,什么户型4         4    什么时候能够看房呢?   query_id  reply_id      sentence0         0         0        我在给你发套1         0         1     您看下我发的这几套2         0         2    这两套也是金源花园的3         0         3           价钱低4         0         4  便宜的房子,一般都是顶楼

       

3. ERNIE 系列模型

原文:

ERNIE: Enhanced Representation through Knowledge IntegrationERNIE 2.0: A Continual Pre-training Framework for Language UnderstandingERNIE 3.0: Large-scale Knowledge Enhanced Pre-training for Language Understanding and Generation

ERNIE 1.0

首先对原始的MLM任务进行改进,引入了Entity-level masking和Phrase-level masking,帮助模型学习更多的词汇短语知识,这个任务也成为了后续中文预训练模型的标配:

【AI达人特训营】PaddleNLP实现聊天问答匹配 - 创想鸟        

Entity-level masking 和 Phrase-level masking

同时引入了DLM(Dialogue Language Model)对NSP任务进行了优化,在预测Mask token的同时判断输入的多轮对话(QRQ、QRR、QQR三种模式)是否真实。

【AI达人特训营】PaddleNLP实现聊天问答匹配 - 创想鸟        

Dialogue Language Model

ERNIE 2.0

首先是框架上的闭环化,把各种下游任务持续加入模型中提升效果:

【AI达人特训营】PaddleNLP实现聊天问答匹配 - 创想鸟        

ERNIE 2.0

其次引入更多预训练任务,细节参见原论文。

ERNIE 3.0

3.0版本首先延续了之前有效的预训练任务。

其次3.0版本提出了海量无监督文本与大规模知识图谱的平行预训练方法 (Universal Knowledge-Text Prediction)。将5千万知识图谱三元组与4TB大规模语料中相关的文本组成pair,同时输入到预训练模型之中进行联合掩码训练:

【AI达人特训营】PaddleNLP实现聊天问答匹配 - 创想鸟        

Universal Knowledge-Text Prediction

语料库 4TB,我的天!!!

小鸽子助手 小鸽子助手

一款集成于WPS/Word的智能写作插件

小鸽子助手 55 查看详情 小鸽子助手

结构上,ERNIE 3.0框架分为两层。第一层是通用语义表示网络,该网络学习数据中的基础和通用的知识。第二层是任务语义表示网络,该网络基于通用语义表示,学习任务相关的知识。在学习过程中,任务语义表示网络只学习对应类别的预训练任务,而通用语义表示网络会学习所有的预训练任务。

【AI达人特训营】PaddleNLP实现聊天问答匹配 - 创想鸟        

ERNIE 3.0模型框架

本项目使用 3.0 版本预训练模型。

4. 解题思路

由于回答是不连续的,所以可以将问题和答案一一对应,组成 query-reply-pair,然后进行文本分类,分别判断是否是针对问题的回答。

【AI达人特训营】PaddleNLP实现聊天问答匹配 - 创想鸟        

虽然对话是不连续的,但是是同一个对话,不同的回答可能相互支撑,提供部分信息,所以,第二种思路就是将同一个问题的所有回答都拼接在当前回答后面,然后同时对每一个回答进行判断。

【AI达人特训营】PaddleNLP实现聊天问答匹配 - 创想鸟        

在思路 2 的基础上,还可以把 [CLS] 对应的输出拿出来,预测所有候选 reply 中是否存在可以匹配的回答。

本项目采用思路 1 作为 baseline 。

5. Talk is cheap, show me the code

首先安装最新版本的 paddlenlp

In [ ]

!pip install paddlenlp --upgrade

   

上述安装过程可能会报错,大概是parl包的版本依赖问题,对于本项目来说无伤大雅。

训练、测试代码都写在 query_reply_pair.py 文件中,有详细注释。

注意:

你可能需要在 main() 中的 args 列表下,修改训练参数。为了便于展示结果,避免输出信息过长,下面的结果是在 num_train_epochs = 0.5 的参数下输出的,为了更好的结果,这里可能需要修改,项目开头展示的成绩是 num_train_epochs = 5.0 的结果。

运行脚本:

In [4]

!python query_reply_pair.py

       

[2022-06-22 10:04:10,523] [    INFO] - using `logging_steps` to initialize `eval_steps` to 100[2022-06-22 10:04:10,523] [    INFO] - ============================================================[2022-06-22 10:04:10,523] [    INFO] -      Model Configuration Arguments      [2022-06-22 10:04:10,523] [    INFO] - paddle commit id              :590b4dbcdd989324089ce43c22ef151c746c92a3[2022-06-22 10:04:10,523] [    INFO] - export_model_dir              :None[2022-06-22 10:04:10,523] [    INFO] - model_name_or_path            :ernie-3.0-medium-zh[2022-06-22 10:04:10,524] [    INFO] - [2022-06-22 10:04:10,524] [    INFO] - ============================================================[2022-06-22 10:04:10,524] [    INFO] -       Data Configuration Arguments      [2022-06-22 10:04:10,524] [    INFO] - paddle commit id              :590b4dbcdd989324089ce43c22ef151c746c92a3[2022-06-22 10:04:10,524] [    INFO] - max_seq_length                :128[2022-06-22 10:04:10,524] [    INFO] - test_query_path               :data/test/test.query.tsv[2022-06-22 10:04:10,524] [    INFO] - test_reply_path               :data/test/test.reply.tsv[2022-06-22 10:04:10,524] [    INFO] - train_query_path              :data/train/train.query.tsv[2022-06-22 10:04:10,524] [    INFO] - train_reply_path              :data/train/train.reply.tsv[2022-06-22 10:04:10,524] [    INFO] - raw train dataset example: {'query': '东区西区?什么时候下证?', 'reply': '我在给你发套'}.[2022-06-22 10:04:11,911] [    INFO] - We are using  to load 'ernie-3.0-medium-zh'.[2022-06-22 10:04:11,911] [    INFO] - Already cached /home/aistudio/.paddlenlp/models/ernie-3.0-medium-zh/ernie_3.0_medium_zh_vocab.txt[2022-06-22 10:04:11,934] [    INFO] - We are using  to load 'ernie-3.0-medium-zh'.[2022-06-22 10:04:11,934] [    INFO] - Already cached /home/aistudio/.paddlenlp/models/ernie-3.0-medium-zh/ernie_3.0_medium_zh.pdparamsW0622 10:04:11.936193  1093 gpu_context.cc:278] Please NOTE: device: 0, GPU Compute Capability: 7.0, Driver API Version: 11.2, Runtime API Version: 10.1W0622 10:04:11.939395  1093 gpu_context.cc:306] device: 0, cuDNN Version: 7.6.feature train dataset example: {'input_ids': [1, 481, 1535, 7, 96, 10, 59, 225, 940, 2, 1852, 404, 99, 481, 1535, 131, 7, 96, 18, 958, 409, 2485, 225, 121, 4, 1852, 404, 99, 958, 409, 102, 257, 79, 412, 18, 225, 12043, 2], 'token_type_ids': [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1], 'label': 1}.[2022-06-22 10:04:16,960] [    INFO] - ============================================================[2022-06-22 10:04:16,960] [    INFO] -     Training Configuration Arguments    [2022-06-22 10:04:16,960] [    INFO] - paddle commit id              :590b4dbcdd989324089ce43c22ef151c746c92a3[2022-06-22 10:04:16,961] [    INFO] - _no_sync_in_gradient_accumulation:True[2022-06-22 10:04:16,961] [    INFO] - adam_beta1                    :0.9[2022-06-22 10:04:16,961] [    INFO] - adam_beta2                    :0.999[2022-06-22 10:04:16,961] [    INFO] - adam_epsilon                  :1e-08[2022-06-22 10:04:16,961] [    INFO] - current_device                :gpu:0[2022-06-22 10:04:16,961] [    INFO] - dataloader_drop_last          :False[2022-06-22 10:04:16,961] [    INFO] - dataloader_num_workers        :4[2022-06-22 10:04:16,961] [    INFO] - device                        :gpu[2022-06-22 10:04:16,961] [    INFO] - disable_tqdm                  :False[2022-06-22 10:04:16,961] [    INFO] - do_eval                       :True[2022-06-22 10:04:16,961] [    INFO] - do_export                     :False[2022-06-22 10:04:16,961] [    INFO] - do_predict                    :True[2022-06-22 10:04:16,961] [    INFO] - do_train                      :True[2022-06-22 10:04:16,961] [    INFO] - eval_batch_size               :128[2022-06-22 10:04:16,961] [    INFO] - eval_steps                    :100[2022-06-22 10:04:16,961] [    INFO] - evaluation_strategy           :IntervalStrategy.STEPS[2022-06-22 10:04:16,961] [    INFO] - fp16                          :False[2022-06-22 10:04:16,961] [    INFO] - fp16_opt_level                :O1[2022-06-22 10:04:16,961] [    INFO] - gradient_accumulation_steps   :1[2022-06-22 10:04:16,961] [    INFO] - greater_is_better             :True[2022-06-22 10:04:16,962] [    INFO] - ignore_data_skip              :False[2022-06-22 10:04:16,962] [    INFO] - label_names                   :None[2022-06-22 10:04:16,962] [    INFO] - learning_rate                 :5e-05[2022-06-22 10:04:16,962] [    INFO] - load_best_model_at_end        :True[2022-06-22 10:04:16,962] [    INFO] - local_process_index           :0[2022-06-22 10:04:16,962] [    INFO] - local_rank                    :-1[2022-06-22 10:04:16,962] [    INFO] - log_level                     :-1[2022-06-22 10:04:16,962] [    INFO] - log_level_replica             :-1[2022-06-22 10:04:16,962] [    INFO] - log_on_each_node              :True[2022-06-22 10:04:16,962] [    INFO] - logging_dir                   :work/query_reply_pair/runs/Jun22_10-04-10_jupyter-532817-4195533[2022-06-22 10:04:16,962] [    INFO] - logging_first_step            :False[2022-06-22 10:04:16,962] [    INFO] - logging_steps                 :100[2022-06-22 10:04:16,962] [    INFO] - logging_strategy              :IntervalStrategy.STEPS[2022-06-22 10:04:16,962] [    INFO] - lr_scheduler_type             :SchedulerType.LINEAR[2022-06-22 10:04:16,962] [    INFO] - max_grad_norm                 :1.0[2022-06-22 10:04:16,962] [    INFO] - max_steps                     :-1[2022-06-22 10:04:16,962] [    INFO] - metric_for_best_model         :accuracy[2022-06-22 10:04:16,962] [    INFO] - minimum_eval_times            :None[2022-06-22 10:04:16,962] [    INFO] - no_cuda                       :False[2022-06-22 10:04:16,962] [    INFO] - num_train_epochs              :0.5[2022-06-22 10:04:16,962] [    INFO] - optim                         :OptimizerNames.ADAMW[2022-06-22 10:04:16,962] [    INFO] - output_dir                    :work/query_reply_pair/test[2022-06-22 10:04:16,962] [    INFO] - overwrite_output_dir          :False[2022-06-22 10:04:16,962] [    INFO] - past_index                    :-1[2022-06-22 10:04:16,962] [    INFO] - per_device_eval_batch_size    :128[2022-06-22 10:04:16,962] [    INFO] - per_device_train_batch_size   :128[2022-06-22 10:04:16,963] [    INFO] - prediction_loss_only          :False[2022-06-22 10:04:16,963] [    INFO] - process_index                 :0[2022-06-22 10:04:16,963] [    INFO] - remove_unused_columns         :True[2022-06-22 10:04:16,963] [    INFO] - report_to                     :['visualdl'][2022-06-22 10:04:16,963] [    INFO] - resume_from_checkpoint        :None[2022-06-22 10:04:16,963] [    INFO] - run_name                      :test[2022-06-22 10:04:16,963] [    INFO] - save_on_each_node             :False[2022-06-22 10:04:16,963] [    INFO] - save_steps                    :100[2022-06-22 10:04:16,963] [    INFO] - save_strategy                 :IntervalStrategy.STEPS[2022-06-22 10:04:16,963] [    INFO] - save_total_limit              :2[2022-06-22 10:04:16,963] [    INFO] - scale_loss                    :32768[2022-06-22 10:04:16,963] [    INFO] - seed                          :42[2022-06-22 10:04:16,963] [    INFO] - should_log                    :True[2022-06-22 10:04:16,963] [    INFO] - should_save                   :True[2022-06-22 10:04:16,963] [    INFO] - train_batch_size              :128[2022-06-22 10:04:16,963] [    INFO] - warmup_ratio                  :0.0[2022-06-22 10:04:16,963] [    INFO] - warmup_steps                  :0[2022-06-22 10:04:16,963] [    INFO] - weight_decay                  :0.0[2022-06-22 10:04:16,963] [    INFO] - world_size                    :1[2022-06-22 10:04:16,963] [    INFO] - [2022-06-22 10:04:16,964] [    INFO] - ***** Running training *****[2022-06-22 10:04:16,965] [    INFO] -   Num examples = 17268[2022-06-22 10:04:16,965] [    INFO] -   Num Epochs = 1[2022-06-22 10:04:16,965] [    INFO] -   Instantaneous batch size per device = 128[2022-06-22 10:04:16,965] [    INFO] -   Total train batch size (w. parallel, distributed & accumulation) = 128[2022-06-22 10:04:16,965] [    INFO] -   Gradient Accumulation steps = 1[2022-06-22 10:04:16,965] [    INFO] -   Total optimization steps = 67.5[2022-06-22 10:04:16,965] [    INFO] -   Total num train samples = 8634.0100%|███████████████████████████████████████████| 67/67 [00:17<00:00,  4.40it/s][2022-06-22 10:04:34,326] [    INFO] - Training completed. {'train_runtime': 17.4487, 'train_samples_per_second': 494.821, 'train_steps_per_second': 3.84, 'train_loss': 0.352832708785783, 'epoch': 0.4963}100%|███████████████████████████████████████████| 67/67 [00:17<00:00,  3.84it/s][2022-06-22 10:04:34,416] [    INFO] - Saving model checkpoint to work/query_reply_pair/test[2022-06-22 10:04:36,894] [    INFO] - tokenizer config file saved in work/query_reply_pair/test/tokenizer_config.json[2022-06-22 10:04:36,895] [    INFO] - Special tokens file saved in work/query_reply_pair/test/special_tokens_map.json***** train metrics *****  epoch                    =     0.4963  train_loss               =     0.3528  train_runtime            = 0:00:17.44  train_samples_per_second =    494.821  train_steps_per_second   =       3.84[2022-06-22 10:04:36,898] [    INFO] - ***** Running Evaluation *****[2022-06-22 10:04:36,898] [    INFO] -   Num examples = 4317[2022-06-22 10:04:36,898] [    INFO] -   Pre device batch size = 128[2022-06-22 10:04:36,898] [    INFO] -   Total Batch size = 128[2022-06-22 10:04:36,898] [    INFO] -   Total prediction steps = 34100%|███████████████████████████████████████████| 34/34 [00:02<00:00, 12.31it/s]***** eval metrics *****  epoch                   =     0.4963  eval_accuracy           =     0.8826  eval_loss               =      0.283  eval_runtime            = 0:00:03.21  eval_samples_per_second =   1344.038  eval_steps_per_second   =     10.585[2022-06-22 10:04:40,112] [    INFO] - ***** Running Prediction *****[2022-06-22 10:04:40,112] [    INFO] -   Num examples = 53757[2022-06-22 10:04:40,112] [    INFO] -   Pre device batch size = 128[2022-06-22 10:04:40,112] [    INFO] -   Total Batch size = 128[2022-06-22 10:04:40,112] [    INFO] -   Total prediction steps = 420100%|█████████████████████████████████████████| 420/420 [00:51<00:00, 11.37it/s]***** test metrics *****  test_runtime            = 0:00:52.06  test_samples_per_second =   1032.496  test_steps_per_second   =      8.067100%|█████████████████████████████████████████| 420/420 [00:52<00:00,  7.95it/s]

       

训练结果可视化:

点击页面最左侧一列菜单栏中的 数据模型可视化 ,添加 logdir 然后启动服务,就可以看到训练过程的 loss 曲线等信息。

log 文件会保存在类似 work/query_reply_pair/runs/Jun22_10-01-49_jupyter-532817-4195533 这样的路径下面。

由于上面训练过程只跑了 0.5 个 epoch,曲线基本只有一个点,这里就不进行展示了。

测试集预测结果保存在 work/query_reply_pair/test/test_labels.tsv 文件中,你可以直接点开看一下结果。

In [7]

import pandas as pdfile_path = "work/query_reply_pair/test/test_labels.tsv"df = pd.read_csv(file_path, sep='t')df.head()

       

          query         reply  label0  东区西区?什么时候下证?        我在给你发套      01  东区西区?什么时候下证?     您看下我发的这几套      02  东区西区?什么时候下证?    这两套也是金源花园的      03  东区西区?什么时候下证?           价钱低      04  东区西区?什么时候下证?  便宜的房子,一般都是顶楼      0

               

生成竞赛提交文件:

In [8]

import pandas as pdsample_submit_path = "data/data144231/sample_submission.tsv"submit_path = "submit.tsv"submit = pd.read_csv(sample_submit_path, sep='t', header=None)submit.columns = ['query_id', 'reply_id', 'label']test_labels = pd.read_csv(file_path, sep='t')label = test_labels['label']submit['label'] = labelsubmit.to_csv(submit_path, sep='t', header=None, index=None)

   

根目录下 submit.tsv 文件就可以拿去提交啦,提交大概 0.75+ 的分数 (num_train_epochs = 5.0 的情况下)。

以上就是【AI达人特训营】PaddleNLP实现聊天问答匹配的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/740135.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
windows10如何关闭特定应用程序的通知_windows10关闭应用程序通知方法
上一篇 2025年11月25日 14:45:46
IGN《忍者龙剑传4》试玩报告:是梦想中现代《忍龙》
下一篇 2025年11月25日 14:45:50

相关推荐

  • Matplotlib 地图中多类型图例的创建与优化

    Matplotlib 地图中多类型图例的创建与优化Matplotlib 地图中多类型图例的创建与优化Matplotlib 地图中多类型图例的创建与优化Matplotlib 地图中多类型图例的创建与优化

    本教程旨在解决matplotlib地图可视化中,如何在一个图例中同时展示颜色块(如区域分类)和自定义标记(如特定兴趣点)的问题。文章详细介绍了当传统`patch`对象无法正确显示标记时,如何利用`matplotlib.lines.line2d`创建标记图例句柄,并将其与颜色块图例句柄合并,从而生成一…

    2026年5月10日 用户投稿
    100
  • Golang JSON序列化:控制敏感字段暴露的最佳实践

    本教程探讨golang中如何高效控制结构体字段在json序列化时的可见性。当需要将包含敏感信息的结构体数组转换为json响应时,通过利用`encoding/json`包提供的结构体标签,特别是`json:”-“`,可以轻松实现对特定字段的忽略,从而避免敏感数据泄露,确保api…

    2026年5月10日
    000
  • 利用海象运算符简化条件赋值:Python教程与最佳实践

    本文旨在探讨Python中海象运算符(:=)在条件赋值场景下的应用。通过对比传统if/else语句与海象运算符,以及条件表达式,分析海象运算符在简化代码、提高可读性方面的优势与局限性。并通过具体示例,展示如何在列表推导式等场景下合理使用海象运算符,同时强调其潜在的复杂性及替代方案,帮助开发者更好地掌…

    2026年5月10日
    100
  • 比特币新手教程 比特币交易平台有哪些

    比特币是一种去中心化的数字货币,基于区块链技术实现点对点交易,具有匿名性、有限发行和不可篡改等特点;新手可通过交易所购买,P2P交易获得比特币,常用平台包括Binance、OKX和Huobi;交易流程包括注册账户、实名认证、绑定支付方式、充值法币并下单购买,可选择市价单或限价单;比特币存储方式有交易…

    2026年5月10日
    000
  • c++中的SFINAE技术是什么_c++模板编程中的SFINAE原理与应用

    SFINAE 是“替换失败不是错误”的原则,指模板实例化时若参数替换导致错误,只要存在其他合法候选,编译器不报错而是继续重载决议。它用于条件启用模板、类型检测等场景,如通过 decltype 或 enable_if 控制函数重载,实现类型特征判断。尽管 C++20 引入 Concepts 简化了部分…

    2026年5月10日
    000
  • Go语言mgo查询构建:深入理解bson.M与日期范围查询的正确实践

    本文旨在解决go语言mgo库中构建复杂查询时,特别是涉及嵌套`bson.m`和日期范围筛选的常见错误。我们将深入剖析`bson.m`的类型特性,解释为何直接索引`interface{}`会导致“invalid operation”错误,并提供一种推荐的、结构清晰的代码重构方案,以确保查询条件能够正确…

    2026年5月10日
    100
  • RichHandler与Rich Progress集成:解决显示冲突的教程

    在使用rich库的`richhandler`进行日志输出并同时使用`progress`组件时,可能会遇到显示错乱或溢出问题。这通常是由于为`richhandler`和`progress`分别创建了独立的`console`实例导致的。解决方案是确保日志处理器和进度条组件共享同一个`console`实例…

    2026年5月10日
    000
  • Golang goroutine与channel调试技巧

    使用go run -race检测数据竞争,结合runtime.NumGoroutine监控协程数量,通过pprof分析阻塞调用栈,利用select超时避免永久阻塞,有效排查goroutine泄漏、死锁和数据竞争问题。 Go语言的goroutine和channel是并发编程的核心,但它们也带来了调试上…

    2026年5月10日
    000
  • 《魔兽世界》将于6月11日开启国服回归技术测试

    《魔兽世界》将于6月11日开启国服回归技术测试《魔兽世界》将于6月11日开启国服回归技术测试《魔兽世界》将于6月11日开启国服回归技术测试《魔兽世界》将于6月11日开启国服回归技术测试

    《%ign%ignore_a_1%re_a_1%》官方宣布,将于6月11日开启国服回归技术测试,时间为7天,并称可以在6月内正式开服,玩家们可以访问官网下载战网客户端并预下载“巫妖王之怒”客户端,技术测试详情见下图。 WordAi WordAI是一个AI驱动的内容重写平台 53 查看详情 以上就是《…

    2026年5月10日 用户投稿
    200
  • 使用 Jupyter Notebook 进行探索性数据分析

    Jupyter Notebook通过单元格实现代码与Markdown结合,支持数据导入(pandas)、清洗(fillna)、探索(matplotlib/seaborn可视化)、统计分析(describe/corr)和特征工程,便于记录与分享分析过程。 Jupyter Notebook 是进行探索性…

    2026年5月10日
    000
  • 如何在HTML中插入表单元素_HTML表单控件与输入类型使用指南

    HTML表单通过标签构建,包含action和method属性定义数据提交目标与方式,常用input类型如text、password、email等适配不同输入需求,配合label、required、placeholder提升可用性,结合textarea、select、button等控件实现完整交互,是…

    2026年5月10日
    000
  • 创建指定大小并填充特定数据的Golang文件教程

    本文将介绍如何使用Golang创建一个指定大小的文件,并用特定数据填充它。我们将使用 `os` 包提供的函数来创建和截断文件,从而实现快速生成大文件的目的。示例代码展示了如何创建一个10MB的文件,并将其填充为全零数据。掌握这些方法,可以方便地在例如日志系统或磁盘队列等场景中,预先创建测试文件或初始…

    2026年5月10日
    000
  • Python命令怎样使用profile分析脚本性能 Python命令性能分析的基础教程

    使用Python的cProfile模块分析脚本性能最直接的方式是通过命令行执行python -m cProfile your_script.py,它会输出每个函数的调用次数、总耗时、累积耗时等关键指标,帮助定位性能瓶颈;为进一步分析,可将结果保存为文件python -m cProfile -o ou…

    2026年5月10日
    000
  • 如何插入查询结果数据_SQL插入Select查询结果方法

    如何插入查询结果数据_SQL插入Select查询结果方法如何插入查询结果数据_SQL插入Select查询结果方法如何插入查询结果数据_SQL插入Select查询结果方法如何插入查询结果数据_SQL插入Select查询结果方法

    使用INSERT INTO…SELECT语句可高效插入数据,通过NOT EXISTS、LEFT JOIN、MERGE语句或唯一约束避免重复;表结构不一致时可通过别名、类型转换、默认值或计算字段处理;结合存储过程可提升可维护性,支持参数化与动态SQL。 将查询结果数据插入到另一个表中,可以…

    2026年5月10日 用户投稿
    000
  • 使用 WebCodecs VideoDecoder 实现精确逐帧回退

    本文档旨在解决在使用 WebCodecs VideoDecoder 进行视频解码时,实现精确逐帧回退的问题。通过比较帧的时间戳与目标帧的时间戳,可以避免渲染中间帧,从而提高用户体验。本文将提供详细的解决方案和示例代码,帮助开发者实现精确的视频帧控制。 在使用 WebCodecs VideoDecod…

    2026年5月10日
    000
  • Debian Copilot的社区活跃度如何

    debian copilot是codeberg社区维护的ai助手,旨在为debian用户提供服务。尽管搜索结果中没有直接提供关于debian copilot社区支持活跃度的具体数据,但我们可以通过debian社区的整体活跃度和特点来推断其活跃性。 Debian社区的一般情况: Debian拥有详尽的…

    2026年5月10日
    000
  • Discord.py 交互按钮超时与持久化解决方案

    本教程旨在解决Discord.py中交互按钮在一段时间后出现“This Interaction Failed”错误的问题。我们将深入探讨视图(View)的超时机制,并提供通过正确设置timeout参数以及利用bot.add_view()方法实现按钮持久化的具体方案,确保您的机器人交互功能稳定可靠,即…

    2026年5月10日
    000
  • Python递归函数追踪与性能考量:以序列打印为例

    本文深入探讨了Python中一种递归打印序列元素的方法,并着重演示了如何通过引入缩进参数来有效追踪递归函数的执行流程和参数变化。通过实际代码示例,文章揭示了递归调用可能带来的潜在性能开销,特别是对调用栈空间的需求,以及Python默认递归深度限制可能导致的错误,为读者提供了理解和优化递归算法的实用见…

    2026年5月10日
    000
  • python中zip函数详解 python多序列压缩zip函数应用场景

    zip函数的应用场景包括:1) 同时遍历多个序列,2) 合并多个列表的数据,3) 数据分析和科学计算中的元素运算,4) 处理csv文件,5) 性能优化。zip函数是一个强大的工具,能够简化代码并提高处理多个序列时的效率。 在Python中,zip函数是一个非常有用的工具,它能够将多个可迭代对象打包成…

    2026年5月10日
    000
  • JavaScript 动态菜单点击高亮效果实现教程

    本教程详细介绍了如何使用 JavaScript 实现动态菜单的点击高亮功能。通过事件委托和状态管理,当用户点击菜单项时,被点击项会高亮显示(绿色),同时其他菜单项恢复默认样式(白色)。这种方法避免了不必要的DOM操作,提高了性能和代码可维护性,确保了无论点击方向如何,功能都能稳定运行。 动态菜单高亮…

    2026年5月10日
    200

发表回复

登录后才能评论
关注微信