语言模型
-
大规模语言模型高效参数微调–BitFit/Prefix/Prompt 微调系列
2018 年谷歌发布了 bert,一经面世便一举击败 11 个 nlp 任务的 state-of-the-art (sota) 结果,成为了 nlp 界新的里程碑; bert 的结构如下图所示, 左边是 bert 模型预训练过程, 右边是对于具体任务的微调过程。其中, 微调 阶段是后续用于一些下游任…
-
生成人工智能聊天机器人和大型语言模型增强网络安全的六种方法
从风险的角度来看,生成式人工智能聊天机器人和大型语言模型可能是一把双刃剑,但如果使用得当,它们也可以在关键方面改善网络安全。 闪念贝壳 闪念贝壳是一款AI 驱动的智能语音笔记,随时随地用语音记录你的每一个想法。 218 查看详情 OpenAI公司开发的ChatGPT的迅速崛起是今年最大…
-
微软推出 XOT 技术,加强语言模型的推理能力
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 11 月 15 日消息,微软近日推出了名为“everything of thought”(xot)的方法,灵感来自谷歌 deepmind 的 alphazero,利用紧凑的神经网络,来增强 ai…
-
ChatGPT的提示的一些高级知识
作为一个大型语言模型(llm)接口,chatgpt有令人印象深刻的潜力,但是真正能否用好取决与我们的提示(prompt ),一个好的提示可以让chatgpt晋升到一个更好的层次。 在这篇文章中,我们将介绍关于提示的一些高级知识。无论是将ChatGPT用于客户服务、内容创建,还是仅仅为了好玩,本文都将…
-
AI4Science的基石:几何图神经网络,最全综述来了!人大高瓴联合腾讯AI lab、清华、斯坦福等发布
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 编辑 | XS Nature 在 2023 年 11 月发表了两项重要研究成果:蛋白质合成技术 Chroma 和晶体材料设计方法 GNoME。这两项研究都采用了图神经网络作为处理科学数据的工具。…
-
清华大学AIR联合水木分子开源DeepSeek版多模态生物医药大模型BioMedGPT-R1
编辑 | ScienceAI 2025 年初,DeepSeek给全球引发了 AI 大模型的新一轮热议。多家市场咨询公司指出,在 DeepSeek 的影响下,从大模型供应商到基础设施和平台供应商的整个 AI 产业生态都掀起了一波「新浪潮」。 DeepSeek R1 以其强大的推理能力,为各行各业带来了…
-
一文搞懂Tokenization!
语言模型是对文本进行推理的,文本通常是字符串形式,但模型的输入只能是数字,因此需要将文本转换成数字形式。 Tokenization是自然语言处理的基本任务,根据特定需求能够把一段连续的文本序列(如句子、段落等)切分为一个字符序列(如单词、短语、字符、标点等多个单元),其中的单元称为token或词语。…
-
Meta打造首个「蛋白质宇宙」全景图!用150亿参数语言模型,预测了6亿+蛋白质结构
Meta在蛋白质结构的探索上又前进了一步! 这次他们瞄准的是更大的目标领域:宏基因组学。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 蛋白质宇宙的「暗物质」 天工大模型 中国首个对标ChatGPT的双千亿级大语言模型 115 查看详情 …
-
Meta 推出 AI 语言模型 LLaMA,一个有着 650 亿参数的大型语言模型
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 2 月 25 日消息,Meta 在当地时间周五宣布,它将推出一种针对研究社区的基于人工智能 (AI) 的新型大型语言模型,与微软、谷歌等一众受到 ChatGPT 刺激的公司一同加入人工智能竞赛。…
-
企业在2023年应该使用的35种生成式人工智能工具
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 2022年是生成式人工智能发展的一个重要转折点,在这一年推出了更强大、更可访问、更适用的ChatGPT等大型语言模型。虽然OpenAI公司推出的ChatGPT只是一个开始,但位于前沿的生成式人工…