模型
-
十行代码媲美RLHF,用社交游戏数据训练社会对齐模型
让语言模型的行为符合人类社会价值观是当前语言模型开发的重要环节。相应的训练也被称为价值对齐 (value alignment)。 当前主流的方案是 ChatGPT 所采用的 RLHF (Reinforcenment Learning from Human Feedback),也就是在人类反馈上进行强…
-
如何应对生成式大模型「双刃剑」?之江实验室发布《生成式大模型安全与隐私白皮书》
当前,生成式大模型已经为学术研究甚至是社会生活带来了深刻的变革,以 ChatGPT 为代表,生成式大模型的能力已经显示了迈向通用人工智能的可能性。但同时,研究者们也开始意识到 ChatGPT 等生成式大模型面临着数据和模型方面的安全隐患。 今年 5 月初,美国白宫与谷歌、微软、OpenAI、Anth…
-
将330亿参数大模型「塞进」单个消费级GPU,加速15%、性能不减
预训练大语言模型(LLM)在特定任务上的性能不断提高,随之而来的是,假如 prompt 指令得当,其可以更好的泛化到更多任务,很多人将这一现象归功于训练数据和参数的增多,然而最近的趋势表明,研究者更多的集中在更小的模型上,不过这些模型是在更多数据上训练而成,因而在推理时更容易使用。 举例来说,参数量…
-
万字长文说清大模型在自动驾驶领域的应用
随着ChatGPT的火爆,大模型受到的关注度越来越高,大模型展现出的能力令人惊叹。 在图片生成、推荐系统、机器翻译等领域,大模型已经开始发挥作用。给定一些提示词,图片生成网站Midjourney生成的设计图甚至已经超过了很多专业设计师的水平。 大模型为什么可以表现出令人惊叹的能力呢?为什么模型的参数…
-
「多模态LLM」最新介绍!数据、论文集直接打包带走
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 进展跟踪链接(awesome-mllm,实时更新):https://github.com/bradyfu/awesome-multimodal-large-language-models 近年来…
-
LeCun力挺,马毅教授五年集大成之作:完全数学可解释的白盒Transformer,性能不输ViT
过去十多年,AI的飞速发展主要是工程实践上的进步,AI理论并没有起到指导算法开发的作用,经验设计的神经网络依然是一个黑盒。 而随着ChatGPT的爆火,AI的能力也被不断夸大、炒作,甚至到了威胁、绑架社会的地步,让Transformer架构设计变透明已刻不容缓! ☞☞☞AI 智能聊天, 问答助手, …
-
管提需求,大模型解决问题:图表处理神器SheetCopilot上线
这种丝滑的操作流程简直是职场人的福音! ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 近日,来自中科院自动化所、港理工等机构的研究者们造出了一个「表格 AI 助手」SheetCopilot,该智能体能根据用户指令生成操纵表格的解决方案并在特…
-
数据挖掘的常见方法
数据挖掘的常见方法基本概念数据挖掘就是从大量的、不完全的、有噪声的、模糊的数据中提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。 数据挖掘的常见方法 基本概念 数据挖掘就是从大量的、不完全的、有噪声的、模糊的数据中提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的…
-
OpenAI更新GPT-4等模型,新增API函数调用,价格最高降75%
前些天,OpenAI 的 CEO Sam Altman 在全球巡回演讲中,透漏了 OpenAI 近期发展路线,主要分两个阶段,2023 年的首要任务是推出更便宜、更快的 GPT-4,更长的上下文窗口等;2024 年重点是多模态。 OpenAI 2023 年的这些目标正在逐一实现。从 ChatGPT …
-
650亿参数,8块GPU就能全参数微调:邱锡鹏团队把大模型门槛打下来了
在大模型方向上,科技巨头在训更大的模型,学界则在想办法搞优化。最近,优化算力的方法又上升到了新的高度。 大型语言模型(LLM)彻底改变了自然语言处理(NLP)领域,展示了涌现、顿悟等非凡能力。然而,若想构建出具备一定通用能力的模型,就需要数十亿参数,这大幅提高了 NLP 研究的门槛。在 LLM 模型…