训练
-
每 2 秒吃透一道高数大题!华为终于揭秘准万亿 MoE 昇腾训练系统全流程
现在,请大家一起来数一下 “1”、”2″。 OK,仅仅 2 秒的时间,一个接近万亿规模的 MoE 大模型就已经掌握了如何解答一道高等数学难题的方法! 而且呢,这个大模型还是完全依靠国产设备进行训练的,整个流程都体现了浓浓的“国产”特色。 这就是华为借助…
-
美团提出首个语音交互 GUI 智能体,端到端语音训练能力优于传统文本训练
只需动动嘴,就能操控 gui 代理? 由美团与浙江大学联合推出的 GUIRoboTron-Speech——让你彻底解放双手,直接对设备“发号施令”。 这是首个可以直接通过语音指令和屏幕截图进行端到端(End-to-End)决策的自主 GUI 智能体,致力于为用户提供更自然、高效且无障碍的人机交互方式…
-
华为人工智能领域新专利公布 可降低扩散模型训练成本
cnmo 获悉,7 月 18 日,华为技术有限公司申请的 ” 一种模型训练方法、数据生成方法及相关设备 ” 专利公布。该专利类型为发明公布,申请日是 2024 年 1 月 16 日,法律状态为审中。 华为集团 根据专利摘要显示,本申请涉及人工智能领域。该方法中,获取多个第一训…
-
何恺明与MIT合作:简单框架实现无条件图像生成的最新突破
大佬何恺明还未正式入职mit,但和mit的第一篇合作研究已经出来了: 他和MIT师生一起开发了一个自条件图像生成框架,名叫RCG(代码已开源)。 这个框架结构非常简单但效果拔群,直接在ImageNet-1K数据集上实现了无条件图像生成的新SOTA。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索…
-
解锁GPT-4和Claude2.1:一句话带你实现100k+上下文大模型的真实力,将27分提升至98
各家大模型纷纷卷起上下文窗口,llama-1时标配还是2k,现在不超过100k的已经不好意思出门了。 然鹅一项极限测试却发现,大部分人用法都不对,没发挥出AI应有的实力。 AI真的能从几十万字中准确找到关键事实吗?颜色越红代表AI犯的错越多。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免…
-
Windows、Office直接上手,大模型智能体操作电脑太6了
提到AI助手的未来,人们很容易想到《钢铁侠》系列中的AI助手贾维斯。贾维斯在电影中展现了令人炫目的功能,不仅是托尼・斯塔克的得力助手,也是他与先进科技沟通的桥梁。随着大型模型的出现,人类使用工具的方式正在发生革命性变化,或许我们离科幻场景更近了一步。想象一下,一个多模态Agent能够像人类一样通过键…
-
只需少量计算和内存资源即可运行的小型 Llama 大模型
背景介绍 在当前信息量爆炸的时代,语言模型的训练日益变得复杂和困难。为了培训一个高效的语言模型,我们需要大量的计算资源和时间,这对很多人来说是不切实际的。同时,我们也面临着如何在有限的内存和计算资源下运用大型语言模型的挑战,尤其是在边缘设备上。 今天要给大家推荐一个 GitHub 开源项目 jzha…
-
复旦等发布AnyGPT:任意模态输入输出,图像、音乐、文本、语音都支持
最近,OpenAI 的视频生成模型 Sora 爆火,生成式 AI 模型在多模态方面的能力再次引起广泛关注。 现实世界本质上是多模态的,生物体通过不同的渠道感知和交换信息,包括视觉、语言、声音和触觉。开发多模态系统的一个有望方向是增强 LLM 的多模态感知能力,主要涉及多模态编码器与语言模型的集成,从…
-
40%算力训练效果比肩GPT-4,实测DeepMind联创大模型创业新成果
大模型竞赛,又杀出一匹黑马—— Inflection-2.5,由DeepMind联创Mustafa Suleyman的大模型初创公司打造。 只用40%的计算资源训练,表现就超过了GPT-4的九成,尤其擅长代码和数学。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSe…
-
剑桥团队开源:赋能多模态大模型RAG应用,首个预训练通用多模态后期交互知识检索器
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 论文链接:https://arxiv.org/abs/2402.08327DEMO 链接:https://u60544-b8d4-53eaa55d.westx.seetacloud.com:84…