follow
-
超越GPT-4,斯坦福团队手机可跑的大模型火了,一夜下载量超2k
在大模型落地应用的过程中,端侧 ai 是非常重要的一个方向。 近日,斯坦福大学研究人员推出的 Octopus v2 火了,受到了开发者社区的极大关注,模型一夜下载量超 2k。 20 亿参数的 Octopus v2 可以在智能手机、汽车、个人电脑等端侧运行,在准确性和延迟方面超越了 GPT-4,并将上…
-
为什么大型语言模型都在使用 SwiGLU 作为激活函数?
如果你一直在关注大型语言模型的架构,你可能会在最新的模型和研究论文中看到“SwiGLU”这个词。SwiGLU可以说是在大语言模型中最常用到的激活函数,我们本篇文章就来对它进行详细的介绍。SwiGLU其实是2020年谷歌提出的激活函数,它结合了SWISH和GLU两者的特点。SwiGLU的中文全称是“双…
-
2024年WAIC·云帆奖启航:擎启AGI时代,集结超越边界的探索者
2024 年 waic・云帆奖面向全球征选 ai 青年技术人才,欢迎点击「此链接」报名或提名。 人工智能的研究范式和产业格局正在经历深刻而积极的转变。过去一年,大模型引发了一股席卷全球的智能浪潮,这不仅推动了 AI 技术在更广泛领域的应用,也激发了人类对人工智能深层次潜力的追寻和探索。 在这场技术革…
-
开源模型首胜GPT-4!竞技场最新战报引热议,Karpathy:这是我唯二信任的榜单
能打得过gpt-4的开源模型出现了! 大模型竞技场最新战报: 1040亿参数开源模型Command R+攀升至第6位,与GPT-4-0314打成平手,超过了GPT-4-0613。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 图片 这也是第…
-
OpenAI解雇两名Ilya团队成员,与「宫斗」泄密有关?
半年来内斗剧情跌宕起伏的企业 openai,再次传来人员变动的消息。 The Information 报道,据知情人士透露,OpenAI 已经解雇了两名涉嫌泄露信息的员工。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 一位是 Leopol…
-
突发!OpenAI开除Ilya盟友,理由:涉嫌信息泄漏
突发!openai开人了,理由:涉嫌信息泄露。 一位是失踪的首席科学家Ilya盟友,超级对齐(Superalignment)团队核心成员Leopold Aschenbrenner。 另一位也不简单,是LLM推理团队研究员Pavel Izmailov,曾经也在超级对齐团队干过。 目前尚不清楚这俩人到底…
-
波士顿动力新版人形机器人Atlas问世,纯电驱动
我们见证了新一代人形机器人 Atlas 的诞生。 新机器人的视频一出,我们立即理解了波士顿动力为何退役已开发十多年的旧版Atlas——人形机器人,现在应该拥有的是超越人类的灵活性。新机器人集成了最先进的机器学习技术,可以自主学习改进自身的动作和反应。这一切都说明机器人技术正在快速进步,未来的机器人将…
-
六年种方式快速体验最新发布的 Llama 3!
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 昨晚meta发布了 llama 3 8b 和 70b 模型,llama 3 指令调整模型针对对话/聊天用例进行了微调和优化,在常见基准测试中优于许多现有的开源聊天模型。比如,gemma 7b 和…
-
CVPR 2024高分论文:全新生成式编辑框架GenN2N,统一NeRF转换任务
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 我们网站的AIxiv专栏是关于学术和技术内容的栏目。过去几年来,我们网站的AIxiv专栏已经收到超过2000篇内容,覆盖全球各大高校与企业的顶级实验室,有助于推进了学术交流与传播。如果您有优秀的…
-
【金融风控系列】_[2]_欺诈识别
本文围绕IEEE-CIS欺诈检测赛题展开,目标是识别欺诈交易。介绍了训练集和测试集数据情况,含交易和身份数据字段。阐述了关键策略,如构建用户唯一标识、聚合特征等,还涉及特征选择、编码、验证策略及模型训练,最终线上评分为0.959221,旨在学习特征构建。 ☞☞☞AI 智能聊天, 问答助手, AI 智…