模型
-
谷歌AudioPaLM实现「文本+音频」双模态解决,说听两用大模型
大型语言模型以其强大的性能及通用性,带动了一批多模态的大模型开发,如音频、视频等。 语言模型的底层架构大多是基于Transformer,且以解码器为主,所以无需过多调整模型架构即可适应其他序列模态。 最近,谷歌发布了一个统一的语音-文本模型AudioPaLM,将文本和音频的token合并为一个多模态…
-
田渊栋团队新研究:微调
在大家不断升级迭代自家大模型的时候,LLM(大语言模型)对上下文窗口的处理能力,也成为一个重要评估指标。 比如 OpenAI 的 gpt-3.5-turbo 提供 16k token 的上下文窗口选项,AnthropicAI 的更是将 Claude 处理 token 能力提升到 100k。大模型处理…
-
一句话搞定数据分析,浙大全新大模型数据助手,连搜集都省了
处理数据,用这一个ai工具就够了! 依靠背后的大语言模型(LLM),只需要用一句话描述自己想看的数据,其他统统交给它! 处理、分析,甚至可视化,都能轻松搞定,甚至连搜集也不用自己动手。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 图片 这…
-
字节团队提出猞猁Lynx模型:多模态LLMs理解认知生成类榜单SoTA
当前大语言模型 (Large Language Models, LLMs) 如 GPT4 在遵循给定图像的开放式指令方面表现出了出色的多模态能力。然而,这些模型的性能严重依赖于对网络结构、训练数据和训练策略等方案的选择,但这些选择并没有在先前的文献中被广泛讨论。此外,目前也缺乏合适的基准 (benc…
-
Open LLM榜单再次刷新,比Llama 2更强的「鸭嘴兽」来了
为了挑战 OpenAI 的 GPT-3.5 和 GPT-4 等封闭模型的主导地位,一系列开源模型正在崛起,其中包括 LLaMa、Falcon 等。最近,Meta AI 推出了被誉为开源领域最强大模型的 LLaMa-2,许多研究者也在此基础上构建自己的模型。例如,StabilityAI 利用 Orca…
-
美国法官裁定:人工智能创作的艺术作品不享有版权保护
据 The Hollywood Reporter 报道,美国联邦地区法院法官贝里尔・A・豪威尔周五裁定,AI 生成的艺术品无法获得版权保护。她审理了一起针对美国版权局的诉讼,原告斯蒂芬・塞勒(Stephen Thaler)使用他创造的创造力机器(Creativity Machine)算法制作了一幅 …
-
AI 竞赛再升级 谷歌推出 Gemini 2.5 Deep Think 模型
8 月 2 日,谷歌正式推出全新的 gemini 2.5 deep think 模型,标志着其在人工智能研发方向上的又一次重大跃进。此次发布意味着谷歌正逐步将重心从追求通用能力的广泛覆盖,转向更具深度的问题解决、复杂推理与系统性规划能力的构建。 与以往版本相比,Gemini 2.5 Deep Thi…
-
GPT-4:我写的代码你敢用吗?研究表明其API误用率超过62%
语言建模的新时代已经到来,大型语言模型(LLM)能力非凡,不仅能理解自然语言,甚至能根据用户需求生成定制代码。 因此,越来越多的软件工程师选择查询大型语言模型来解答编程问题,比如使用 API 来生成代码段或检测代码中的 bug。相比于搜索 Stack Overflow 等网络编程论坛,大型语言模型可…
-
1800亿参数,世界顶级开源大模型Falcon官宣!碾压LLaMA 2,性能直逼GPT-4
一夜之间,世界最强开源大模型Falcon 180B引爆全网! 1800亿参数,Falcon在3.5万亿token完成训练,直接登顶Hugging Face排行榜。 基准测试中,Falcon 180B在推理、编码、熟练度和知识测试各种任务中,一举击败Llama 2。 ☞☞☞AI 智能聊天, 问答助手,…
-
马毅教授新作:白盒ViT成功实现「分割涌现」,经验深度学习时代即将结束?
基于transformer的视觉基础模型在各种下游任务,如分割和检测中都展现出了非常强大的性能,并且dino等模型经过自监督训练后已经涌现出了语义的分割属性。 视觉Transformer模型经过有监督分类训练后,并没有出现类似的涌现能力,这一点令人感到奇怪 最近,马毅教授的团队研究了基于Transf…