模型_第22页

谷歌AudioPaLM实现「文本+音频」双模态解决，说听两用大模型

大型语言模型以其强大的性能及通用性，带动了一批多模态的大模型开发，如音频、视频等。语言模型的底层架构大多是基于Transformer，且以解码器为主，所以无需过多调整模型架构即可适应其他序列模态。最近，谷歌发布了一个统一的语音-文本模型AudioPaLM，将文本和音频的token合并为一个多模态…

程序猿

2025年11月9日 • 用户投稿

6000

田渊栋团队新研究：微调

在大家不断升级迭代自家大模型的时候，LLM（大语言模型）对上下文窗口的处理能力，也成为一个重要评估指标。比如 OpenAI 的 gpt-3.5-turbo 提供 16k token 的上下文窗口选项，AnthropicAI 的更是将 Claude 处理 token 能力提升到 100k。大模型处理…

程序猿

2025年11月9日 • 用户投稿

2000

一句话搞定数据分析，浙大全新大模型数据助手，连搜集都省了

处理数据，用这一个ai工具就够了！依靠背后的大语言模型（LLM），只需要用一句话描述自己想看的数据，其他统统交给它！处理、分析，甚至可视化，都能轻松搞定，甚至连搜集也不用自己动手。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 图片这…

程序猿

2025年11月9日 • 用户投稿

2000

字节团队提出猞猁Lynx模型：多模态LLMs理解认知生成类榜单SoTA

当前大语言模型 (Large Language Models, LLMs) 如 GPT4 在遵循给定图像的开放式指令方面表现出了出色的多模态能力。然而，这些模型的性能严重依赖于对网络结构、训练数据和训练策略等方案的选择，但这些选择并没有在先前的文献中被广泛讨论。此外，目前也缺乏合适的基准 (benc…

程序猿

2025年11月9日 • 用户投稿

3000

Open LLM榜单再次刷新，比Llama 2更强的「鸭嘴兽」来了

为了挑战 OpenAI 的 GPT-3.5 和 GPT-4 等封闭模型的主导地位，一系列开源模型正在崛起，其中包括 LLaMa、Falcon 等。最近，Meta AI 推出了被誉为开源领域最强大模型的 LLaMa-2，许多研究者也在此基础上构建自己的模型。例如，StabilityAI 利用 Orca…

程序猿

2025年11月9日 • 用户投稿

1000

用户投稿

美国法官裁定：人工智能创作的艺术作品不享有版权保护

据 The Hollywood Reporter 报道，美国联邦地区法院法官贝里尔・A・豪威尔周五裁定，AI 生成的艺术品无法获得版权保护。她审理了一起针对美国版权局的诉讼，原告斯蒂芬・塞勒（Stephen Thaler）使用他创造的创造力机器（Creativity Machine）算法制作了一幅 …

程序猿

2025年11月8日

1000

AI 竞赛再升级谷歌推出 Gemini 2.5 Deep Think 模型

8 月 2 日，谷歌正式推出全新的 gemini 2.5 deep think 模型，标志着其在人工智能研发方向上的又一次重大跃进。此次发布意味着谷歌正逐步将重心从追求通用能力的广泛覆盖，转向更具深度的问题解决、复杂推理与系统性规划能力的构建。与以往版本相比，Gemini 2.5 Deep Thi…

程序猿

2025年11月8日 • 用户投稿

0000

GPT-4：我写的代码你敢用吗？研究表明其API误用率超过62%

语言建模的新时代已经到来，大型语言模型（LLM）能力非凡，不仅能理解自然语言，甚至能根据用户需求生成定制代码。因此，越来越多的软件工程师选择查询大型语言模型来解答编程问题，比如使用 API 来生成代码段或检测代码中的 bug。相比于搜索 Stack Overflow 等网络编程论坛，大型语言模型可…

程序猿

2025年11月8日 • 用户投稿

18000

1800亿参数，世界顶级开源大模型Falcon官宣！碾压LLaMA 2，性能直逼GPT-4

一夜之间，世界最强开源大模型Falcon 180B引爆全网！ 1800亿参数，Falcon在3.5万亿token完成训练，直接登顶Hugging Face排行榜。基准测试中，Falcon 180B在推理、编码、熟练度和知识测试各种任务中，一举击败Llama 2。 ☞☞☞AI 智能聊天, 问答助手,…

程序猿

2025年11月8日 • 用户投稿

1000