模型_第9页_创想鸟

「知识型图像问答」微调也没用？谷歌发布搜索系统AVIS：少样本超越有监督PALI，准确率提升三倍

在大型语言模型（LLM）的支持下，与视觉结合的多模态任务，例如图像描述、视觉问答（VQA）和开放词汇目标识别（open-vocabulary object detection）等方面都取得了显著的进展不过目前视觉语言模型（VLM）基本都只是利用图像内的视觉信息来完成任务，在inforseek和OK…

程序猿

2025年11月27日 • 用户投稿

0000

为防大模型作恶，斯坦福新方法让模型「遗忘」有害任务信息，模型学会「自毁」了

防止大%ign%ignore_a_1%re_a_1%作恶的新法子来了！这下即使模型开源了，想恶意使用模型的人也很难让大模型“作恶”。不信就来看这项研究。斯坦福研究人员最近提出了一种新方法对大模型使用附加机制进行训练后，可以阻止它对有害任务的适应。他们把通过此方法训练出的模型称为“自毁模型”。…

程序猿

2025年11月27日 • 用户投稿

1000

新标题：TextDiffuser：无惧图像中的文字，提供更高质量的文本渲染

在过去几年中，Text-to-Image 领域取得了巨大的进展，特别是在人工智能生成内容（AIGC）的时代。随着DALL-E模型的兴起，学术界涌现出越来越多的Text-to-Image模型，比如Imagen、Stable Diffusion、ControlNet等模型。然而，尽管Text-to-Im…

程序猿

2025年11月27日 • 用户投稿

0000

有了GPT-4之后，机器人把转笔、盘核桃都学会了

在学习方面，gpt-4 是一个厉害的学生。在消化了大量人类数据后，它掌握了各门知识，甚至在聊天中能给数学家陶哲轩带来启发。与此同时，它也成为了一名优秀的老师，而且不光是教书本知识，还能教机器人转笔。这个机器人名叫 Eureka，是来自英伟达、宾夕法尼亚大学、加州理工学院和得克萨斯大学奥斯汀分校的…

程序猿

2025年11月26日 • 用户投稿

0000

数学逻辑和计算机程序代码之间的深层联系：互为镜像

一些科学发现被赋予了重要的意义，因为揭示了一些新的东西，比如 DNA 的双螺旋结构或黑洞的存在。但是，揭示出的这些东西还具有更深远的意义，因为它们表明：两个之前看起来大不一样的老旧概念事实上却是一样的。比如詹姆斯・克拉克・麦克斯韦发现的方程组表明，电与磁是同一个现象的两个不同方面，而广义相对论则把引…

程序猿

用户投稿 2025年11月26日

0000

预测：Hugging Face CEO揭示2024年AI行业的六大重大变革！

2024年，AI行业将会进化成什么样？ OpenAI主席Greg Brockman曾经在去年最后一天预测：2023年会让2022年看起来像AI发展还没有苏醒一样。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 果然，2023年，AI行业迎来…

程序猿

2025年11月26日 • 用户投稿

1000

手机运行微软小模型胜过27亿参数的大模型

微软 CEO 纳德拉在 Ignite 大会上宣布，上个月，Phi-2 小尺寸模型将完全开源。这一举措将显著改进常识推理、语言理解和逻辑推理的性能 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 今天，微软公布了 Phi-2 模型的更多细节以及…

程序猿

2025年11月26日 • 用户投稿

0000

Mistral与微软合作为”小语言模型”带来革命，Mistral中杯代码能力超越GPT-4，成本降低2/3

近来，”小语言模型”突然成为热门话题本周一，刚刚完成4.15亿美元融资的法国AI初创公司Mistral，发布了Mixtral 8x7B模型。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 这个开源模型尽管尺寸不大，…

程序猿

2025年11月26日 • 用户投稿

1000

新一代注意力机制Lightning Attention-2：无限序列长度、恒定算力开销、更高建模精度

当前大语言模型的应用受到了序列长度限制的制约，这限制了其在人工智能领域中的应用。例如，在多轮对话、长文本理解和多模态数据处理与生成方面存在一定的挑战。造成这种限制的根本原因是目前大语言模型普遍采用的Transformer架构，其计算复杂度与序列长度呈二次关系。因此，随着序列长度的增加，计算资源的需求…

程序猿

2025年11月26日 • 用户投稿

0000