模型_第18页

“中国人民大学研究员卢志武提出ChatGPT对多模态生成模型的重要影响”

天工大模型中国首个对标ChatGPT的双千亿级大语言模型 115 查看详情以下为卢志武教授在机器之心举办的 ChatGPT 及大模型技术大会上的演讲内容，机器之心进行了不改变原意的编辑、整理： ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜…

程序猿

2025年11月9日 • 用户投稿

2000

谷歌将视觉迁移模型参数扩展到220亿，自ChatGPT火爆后研究者集体行动

与自然语言处理类似，对预训练视觉主干的迁移提高了模型在各种视觉任务上的性能。更大的数据集、可扩展的架构和新的训练方法都推动了模型性能的提升。然而，视觉模型仍然远远落后于语言模型。具体来说，迄今为止最大的视觉模型 ViT 只有 4B 参数，而入门级语言模型通常超过 10B 参数，更别说具有 540B…

程序猿

2025年11月9日 • 用户投稿

1000

谷歌下场优化扩散模型，三星手机运行Stable Diffusion，12秒内出图

Stable Diffusion 在图像生成领域的知名度不亚于对话大模型中的 ChatGPT。其能够在几十秒内为任何给定的输入文本创建逼真图像。由于 Stable Diffusion 的参数量超过 10 亿，并且由于设备上的计算和内存资源有限，因而这种模型主要运行在云端。在没有精心设计和实施的情况…

程序猿

2025年11月9日 • 用户投稿

1000

MiniGPT-4看图聊天、还能草图建网站；视频版Stable Diffusion来了

目录 Align your Latents: High-Resolution Video Synthesis with Latent Diffusion Models MiniGPT-4:Enhancing Vision-language Understanding with Advanced La…

程序猿

2025年11月9日 • 用户投稿

0000

有事您说话！谷歌机器人「吃了」语言大模型后，会自学和思考了

「上得厅堂，下得厨房」，这句对理想型贤内助的赞许，以后很可能要对谷歌的机器人说了。自带大型语言模型，会自学的机器人，见过吗？不会做？可以学！现在不会没关系，过一会儿学完了就会了。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 比起…

程序猿

2025年11月9日 • 用户投稿

1000

逆转特征让re-id模型从88.54%到0.15%

这篇文章初版2018年5月就写好了，最近2022年12月才中。四年中得到了老板们的很多支持和理解。（这段经历也希望给在投稿的同学们一点鼓舞，paper写好肯定能中的，不要轻易放弃！） arXiv早期版本为：Query Attack via Opposite-Direction Feature:To…

程序猿

2025年11月9日 • 用户投稿

4000

大语言模型的进化树，这是一份超详细ChatGPT「食用」指南

而在实际探索的过程中，实践者可能会苦于寻找适合自己应用的 AI 模型：是选择 LLM 还是微调模型？如果用 LLM，又该选择哪一种？近日，来自亚马逊、德州农工大学、莱斯大学等机构的学者对 ChatGPT 等语言模型的发展历程进行了一番讨论，其文章也得到了 Yann LeCun 的转推。 ☞☞☞AI…

程序猿

2025年11月9日 • 用户投稿

0000

UC伯克利发布大语言模型排行榜！Vicuna夺冠，清华ChatGLM进前5

最近，来自LMSYS Org（UC伯克利主导）的研究人员又搞了个大新闻——大语言模型版排位赛！顾名思义，「LLM排位赛」就是让一群大语言模型随机进行battle，并根据它们的Elo得分进行排名。然后，我们就能一眼看出，某个聊天机器人到底是「嘴强王者」还是「最强王者」。划重点：团队还计划把国内和…

程序猿

2025年11月9日 • 用户投稿

2000

生成多语种文本与图片的全能工具AltDiffusion-m18

当前，非英文文图生成模型选择有限，用户往往要将 prompt 翻译成英语再输入模型。这样不仅会造成额外的操作负担，并且翻译过程中的语言文化误差，会影响生成图片的准确性。智源研究院 FlagAI 团队首创高效训练方式，使用多语言预训练模型和 Stable Diffusion 结合，训练多语言文图生成…

程序猿

2025年11月9日 • 用户投稿

4000