gemini_第96页

Gemini 2.0 Flash— Google推出的多模态 AI 模型

Gemini 2.0 Flash是什么 gemini 2.0 flash是google推出的多模态ai模型，结合文本理解和图像生成能力。根据自然语言输入生成高质量的图像，支持多轮对话式的图像编辑，保持上下文连贯性。模型擅长将文本与图像结合，例如为故事生成连贯的插图、根据对话修改图像风格，用世界知识生…

程序猿

2025年11月5日 • 用户投稿

0000

英伟达团队发布最新具身模型 Cosmos-Reason1，在物理世界推理中碾压 Qwen、GPT-4o 等多个 VLM 模型

英伟达 gtc 大会热度飙升。继黄仁勋在英伟达大会上发布基础世界模型 cosmos 引发业内讨论后，英伟达团队近日又发布了一个新的物理世界大模型：cosmos-reason1。作为 Cosmos 系列的一个大模型，顾名思义，Cosmos-Reason1 更强调模型的“Reason”（即“推理”）能…

程序猿

2025年11月5日 • 用户投稿

1000

AI-ClothingTryOn— AI虚拟试穿应用，支持生成多版本试衣效果

ai-clothingtryon：你的虚拟试衣间 AI-ClothingTryOn是一款基于Python的桌面应用程序，利用Google Gemini AI技术，让你足不出户就能体验虚拟试衣的乐趣。只需上传人物照片和服装照片，AI-ClothingTryOn就能生成逼真的合成图像，展现你穿上服装的效…

程序猿

2025年11月5日 • 用户投稿

0000

谷歌深度学习专家 Dustin Tran 跳槽至 xAI

AI领域迎来重磅人事变动：谷歌DeepMind核心人物Dustin Tran正式宣布加入埃隆·马斯克旗下的xAI团队，将专注于新一代Grok模型的研发。该消息一经其本人在社交平台发布，便迅速获得马斯克的转发确认，标志着这一关键人才引进已成事实。作为Gemini项目自 inception 以来的核心…

程序猿

2025年11月5日 • 用户投稿

0000

字节跳动推出多语言翻译模型 Doubao-Seed-Translation

近日，字节跳动旗下火山引擎正式发布自主研发的多语言翻译模型——Doubao-Seed-Translation，该模型支持数十种语言之间的互译。据官方介绍，Doubao-Seed-Translation 在中英文翻译任务上的表现接近 Deepseek-R1 水准，而在通用多语言翻译能力方面，性能达到…

程序猿

2025年11月5日 • 用户投稿

1000

Qwen3-LiveTranslate 发布：视、听、说全模态同传大模型

阿里通义qwen团队近日发布全新力作——qwen3-livetranslate-flash，这是一款基于大语言模型的高性能多语言实时音视频同声传译模型，具备高精度、低延迟与强鲁棒性的核心优势。依托于Qwen3-Omni强大的基础模型能力，结合海量多模态数据及百万小时级音视频训练资源，Qwen3-L…

程序猿

2025年11月5日 • 用户投稿

1000

最新研究：AI 已经能在几分钟内通过 CFA 最难级别考试

纽约大学斯特恩商学院联合金融科技企业goodfin发布的最新研究指出，当前顶尖的推理型人工智能模型，如gemini 2.5 pro与claude opus 4，仅需几分钟即可在未经额外训练的情况下顺利通过cfa三级考试。部分领先ai的表现准确率甚至显著超出该考试的合格标准。相比之下，人类考生通常需…

程序猿

2025年11月5日 • 用户投稿

0000

Kimi和DeepSeek又又又撞车？

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 几个大模型初创企业里，kimi当下最为安静。 “（Kimi）最核心的任务就是提升留存，或者把留存作为一个重要的衡量指标” 去年11月，在Kimi上线一周年之际，创始人兼CEO杨植麟曾在一场小型沟…

程序猿

2025年11月5日 • 用户投稿

0000

蚂蚁武威：下一代「推理」模型范式大猜想

r1 之后，长思维链成为研究下一代基础模型中 “推理”（reasoning）能力的热门方向。一方面，r1 证明了大模型深度思考的可行性；与此同时，尽管 r1 展现出了强大的性能，大模型推理的序幕实则才刚刚拉开。此外，R1 在海外掀桌也给国内人工智能的研究带来一个显著影响，即：越来越多的研究者敢于站…

程序猿

2025年11月5日 • 用户投稿

0000

谷歌 I/O 2025 开发者大会即将开始 Android 16 将亮相

谷歌 i/o 2025 年度开发者大会定于 5 月 20 日在美国加利福尼亚州山景城的 shoreline 露天剧场拉开帷幕，活动为期两天，主要聚焦于谷歌最新的软件技术创新。开幕主题演讲将在太平洋时间 5 月 20 日上午 10 点（东部时间下午 1 点）启动，预计时长约两小时。今年的大会将以人工…

程序猿

2025年11月5日 • 用户投稿

0000