gemini

  • Gemini 2.0 Flash— Google推出的多模态 AI 模型

    Gemini 2.0 Flash是什么 gemini 2.0 flash是google推出的多模态ai模型,结合文本理解和图像生成能力。根据自然语言输入生成高质量的图像,支持多轮对话式的图像编辑,保持上下文连贯性。模型擅长将文本与图像结合,例如为故事生成连贯的插图、根据对话修改图像风格,用世界知识生…

    2025年11月5日 科技
    000
  • 英伟达团队发布最新具身模型 Cosmos-Reason1,在物理世界推理中碾压 Qwen、GPT-4o 等多个 VLM 模型

    英伟达 gtc 大会热度飙升。继黄仁勋在英伟达大会上发布基础世界模型 cosmos 引发业内讨论后,英伟达团队近日又发布了一个新的物理世界大模型:cosmos-reason1。 作为 Cosmos 系列的一个大模型,顾名思义,Cosmos-Reason1 更强调模型的“Reason”(即“推理”)能…

    2025年11月5日 科技
    100
  • AI-ClothingTryOn— AI虚拟试穿应用,支持生成多版本试衣效果

    ai-clothingtryon:你的虚拟试衣间 AI-ClothingTryOn是一款基于Python的桌面应用程序,利用Google Gemini AI技术,让你足不出户就能体验虚拟试衣的乐趣。只需上传人物照片和服装照片,AI-ClothingTryOn就能生成逼真的合成图像,展现你穿上服装的效…

    2025年11月5日 科技
    000
  • 谷歌深度学习专家 Dustin Tran 跳槽至 xAI

    AI领域迎来重磅人事变动:谷歌DeepMind核心人物Dustin Tran正式宣布加入埃隆·马斯克旗下的xAI团队,将专注于新一代Grok模型的研发。该消息一经其本人在社交平台发布,便迅速获得马斯克的转发确认,标志着这一关键人才引进已成事实。 作为Gemini项目自 inception 以来的核心…

    2025年11月5日 行业动态
    000
  • 字节跳动推出多语言翻译模型 Doubao-Seed-Translation

    近日,字节跳动旗下火山引擎正式发布自主研发的多语言翻译模型——Doubao-Seed-Translation,该模型支持数十种语言之间的互译。 据官方介绍,Doubao-Seed-Translation 在中英文翻译任务上的表现接近 Deepseek-R1 水准,而在通用多语言翻译能力方面,性能达到…

    2025年11月5日 行业动态
    100
  • Qwen3-LiveTranslate 发布:视、听、说全模态同传大模型

    阿里通义qwen团队近日发布全新力作——qwen3-livetranslate-flash,这是一款基于大语言模型的高性能多语言实时音视频同声传译模型,具备高精度、低延迟与强鲁棒性的核心优势。 依托于Qwen3-Omni强大的基础模型能力,结合海量多模态数据及百万小时级音视频训练资源,Qwen3-L…

    2025年11月5日 行业动态
    100
  • 最新研究:AI 已经能在几分钟内通过 CFA 最难级别考试

    纽约大学斯特恩商学院联合金融科技企业goodfin发布的最新研究指出,当前顶尖的推理型人工智能模型,如gemini 2.5 pro与claude opus 4,仅需几分钟即可在未经额外训练的情况下顺利通过cfa三级考试。部分领先ai的表现准确率甚至显著超出该考试的合格标准。 相比之下,人类考生通常需…

    2025年11月5日 行业动态
    000
  • Kimi和DeepSeek又又又撞车?

    ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 几个大模型初创企业里,kimi当下最为安静。 “(Kimi)最核心的任务就是提升留存,或者把留存作为一个重要的衡量指标” 去年11月,在Kimi上线一周年之际,创始人兼CEO杨植麟曾在一场小型沟…

    2025年11月5日 科技
    000
  • 蚂蚁武威:下一代「推理」模型范式大猜想

    r1 之后,长思维链成为研究下一代基础模型中 “推理”(reasoning)能力的热门方向。一方面,r1 证明了大模型深度思考的可行性;与此同时,尽管 r1 展现出了强大的性能,大模型推理的序幕实则才刚刚拉开。 此外,R1 在海外掀桌也给国内人工智能的研究带来一个显著影响,即:越来越多的研究者敢于站…

    2025年11月5日 科技
    000
  • 谷歌 I/O 2025 开发者大会即将开始 Android 16 将亮相

    谷歌 i/o 2025 年度开发者大会定于 5 月 20 日在美国加利福尼亚州山景城的 shoreline 露天剧场拉开帷幕,活动为期两天,主要聚焦于谷歌最新的软件技术创新。开幕主题演讲将在太平洋时间 5 月 20 日上午 10 点(东部时间下午 1 点)启动,预计时长约两小时。 今年的大会将以人工…

    2025年11月5日 硬件教程
    000
关注微信