qwen

  • Claude 4.5杀疯了!成本砍掉三分之二,连GPT都得靠边站?

    最近连续被gpt-5.1、gemini 3 pro持续刷屏,感觉anthropic再不刷点存在感,大家都忘记claude这个模型的存在了。这不claude opus 4.5新鲜出炉。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 其实总结下…

    2025年12月2日 科技
    100
  • 阿里7B多模态文档理解大模型拿下新SOTA

    多模态文档理解能力新sota! 阿里mPLUG团队发布最新开源工作mPLUG-DocOwl 1.5,针对高分辨率图片文字识别、通用文档结构理解、指令遵循、外部知识引入四大挑战,提出了一系列解决方案。 话不多说,先来看效果。 复杂结构的图表一键识别转换为Markdown格式: ☞☞☞AI 智能聊天, …

    2025年12月1日 科技
    100
  • UniWorld V2— 兔展智能联合北大推出的图像编辑模型

    UniWorld V2是什么 uniworld v2是由兔展智能与北京大学uniworld团队联合推出的全新一代图像编辑模型。该模型基于创新的uniworld-r1训练框架,首次将强化学习策略优化引入图像编辑领域,并借助diffusionnft技术实现高效训练。通过采用多模态大语言模型作为奖励机制,…

    2025年12月1日 科技
    000
  • 千问开源了哪些模型

    阿里通义千问(qwen)自2023年8月启动开源以来,已发布了覆盖多种参数规模、功能和模态的庞大模型系列,形成了全球领先的开源生态。其核心开源模型主要包括以下几个方向: 基础大语言模型 这是Qwen系列的核心,提供强大的通用语言理解与生成能力: Qwen3系列:2025年4月发布的新一代主力模型,包…

    2025年12月1日
    000
  • 【大模型学习】现代大模型架构(一): 组注意力机制(GQA)和 RMSNorm

    前言 ✍ 在大模型论文学习中,相信很多读者和笔者一样,一开始都会有一种感觉:“现在大模型架构都差不多,主要是数据和算力在堆积。”当笔者慢慢总结llama、qwen、deepseek这些模型架构的时候发现,在 attention、位置编码、ffn 与归一化 上,其实已经悄悄从经典 transforme…

    2025年12月1日 科技
    000
  • 淘天集团与爱橙科技合作发布开源大型模型训练框架Megatron-LLaMA

    9 月 12 日,淘天集团联合爱橙科技正式对外开源大模型训练框架 ——megatron-llama,旨在让技术开发者们能够更方便的提升大语言模型训练性能,降低训练成本,并且保持和 llama 社区的兼容性。测试显示,在 32 卡训练上,相比 huggingface 上直接获得的代码版本,megatr…

    2025年12月1日 科技
    100
  • 清华叉院、理想提出DriveVLM,视觉大语言模型提升自动驾驶能力

    在自动驾驶领域,研究人员也在朝着 gpt/sora 等大模型方向进行探索。 与生成式 AI 相比,自动驾驶也是近期 AI 最活跃的研究和开发领域之一。要想构建完全的自动驾驶系统,人们面临的主要挑战是 AI 的场景理解,这会涉及到复杂、不可预测的场景,例如恶劣天气、复杂的道路布局和不可预见的人类行为。…

    2025年12月1日 科技
    000
  • Qwen3发布当天,寒武纪已完成全系列支持

    4月29日,阿里qwen团队发布了8款新模型,qwen3系列正式上线并开源。 同日,寒武纪已完成对Qwen3全系列的支持。用户可以在寒武纪® AIDC® 大模型一体机上立即体验Qwen3系列的优势,包括增强的多模态能力,以及快思考/慢思考模式的切换。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜…

    2025年12月1日
    000
  • Xiaomi MiMo— 小米开源的首个推理大模型

    ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 天工大模型 中国首个对标ChatGPT的双千亿级大语言模型 115 查看详情 Xiaomi MiMo 是什么 xiaomi mimo 是小米推出的首个开源推理大模型,旨在提升模型在复杂推理任务中…

    2025年12月1日 科技
    100
  • 大模型开始打王者荣耀了

    大语言模型可以打王者荣耀了! 腾讯最新提出的Think-In-Games ( TiG ) 框架,直接把大模型丢进王者荣耀里训练。它不仅能实时理解盘面信息(英雄、发育、兵线、防御塔、资源、视野等),还能打出像人类玩家一样的操作。 更炸裂的是,靠着这种 ” 边玩边学 ” 的训练方…

    2025年12月1日 硬件教程
    000
关注微信