qwen
-
AI大模型实时投资比赛“Alpha Arena”落幕,阿里千问Qwen夺冠
近日,一场备受瞩目的ai大模型实时投资比赛“alpha arena”正式落下帷幕。在这场集合了全球六大顶尖模型的特殊竞赛中,来自中国的阿里千问qwen,最终以绝对优势夺得了冠军。 据悉,该竞赛由第三方机构Nof1于10月18日发起,为每个参赛的AI模型提供了1万美元的初始资金,让它们在真实的金融市场…
-
东软集团:“领智”智能体应用开发平台全面支持DeepSeek
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 东软集团近日宣布,“领智”智能体应用开发平台已与DeepSeek大模型实现全面适配。此举标志着东软智能化战略取得重要进展,将进一步提升任务规划、流程优化和解决方案效率,并在政务、医疗等多个领域广…
-
最强全模态模型Ola-7B横扫图像、视频、音频主流榜单,腾讯混元Research&清华&NTU联手打造
ola:一款性能卓越的全模态语言模型,超越现有同类模型! ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ AIxiv专栏持续报道全球顶尖AI研究成果,如果您有优秀工作,欢迎投稿或联系报道 (liyazhou@jiqizhixin.com; z…
-
游戏显卡跑AI大模型?使用MTT S80解锁DeepSeek R1蒸馏模型本地推理
颠覆想象:游戏显卡也能轻松驾驭ai! MTT S80强势证明: “游戏与AI,我全都要!” 摩尔线程MTT S80“全功能”图形显卡,不仅能流畅运行大型游戏,例如《黑神话:悟空》,更能本地部署DeepSeek R1蒸馏模型!借助最新MUSA SDK RC3.1.1版本和开源框架Ollama,开发者和…
-
OmniTalker— 阿里推出的实时文本驱动说话头像生成框架
阿里巴巴推出的omnitalker,是一款基于实时文本驱动的说话头像生成技术。它能够流畅处理文本、图像、音频和视频等多种模态信息,并以流式方式生成自然逼真的语音回应。其核心架构为thinker-talker架构,thinker模块负责多模态输入的处理和语义理解,生成文本内容和高维语义表达;talke…
-
Llama 4 刷榜作弊引热议,20 万显卡集群就做出了个这?
昨天一早,meta 了放出自家用了 20 万显卡集群训练出的 llama 4 系列模型,其中包括 llama 4 scout、llama 4 maverick 和 llama 4 behemoth。消息一出,直接引爆了大模型圈。 Meta 还特意强调,这些模型都经过了大量未标注的文本、图像和视频数据…
-
ChatTS-14B— 字节开源的时间序列理解和推理大模型
ChatTS-14B是什么 chatts-14b 是字节跳动研究团队开源的专注于时间序列理解和推理的大型语言模型,参数量达 140 亿。基于 qwen2.5-14b-instruct 微调而成,通过合成数据对齐技术显著提升了在时间序列任务中的表现。模型支持自然语言交互,用户可以通过简单的指令完成对时…
-
摩尔线程GPU率先支持Qwen3全系列模型
4月29日,阿里云正式推出了qwen3系列的8款开源混合推理模型。摩尔线程团队在发布当天便率先完成了对qwen3全系列模型在全功能gpu上的高效支持。这一成就充分展示了musa架构以及全功能gpu在生态兼容性和快速支持能力上的卓越表现。musa架构因其出色的易用性,不仅大大减少了开发者在适配和迁移过…
-
Qwen3— 阿里通义开源的新一代混合推理模型系列
qwen3 是阿里巴巴推出的新一代大型语言模型,具备“思考模式”和“非思考模式”两种工作方式。思考模式适合处理复杂问题,模型会逐步推理后给出答案;非思考模式则提供快速、近乎即时的响应,适合简单问题。qwen3 支持 119 种语言和方言,相比之前的 29 种语言,语言能力有了显著提升。此外,qwen…
-
Qwen2.5-Omni-3B— 阿里 Qwen 团队推出的轻量级多模态 AI 模型
qwen2.5-omni-3b 是由阿里巴巴 qwen 团队推出的一款轻量级多模态 ai 模型。它是 qwen2.5-omni-7b 的精简版本,专门为消费级硬件设计,支持文本、音频、图像和视频等多种输入功能。参数量从 7b 减少到 3b,但仍能保持 7b 模型 90% 以上的多模态性能,尤其在实时…