claude
-
通义灵码上线Qwen3-Coder,免费使用不限量
7月26日,阿里云宣布其通义灵码正式推出全新ai编程模型qwen3-coder。该模型在真实的企业级开发环境中表现出色,代码生成速度与准确率均有显著提升,并进一步优化了agent协同编程能力。即日起,用户可通过通义灵码ai ide、vscode及jetbrains插件端免费使用该功能,且无使用量限制…
-
用LLaVA解读数万神经元,大模型竟然自己打开了多模态智能黑盒
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢…
-
超越OpenAI、Meta,阿里千问API调用量跃居全球第四
7月28日消息,全球知名的大模型api三方聚合平台openrouter发布了最新一期榜单,中国的deepseek与阿里通义千问成功进入全球前五。其中,阿里旗下的通义千问以10.4%的市场份额,超过openai的4.7%,排名升至第四位。 据悉,OpenRouter汇聚了全球顶尖的各类大模型,无论是开…
-
智源发布FlagEval「百模」评测结果,丈量模型生态变局
智源研究院发布2024年下半年大模型评测结果,评估涵盖100余个开源及闭源模型。此次评测在5月份评估基础上,扩展了任务类型,新增数据处理、高级编程、工具调用及金融量化交易场景评估等;并首次采用模型辩论方式进行对比评估。 评测结果显示,下半年大模型发展更注重综合能力提升及实际应用。多模态模型发展迅速,…
-
突破数据瓶颈!交大研发电脑智能体,让 AI 替你熬夜做 PPT
上海交通大学gair实验室研发pc agent:让ai帮你完成深夜ppt制作 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 成品ppt在线生成,百种模板可供选择☜☜☜☜☜点击使用; 深夜需要准备第二天论文分享的PPT?有了上海交通大学GAI…
-
阿里模型三连发重磅亮相世界人工智能大会,全栈 AI 为开源开放提速
本周,阿里巴巴接连推出三款重量级大模型,迅速包揽基础模型、编程模型与推理模型三大主流领域的全球开源榜首。最新发布的千问3非思考版基础模型,被国际权威AI研究机构Artificial Analysis评为“全球最智能的非思考型基础模型”;千问3推理模型性能媲美顶尖闭源模型Gemini 2.5 Pro与…
-
Kimi 数理化能跟 o1 掰手腕了?新模型 k1 有点儿强
「创想鸟(公众号:创想鸟)消息」今天,月之暗面官方宣布:继 11 月 16 日发布数学模型 k0-math 后,他们又推出了新的视觉思考模型 k1,且「数理化」的能力又上了一个新台阶,实测结果丝毫不输 openai o1! 最直接的实测例子是:当我们把杨振宁、伽利略等世界知名科学家的研究手稿拍照、上…
-
强如 GPT-4,也未通过伯克利与斯坦福共同设计的这项“剧本杀”测试
一项最新研究表明,即使是最先进的大语言模型 (llm) 也难以始终如一地遵循人类设定的规则。加州大学伯克利分校、斯坦福大学、ai安全中心 (cais) 和阿卜杜勒阿齐兹国王科技城 (kacst) 的研究人员开发了一个名为 rules 的基准测试框架,以编程方式评估 llm 遵循规则的能力。 ☞☞☞A…
-
a16z 最新 AI 报告:移动端 Top50 的应用中 22 款由中国开发
根据风险投资公司 andreessen horowitz 最新发布的一份专注于消费者 ai 领域的新报告, chatgpt 的竞争对手,如谷歌的 gemini、xai 的 grok 以及 meta ai,正在缩小与 chatgpt 的差距。 该报告已是第五次发布。14 家公司第五次出现在顶级 AI …
-
游戏结束了?OpenAI可能已经突破,跨过起飞的最后临界阈值
openai 的 ai 是否已达到自我递归改进的程度?近期 x 平台上的一篇帖子引发热议,浏览量超过 30 万。该帖指出 openai 的递归式自我改进技术已取得突破性进展,其能力已封装在一个难以破解的系统中。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek …