claude
-
田渊栋团队新研究:微调
在大家不断升级迭代自家大模型的时候,LLM(大语言模型)对上下文窗口的处理能力,也成为一个重要评估指标。 比如 OpenAI 的 gpt-3.5-turbo 提供 16k token 的上下文窗口选项,AnthropicAI 的更是将 Claude 处理 token 能力提升到 100k。大模型处理…
-
OpenAI最新研究表明 当前AI模型仍无法媲美人类程序员
openai 最新研究表明:ai 编程能力仍逊于人类程序员,即使是最先进的模型也无法胜任大多数编程任务。 OpenAI CEO 萨姆·奥尔特曼曾预测,AI 模型将在年底超越“低级别”软件工程师。然而,OpenAI 研究人员近期发表的论文却挑战了这一说法。研究人员使用名为 SWE-Lancer 的新基…
-
Anthropic 发布更强大的 AI 模型 Claude Instant 1.2
it之家 8 月 12 日消息,anthropic 近日发布博文,正式推出 claude instant 1.2 ai 模型,并已经向企业提供 api 访问。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ Anthropic 公司表示,Cl…
-
Claude 2.1 如何上传并分析超大PDF文档?实测教程
claude 2.1 处理超大 pdf 文档的关键在于分块处理。1. 首先使用工具如 pypdf2 将大 pdf 分割为小文件,每个文件不超过 100 页;2. 然后逐个上传至 claude 2.1 或通过 api 自动化分析;3. 整合各片段的分析结果,并根据需要进行定制化汇总;4. 若文档含扫描…
-
解析大型模型的可解释性:综述揭示真相,解答疑惑
大规模语言模型在自然语言处理方面展现出令人惊讶的推理能力,但其内在机理尚不清晰。随着大规模语言模型的广泛应用,阐明模型的运行机制对应用安全性、性能局限性和可控的社会影响至关重要。 近期,中美多家研究机构(新泽西理工学院、约翰斯・霍普金斯大学、维克森林大学、佐治亚大学、上海交大、百度等)联合发布了大模…
-
Kimi Chat内测启动,火山引擎提供加速解决方案,支持Moonshot AI大模型服务的训练和推理
10月9日,北京月之暗面科技有限公司(moonshot ai)宣布在“长文本”领域实现了突破,推出了首个支持输入20万汉字的智能助手产品kimi chat。这是目前全球市场上能够产品化使用的大模型服务中所能支持的最长上下文输入长度,标志着moonshot ai在这一重要技术上取得了世界领先水平。 火…
-
商汤商量获SuperCLUE9月评测总榜子榜双第一,AI智能体方向受瞩目
最近,superclue发布了9月份的总排行榜和各个分类任务榜单,商汤的sensechat 3.0在中文大模型总榜中排名第一。在新增的ai agent(ai智能体)子榜中,sensechat 3.0同样位居第一,超过了所有国内中文大模型以及gpt-3.5和claude 2,仅次于gpt-4的表现。这…
-
用这个方法,谁都可以刷到leetcode排名第一(可复制)
前几天,有人分享了一个利用gpt在leetcode刷题,学习算法,启迪思路,提升编程能力的方法。 开始还不信,自己试了一下,惊了!AI理解问题,编码解决问题的能力现在已经这么流弊了吗? ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 在lee…
-
斯坦福大学发布AI基础模型透明度指标,Llama 2居首但“不及格”
it之家 10 月 20 日消息,斯坦福大学日前发布了 ai 基础模型“透明度指标”,其中显示指标最高的是 meta 的 lama 2,但相关“透明度”也只有 54%,因此研究人员认为,市面上几乎所有 ai 模型,都“缺乏透明度”。 据悉,这一研究是由 HAI 基础模型研究中心(CRFM)的负责人 …
-
GLM-4.5— 智谱推出的面向推理、代码与智能体的开源 SOTA 模型
GLM-4.5是什么 glm-4.5 是智谱推出的新一代旗舰模型,专为智能体应用打造,是首款原生融合推理、代码和智能体能力的开源 sota 模型。采用混合专家(moe)架构,有两个版本:glm-4.5(3550 亿参数,320 亿激活)和 glm-4.5-air(1060 亿参数,120 亿激活)。…