llama

  • 基于LLaMA却改张量名,李开复公司大模型引争议,官方回应来了

    前段时间,开源大模型领域迎来了一个新的模型 —— 上下文窗口大小突破 200k,能一次处理 40 万汉字的「Yi」。 创新工场董事长兼 CEO 李开复创立了大模型公司「零一万物」,并且构建了这个大模型,其中包括了 Yi-6B 和 Yi-34B 两个版本 根据 Hugging Face 英文开源社区平…

    2025年11月8日 科技
    000
  • 安卓新机差异化技术优势核心卖点,骁龙8Gen3带来生成式AI新玩法

    高通最近发布了最新一代旗舰处理器骁龙8gen3。这款处理器以其强大的性能和出色的能效表现而备受关注,成为众多安卓手机制造商选用的新一代旗舰机型专用处理器 作为半导体行业的领军企业,高通一直致力于为安卓智能手机提供个性化解决方案。多年来,骁龙系列手机处理器凭借卓越的性能、出色的功效表现以及卓越的用户体…

    2025年11月8日 科技
    000
  • 微软发布 Windows AI Studio,在 Win11 上简化开发 AI 应用体验

    it之家 11 月 16 日消息,微软在今天开幕的 ignite 2023 大会中,面向开发者推出了全新的 “windows ai studio”体验,在 win11 系统上可以简化、加速 ai 应用的开发工作。 IT之家翻译微软官方对 “Windows AI Studio” 工具的介绍如下:微软官…

    2025年11月8日 科技
    100
  • 一招分辨刷榜作弊大模型,博士小哥开源AI数学“照妖镜”

    如今很多大模型都声称擅长数学,谁有真才实学?谁是靠背测试题“作弊”的? 今年,有人在匈牙利全国数学期末考试刚刚公布的题目上进行了一次全面测试 很多模型一下子就“现原形”了。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 先看绿色部分,这些大…

    2025年11月8日 科技
    200
  • 首个支持4-bit浮点量化的LLM来了,解决LLaMA、BERT等的部署难题

    大语言模型 (LLM) 压缩一直备受关注,后训练量化(Post-training Quantization) 是其中一种常用算法,但是现有 PTQ 方法大多数都是 integer 量化,且当比特数低于 8 时,量化后模型的准确率会下降非常多。想较于 Integer (INT) 量化,Floating…

    2025年11月8日 科技
    100
  • 英特尔 Arc Alchemist 驱动更新,AI 图像生成性能迎来大幅提升

    it之家 11 月 20 日消息,在 microsoft ignite 开发者大会上,英特尔和微软宣布将合作对英特尔 arc 图形解决方案的 directml 进行优化。 根据实验结果显示,英特尔在更新Arc Alchemist驱动程序后,在AI图像生成器Stable Diffusion中实现了2.…

    2025年11月8日 科技
    100
  • 青云QingCloud超融合推出“云易捷AI一体机”助力企业实施AIGC方

    【techweb】10月31日消息,青云科技近日推出“云易捷”系列新产品和服务,突出云原生、ai能力和信创能力。 青云云易捷产品线已经成功推出了5款产品,包括云易捷超融合、云易捷一体机、云易捷AI一体机、信创云易捷和云易捷虚拟化。这些产品已经成功地为医疗、金融、工业制造、教育等各行业的客户提供了服务…

    2025年11月8日 科技
    400
  • 新标题:Meta改进Transformer架构:强化推理能力的新注意力机制

    大型语言模型(LLM)的强大已经是不容置疑的事实,然而它们有时仍然会犯一些简单的错误,显示出推理能力较弱的一面 举个例子,LLM 可能会因为不相关的上下文或者输入提示中固有的偏好或意见而做出错误的判断。后一种情况表现出的问题被称为「阿谀奉承」,即模型与输入保持一致 是否有任何方法可以缓解这类问题呢?…

    2025年11月8日 科技
    100
  • 亚马逊AWS与微软将在GenAI领域展开竞争

    ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 周一接受venturebeat采访时,亚马逊aws数据与人工智能副总裁斯瓦米·西瓦苏布拉曼尼亚表示,他负责监管aws所有的数据库、分析、机器学习和人工智能服务,并简述了周三上午的主旨演讲和周二上…

    2025年11月8日 科技
    100
  • 使用工具包可将大型模型推理性能提升40倍

    英特尔® Extension for Transformer是什么? 英特尔® Extension for Transformers[1]是英特尔推出的一个创新工具包,可基于英特尔® 架构平台,尤其是第四代英特尔® 至强® 可扩展处理器(代号Sapphire Rapids[2],SPR)显著加速基于…

    2025年11月8日 科技
    000
关注微信