Granite 4.0 Tiny Preview— IBM推出的语言模型

程序猿 • 2025年11月4日 06:44:11 • 科技 • 阅读 0

granite 4.0 tiny preview 是 ibm 发布的 granite 4.0 语言模型系列中最小的模型的预览版本。该模型以其高效的计算能力和紧凑的结构为特色，能够在消费级 gpu 上运行多个长上下文（128k）任务，其性能接近 granite 3.3 2b instruct，同时内存需求减少了约 72%。granite 4.0 tiny preview 采用创新的混合 mamba-2/transformer 架构，结合了 mamba 的高效性和 transformer 的精确性，支持无位置编码（nope），能够处理极长的上下文长度。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

Granite 4.0 Tiny Preview 的主要功能包括：

高效运行：在消费级 GPU 上，能够同时运行多个长上下文（128K）任务，适合资源有限的开发者。低内存需求：内存需求减少约 72%，推理时仅激活 1B 参数（总参数 7B），大幅降低硬件要求。长上下文处理：支持无位置编码（NoPE），已验证能处理至少 128K 的长上下文。推理效率：推理时仅激活部分专家，提升效率、减少延迟。

Granite 4.0 Tiny Preview 的技术原理包括：

百川大模型

百川智能公司推出的一系列大型语言模型产品

62 查看详情 混合架构：结合 Mamba 的线性计算复杂度（适合长序列）和 Transformer 的精确自注意力机制。模型中 9 个 Mamba 块对应 1 个 Transformer 块，Mamba 块负责高效捕获全局上下文，Transformer 块用于解析局部上下文。混合专家（MoE）：模型包含 7B 参数，分为 64 个专家，推理时仅激活 1B 参数，大幅减少计算资源消耗。无位置编码（NoPE）：摒弃传统的位置编码技术，避免因位置编码带来的计算负担和对长序列的限制，保持长上下文性能。长上下文优化：基于 Mamba 的线性扩展能力和紧凑的模型设计，支持极长上下文长度，理论上能扩展至硬件极限。

Granite 4.0 Tiny Preview 的项目地址包括：

项目官网：https://www.php.cn/link/aa2c6857a88b778501aa2d51ae3ccadeHuggingFace 模型库：https://www.php.cn/link/7c581b412887d3ddcf188128ec7d7cd5

Granite 4.0 Tiny Preview 的应用场景包括：

边缘设备部署：适合在资源有限的边缘设备或消费级硬件上运行，用于轻量级文本处理任务。长文本分析：能够处理长上下文（128K tokens），适用于长文本生成、分析或摘要。多任务并行：在同一硬件上同时运行多个实例，适合批量处理或多用户场景。企业应用开发：用于智能客服、文档处理等企业级任务，提供高效的语言模型支持。低成本研发：开源且支持消费级硬件，方便开发者低成本实验和创新。

以上就是Granite 4.0 Tiny Preview— IBM推出的语言模型的详细内容，更多请关注创想鸟其它相关文章！

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 chuangxiangniao@163.com 举报，一经查实，本站将立刻删除。
发布者：程序猿，转转请注明出处：https://www.chuangxiangniao.com/p/254557.html

打赏

微信扫一扫

支付宝扫一扫

0 0

关于作者

程序猿签约作者

414.1K 文章

0 评论

2 粉丝

这个人很懒，什么都没有留下～

ai人工智能软件排行榜单国内免费人工智能ai软件前十推荐

上一篇 2025年11月4日 06:43:30

Gemini 2.5 Pro (I/O 版)— 谷歌推出的升级版多模态AI模型

下一篇 2025年11月4日 06:48:11

Microsoft Teams如何使用录制转录 Microsoft Teams会议纪要的生成技术

主持人开启Teams会议录制，系统自动提示参会者；2. 录制内容保存至OneDrive或SharePoint；3. 后台自动转录音频生成带时间戳的文字记录；4. 支持多语言识别与关键词搜索；5. 转录文本可导入Word或OneNote，结合AI提取行动项；6. 通过Power Automate实现纪…

程序猿
2025年12月6日 • 科技
3000
AI推文助手如何制作品牌宣言 AI推文助手的品牌价值表达指南

明确品牌核心定位，梳理初衷、受众与独特价值；构建情感共鸣语句，使用积极语言与场景化描述；优化AI提示词，提供背景与风格指令；多轮迭代测试，收集反馈并调整发布。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 如果您希望借助AI推文助手清晰传达…

程序猿
2025年12月6日 • 科技
0000
Microsoft Teams如何设置访客权限 Microsoft Teams外部协作的安全管理

首先登录Microsoft 365管理中心启用Teams访客访问功能，接着在Azure AD中配置目录范围与信息可见性限制，最后通过敏感度标签、审核日志、DLP策略及文件共享设置实施沟通与内容安全管控，实现外部协作的安全管理。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 D…

程序猿
2025年12月6日 • 科技
0000
巧文书AI官方网址入口最新巧文书AI智能文本生成官网直达首页

巧文书AI官网为https://www.qiaowenshu.com，该平台基于大模型与知识图谱技术，支持招标文件智能解析、企业知识库复用及百万字标书生成，具备合规审查、图文融合与私有化部署能力，服务超500家企业，覆盖政务、能源、建筑等多个行业。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索…

程序猿
2025年12月6日 • 科技
0000
AI推文助手如何生成促销活动文案 AI推文助手的促销内容优化策略

明确促销核心卖点、设定受众语言风格、采用高转化结构、结合热点话题、多版本筛选优化，可提升AI生成文案吸引力与转化效果。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 如果您希望借助AI推文助手为促销活动生成高效吸引用户的文案，但发现内容缺乏…

程序猿
2025年12月6日 • 科技
1000
paperok查重系统官网主页网址 paperok查重官网链接快速访问

PaperOK查重系统官网为https://www.paperok.com，提供登录注册、免费积分领取、文档上传检测、报告查看下载等功能，整合多类学术资源库，覆盖期刊论文与网络信息，采用语义分析与分段检测技术，支持学科分类更新与引用标注建议，提升查重精准度。 ☞☞☞AI 智能聊天, 问答助手, AI…

程序猿
2025年12月6日 • 科技
0000
deepseek在线聊天官网 deepseek免费AI生成入口

DeepSeek在线聊天官网是https://www.deepseek.com，用户可通过浏览器访问并点击“开始对话”按钮，使用手机号、微信或邮箱登录后即可免费使用AI对话、深度思考、联网搜索及文档解析等功能。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek …

程序猿
2025年12月6日 • 科技
0000
华为乾崑智驾已避免300万次可能碰撞安全性能拉满

10月23日，华为正式对外宣布，其乾崑智驾ads系统取得关键进展——累计成功规避潜在碰撞事故超300万次。这一成果充分展现了该系统在智能驾驶安全领域的强大实力，核心支撑正是其搭载的全维防碰撞系统cas 4.0，具备五维立体的安全防护能力。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无…

程序猿
2025年12月6日 • 科技
1000
传比亚迪赵长江辞职后将加入智界本人回应：先休息下

10月24日，针对近日外界关于其离职的传闻，腾势方程豹汽车直营销售事业部总经理赵长江向媒体回应称：“先休息一下。” ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 赵长江据悉，前一天市场上流传出一份比亚迪内部公告，内容显示赵长江因个人原因提…

程序猿
2025年12月6日 • 科技
0000
9月哪款车最受欢迎？特斯拉Model Y在四省销量登顶

今日，2025年9月中国各省汽车销冠品牌及车型盘点结果正式揭晓。数据显示，比亚迪在品牌层面表现强势，斩获全国28个省级行政区的销冠品牌头衔。而在车型榜单中，特斯拉model y在4个省份销量夺冠。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜…

程序猿
2025年12月6日 • 科技
0000
小可AI图像处理入口_小可AI图像官网官方网址

小可AI图像处理官网是https://www.xiaokeai.com，提供一键式风格迁移、智能修复、批量处理等功能，支持网页端快速操作与API接入。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 小可AI图像处理入口官网地址在哪里？这是不…

程序猿
2025年12月6日 • 科技
0000
腾讯元宝网页版通道腾讯元宝官网直接入口

腾讯元宝官网网页版支持微信、QQ、手机号登录，无需下载即可使用智能对话、文件解析、内容创作和AI阅读等功能，还可通过App、小程序等多端使用。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 腾讯元宝的官方网页版可以直接通过官网地址访问。打开…

程序猿
2025年12月6日 • 科技
2000
腾讯朱雀AI在线检测朱雀大模型官网网页版链接工具

腾讯朱雀AI在线检测入口地址是https://matrix.tencent.com/ai-detect，用户可直接访问官网使用文本或图片检测功能，无需注册登录；平台支持粘贴文本或上传文档进行AI生成内容检测，5秒内生成报告，标注AI生成概率、具体段落及语言风格特征，帮助用户高效辨别内容来源。 ☞☞☞…

程序猿
2025年12月6日 • 科技
0000
蛐蛐 (QuQu)— 开源的桌面端语音输入与文本处理工具

蛐蛐 (QuQu)是什么蛐蛐（ququ）是一款专为中文用户打造的桌面语音输入与文本处理工具，旨在提供一个开源且免费的 wispr flow 替代方案。该工具集成了阿里巴巴的 funasr paraformer 模型，支持本地化部署与运行，有效保障用户隐私安全。同时融合先进 ai 技术，实现高精度语…

程序猿
2025年12月6日 • 科技
0000
2025年9月全球各国汽车销量排行揭晓：印度超越英德

2025年9月，全球汽车市场展现出明显的分化格局。在涵盖的36个有销量数据的国家和地区中，日本、巴西、印尼等9个市场出现同比下滑，而中国、美国、英国、德国等27个国家则实现正增长，整体行业呈现强劲复苏态势。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1…

程序猿
2025年12月6日 • 科技
0000
Microsoft Teams如何创建审批表 Microsoft Teams流程审批的电子化方案

首先在Microsoft Teams中添加“审批”应用，通过聊天或频道创建审批请求，填写信息并设置审批人；接着利用Power Automate实现自动归档、同步数据等流程；使用内置模板快速部署请假、报销等常见审批类型，并可自定义字段与路径；通过权限管理确保安全，审批记录可检索、导出用于审计；支持移动…

程序猿
2025年12月6日 • 科技
0000
夸克Ai搜索怎么对比信息_夸克Ai搜索多源信息对比

夸克AI搜索可通过启用深度搜索、多轮追问和AI总结功能实现多源信息对比。首先在搜索框输入问题并点击「深度搜索」按钮，系统将自主规划路径，整合多个权威来源进行交叉验证；其次通过追问“有其他研究机构持不同看法吗？”等引导AI调取差异化内容；最后可使用「AI总结」上传多份文档，自动生成对比表格呈现各方观点…

程序猿
2025年12月6日 • 科技
1000
Microsoft Teams如何设置水印保护 Microsoft Teams敏感信息的防泄密方案

首先在Microsoft 365合规中心创建敏感信息策略，启用屏幕水印并自定义显示用户名、IP、时间戳；接着配置DLP规则识别敏感内容并阻止传输；最后集成IRM实现文档加密与访问控制，全面保护Teams中的数据安全。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSe…

程序猿
2025年12月6日 • 科技
0000
瑞达写作官网登录端点瑞达写作App官方最新下载点

瑞达写作官网登录端点位于其网站首页，用户可通过点击“登录”按钮进入。该平台提供账号体系，支持网页与移动端互通，并设有选题、大纲生成、初稿撰写及开题报告等辅助功能，助力论文写作。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 瑞达写作官网登录…

程序猿
2025年12月6日 • 科技
0000
Microsoft Teams如何创建问答区 Microsoft Teams疑难解答的互动平台

1、登录Microsoft Teams后进入目标团队频道，点击“+”添加“网站”或“选项卡”以嵌入自定义内容；2、发布首条提问帖并固定，作为问答区入口；3、在设置中确保成员拥有发帖与回复权限；4、使用@提及通知成员参与。启用点赞、已解决标记、Planner/OneNote归类、Power Autom…

程序猿
2025年12月6日 • 科技
0000

发表回复

登录后才能评论

Granite 4.0 Tiny Preview— IBM推出的语言模型

关于作者

相关推荐

发表回复