致敬TempleOS,有开发者创建了启动Llama 2的操作系统,网友:8G内存老电脑就能跑

不得不说,Llama 2 的「二创」项目越来越硬核、有趣了。
自 Meta 发布开源大模型 Llama 2 以来,围绕着该模型的「二创」项目便多了起来。
此前 7 月,特斯拉前 AI 总监、重回 OpenAI 的 Andrej Karpathy 利用周末时间,做了一个关于 Llama 2 的有趣项目 llama2.c,让用户在 PyTorch 中训练一个 baby Llama 2 模型,然后使用近 500 行纯 C、无任何依赖性的文件进行推理。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

致敬templeos,有开发者创建了启动llama 2的操作系统,网友:8g内存老电脑就能跑

今天,在 Karpathy llama2.c 项目的基础上,又有开发者创建了一个启动 Llama 2 的演示操作系统,以及一个调用用户模式助手进行 Llama 2 推理的内核模块。该项目名为 Llama 2 Everywhere(简称为 L2E)。
不过,作者也表示,当前的系统要求是 512MB RAM 和 x86_64(64 位)PC,可用性有待提升。
同时,这个项目还藏有一些彩蛋,比如《毁灭战士》游戏,不过必须解答谜题才能找到它。

致敬TempleOS,有开发者创建了启动Llama 2的操作系统,网友:8G内存老电脑就能跑项目地址:https://github.com/trholding/llama2.c

Andrej Karpathy 也转发了这个新项目,表示它具备了「独立运行、二进制、便携和可启动」等特性。他预计自己的 llama2.c 项目将走向成功,这个新项目扩展了想象力。

致敬TempleOS,有开发者创建了启动Llama 2的操作系统,网友:8G内存老电脑就能跑

L2E 得到了各路网友的认可,有人表示,这真是太棒了。基本上可以在任何旧笔记本上启动,并且可以仅在 CPU 上运行,8G 内存就够了,16G 更好。

致敬TempleOS,有开发者创建了启动Llama 2的操作系统,网友:8G内存老电脑就能跑

也有人觉得该项目非常像为上帝开发的操作系统 TempleOS(它由已故天才程序员 Terry Davis 独自开发),但项目作者表示自己只是对 Terry 和 TempleOS 的致敬。
L2E 仅仅使用 Linux 内核和一些知识构建了一个操作系统,与 Terry 从头开始构建的操作系统存在天壤之别。

致敬TempleOS,有开发者创建了启动Llama 2的操作系统,网友:8G内存老电脑就能跑

接下来了解一下 L2E 项目的初衷、Demo 和特性。
L2E 项目介绍
项目作者表示,L2E 旨在确保其在各种设备上的兼容性,比如在 chromebook 上启动、在企业高密度 unikernel 上部署。
未来,通过利用大量具备适度硬件要求的网络化、分布式和自协调的小规模专业 LLM,该项目有潜力释放超越单个大规模 LLM 的群体智慧。
目前,L2E 显著的用例是在不同文本源上训练小规模模型,包括教科书、开放书籍和 SlimPajama 语料库等。这些经过训练的模型使用 L2E 进行部署,从而作为可启动实例在老旧过时的学校计算机上运行。这种部署方案可在互联网连接有限或网络不可用的学校图书馆或教室中发挥重要价值。
项目的最终目标是创建一个包容性的 AI 生态系统,能够适应多样化的环境,并在全球范围内为个人和社区赋能。
此外通过使用各种硬件遥测数据训练,希望模型能够学会解释传感器输入并根据从传感器输入中收集的 insight 来控制执行器。这一研究方向可能会在自动化、太空、机器人和物联网等领域发挥作用,而 L2E 将对弥合 AI 和物理系统之间的差距发挥关键作用。
L2E Demo 展示
项目作者展示了启动 Llama 2 的一些示例。
如下为 Linux 内核的 L2E 操作系统,现在可以在计算机上真正启动并推理 Llama 2 模型了。

致敬TempleOS,有开发者创建了启动Llama 2的操作系统,网友:8G内存老电脑就能跑

Waymark Waymark

Waymark是一个视频制作工具,帮助企业快速轻松地制作高影响力的广告。

Waymark 79 查看详情 Waymark

致敬TempleOS,有开发者创建了启动Llama 2的操作系统,网友:8G内存老电脑就能跑

此外可以做 cat /dev/llama 并回显 “Sudo make me a sandwich!” > /dev/llama 等命令,或者传递一个内核参数 l2e.quest=”What is the meaning of life?”。

致敬TempleOS,有开发者创建了启动Llama 2的操作系统,网友:8G内存老电脑就能跑

最后还可以在大型企业服务器上启动并推理一组 1000 个 Virtural Baby Llama 2 模型。

致敬TempleOS,有开发者创建了启动Llama 2的操作系统,网友:8G内存老电脑就能跑

L2E 具备很强的便携性,可以在任何 x86_64 操作系统上运行单个可执行文件,比如 Windows、GNU Linux、GNU/Systemd、NetBSD、OpenBSD 等。独立性则表现在可以通过 ZipOS (cosmocc)、INCBIN、strliteral 嵌入模型和 tokenizer。L2E 可以在 CPU/GPU 上运行。

致敬TempleOS,有开发者创建了启动Llama 2的操作系统,网友:8G内存老电脑就能跑

更多细节内容请参阅原项目。

以上就是致敬TempleOS,有开发者创建了启动Llama 2的操作系统,网友:8G内存老电脑就能跑的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/1006219.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年12月1日 23:53:51
下一篇 2025年12月1日 23:54:12

相关推荐

  • HiDream-I1— 智象未来开源的文生图模型

    hidream-i1:一款强大的开源图像生成模型 HiDream-I1是由HiDream.ai团队开发的17亿参数开源图像生成模型,采用MIT许可证,在图像质量和对提示词的理解方面表现卓越。它支持多种风格,包括写实、卡通和艺术风格,广泛应用于艺术创作、商业设计、科研教育以及娱乐媒体等领域。 HiDr…

    2025年12月5日
    000
  • RL 是推理神器?清华上交大最新研究指出:RL 让大模型更会“套公式”、却不会真推理

    清华和上交的最新论文中,上演了一场“学术打假”的戏码。文中研究者们对当前“纯 rl 有利于提升模型推理能力”的主流观点提出了相反的意见。 通过一系列实验,他们证明引入强化学习的模型在某些任务中的表现,竟然不如未使用强化学习的模型。 论文批判性地探讨了 RLVR 在提升 LLM 推理能力方面的作用,尤…

    2025年12月3日 科技
    100
  • 亚马逊发布 Bedrock,推出多项新功能,助力企业利用生成式AI技术

    ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 亚马逊网络服务公司近日在生态系统中推出了五款全新的生成式人工智能产品,这些产品将帮助企业客户利用自己的数据建立人工智能应用程序,并提供更好的安全性和模型的可及性。 这些新服务的包括全面推出的Am…

    2025年12月2日
    000
  • 语言模型有重大缺陷,知识推演竟然是老大难

    惊人发现:大模型在知识推演上存在严重缺陷。 灵活运用知识是智慧的关键。人脑可以快速处理知识,如快速回答 “《静夜思》中有几个月字”。那么,大模型是否能进行类似操作?已知大模型可以通过思维链(Chain of Thought / CoT),先默写《静夜思》,再根据默写内容回答问题,但这会使生成的文字冗…

    2025年12月2日 科技
    100
  • ICCV 2023揭晓:ControlNet、SAM等热门论文斩获奖项

    在法国巴黎举行了国际计算机视觉大会ICCV(International Conference on Computer Vision)本周开幕 作为全球计算机视觉领域顶级的学术会议,ICCV 每两年召开一次。 ICCV的热度一直以来都与CVPR不相上下,屡创新高 在今天的开幕式上,ICCV官方公布了今…

    2025年12月2日 科技
    000
  • 深度学习巨头DeepMind在ImageNet数据集上取得突破性进展,为机器人研究带来新的里程碑

    机器人技术为什么远远落后于自然语言处理(nlp)、视觉和其他人工智能领域?除了其他困难外,数据短缺是主要原因。为了解决这个问题,谷歌 deepmind 联合其他机构推出了开放式 x-embodiment 数据集,并成功训练出了更强大的 rt-x 模型 在大模型不断取得突破的 2023,把大模型当做大…

    2025年12月2日 科技
    000
  • 最多400万token上下文、推理提速22倍,StreamingLLM火了,已获GitHub 2.5K星

    如果你曾经与任何一款对话式 AI 机器人交流过,你一定会记得一些令人感到非常沮丧的时刻。比如,你在前一天的对话中提到的重要事项,被 AI 完全忘记了…… 这是因为当前的多数 LLM 只能记住有限的上下文,就像为考试而临时抱佛脚的学生,稍加盘问就会「露出马脚」。 如果AI助手能够在聊天中根据上下文参考…

    2025年12月2日 科技
    000
  • PyTorch+昇腾 共促AI生态创新发展

    2023年10月5日(北京时间),pyt%ignore_a_1%rch社区正式发布了2.1版本。经过pytorch社区与昇腾的持续合作和共同努力,pytorch 2.1版本已经同步支持昇腾npu。这意味着开发者可以直接在pytorch 2.1上进行基于昇腾的模型开发。未来,通过持续的社区技术贡献,昇…

    2025年12月2日 科技
    100
  • 毫末龙年春节智驾数据发布:智驾里程994万公里,小魔驼配送近5000单

    2月24日,毫末智行公布了2024年%ign%ignore_a_1%re_a_1%春节数据报告。自2024年2月10日至2月23日,用户开启毫末辅助驾驶的行驶总里程突破994万公里,同比2023年春节激增283.4%。在末端物流自动配送领域,小魔驼配送订单比2023年春节同比增长9.2%。截止202…

    2025年12月2日 科技
    000
  • 选择最适合数据的嵌入模型:OpenAI 和开源多语言嵌入的对比测试

    openai最近宣布推出他们的最新一代嵌入模型embedding v3,他们声称这是性能最出色的嵌入模型,具备更高的多语言性能。这一批模型被划分为两种类型:规模较小的text-embeddings-3-small和更为强大、体积较大的text-embeddings-3-large。 ☞☞☞AI 智能…

    2025年12月2日 科技
    000
  • 完善AI软硬件生态,联想集团在MWC2024发布最新AI PC

    2月26日,在2024年世界移动通信大会(mwc 2024)上,联想集团发布全新thinkpad和thinkbook商务ai pc,展现了在全球ai pc领域的领导力。除硬件产品之外,联想还发布新的软件解决方案,包括lenovo identity advisor身份顾问和smart connect智…

    2025年12月2日 科技
    000
  • 谷歌10M上下文窗口正在杀死RAG?被Sora夺走风头的Gemini被低估了?

    要说最近最郁闷的公司,谷歌肯定算得上一个:自家的 Gemini 1.5 刚刚发布,就被 OpenAI 的 Sora 抢尽了风头,堪称 AI 界的「汪峰」。 具体来说,谷歌这次推出的是用于早期测试的 Gemini 1.5 的第一个版本 ——Gemini 1.5 Pro。它是一种中型多模态模型(涉及文本…

    2025年12月2日 科技
    200
  • 马斯克预测 Grok 5 实现通用人工智能概率 10%且还在上升

    近日,特斯拉与 spacex 首席执行官马斯克在社交平台上发表言论,预测其旗下人工智能公司 xai 正在研发的 grok 5 大型语言模型,有 10% 的可能性实现通用人工智能(agi),并指出这一概率正持续攀升。 上个月,马斯克就曾提出 xAI 或将通过 Grok 5 达成 AGI 的目标,此番言…

    2025年12月2日 科技
    000
  • 如何快速部署DeepSeek| 腾讯云TI部署指南

    一、为什么选择deepseek与创想鸟hai的结合 近年来,随着大模型在多种应用场景中的快速发展,AI工程师们迫切需要一种能够快速、高效且成本低廉的方式来部署和管理模型服务。PHP中文网HAI(高性能AI)平台是一个专为高性能计算和深度学习设计的综合解决方案,提供GPU/CPU资源调度、自动化部署以…

    2025年12月2日 科技
    300
  • 腾讯云TI平台极速部署DeepSeek

    前言 DeepSeek的出现,彻底改变了传统的LLM模式,允许我们在本地电脑上部署类似于ChatGPT的大型语言模型,解决了网络和对话次数限制的问题。然而,如果希望随时随地使用DeepSeek云服务,可以考虑利用PHP中文网的HAI或TI平台。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, …

    2025年12月2日 科技
    000
  • deepseek官网入口教程_deepseek网页版使用详解

    答案是使用DeepSeek网页版需先访问官网https://chat.deepseek.com,点击【开始对话】登录或注册账号,支持手机号验证码登录和微信扫码;登录后可在主界面输入问题进行对话,使用“深度思考”提升推理能力,“联网搜索”获取实时信息,或通过别针图标上传文档(PDF/Word)提取内容…

    2025年12月2日 科技
    000
  • llama3如何接入实时流数据_llama3实时流数据接入配置与事件驱动机制

    首先配置消息中间件实现异步通信,选择Kafka或RabbitMQ部署并确保SSL加密;其次构建事件监听器,编写消费者脚本订阅主题、解析数据并调用llama3;接着启用流式输出模式,通过–streaming-enable参数和SSE客户端实现低延迟响应;然后集成时间窗口聚合模块,每5秒拼接…

    2025年12月2日 科技
    000
  • llama3如何执行A/B实验_llama3A/B实验执行框架及变异生成分析

    答案:通过构建可控实验框架,对比不同提示策略与解码参数对Llama3生成效果的影响,评估其在一致性、多样性与准确性上的表现差异。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 如果您希望在Llama3模型的输出生成过程中进行A/B实验以评估…

    2025年12月2日 科技
    000
  • llama3如何创建动态可视化_llama3动态可视化创建引擎及交互元素绑定

    首先检查可视化引擎是否正确初始化,需导入VisualizerEngine并以dynamic模式启动渲染循环;接着绑定数据源到图形元素,通过bind_data连接数据流与图表,并设置更新间隔;然后配置交互控件如滑块,将其事件绑定至回调函数以实现参数动态调整;最后在多图层场景中添加图层并建立依赖关系,启…

    2025年12月2日 科技
    000
  • llama3如何构建自动化链_llama3自动化链构建流程及条件分支逻辑

    必须构建具备分支逻辑的自动化链以实现任务衔接与条件判断。首先定义包含输入源、功能模块划分、节点标识及执行顺序的基本结构;接着集成Llama3作为核心处理单元,通过API调用并解析其输出,配置异常处理机制;随后引入条件判断节点,基于Llama3输出的标签或置信度动态路由,支持多层嵌套决策;再通过for…

    2025年12月2日 科技
    000

发表回复

登录后才能评论
关注微信