llama

  • AgenticSeek— 开源本地通用AI Agent,自主执行任务

    ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ Bardeen AI 使用AI自动执行人工任务 67 查看详情 AgenticSeek是什么 agenticseek是一款完全本地化的开源ai助手,可作为 manus 的开源替代品。agenti…

    2025年11月27日 科技
    100
  • LLM推理3倍速!微软发布LLM Accelerator:用参考文本实现无损加速

    随着人工智能技术的快速发展,ChatGPT、New Bing、GPT-4 等新产品和新技术陆续发布,基础大模型在诸多应用中将发挥日益重要的作用。 目前的大语言模型大多是自回归模型。自回归是指模型在输出时往往采用逐词输出的方式,即在输出每个词时,模型需要将之前输出的词作为输入。而这种自回归模式通常在输…

    2025年11月27日 科技
    000
  • 大型模型开发工具集已经建立!

    需要进行改写的内容是:作者 richard macmanus 策划 | 言征 Web3未能颠覆掉Web2,但新兴的大模型开发栈正在让开发者从“云原生”时代迈向新的AI技术栈。 提示工程师或许不能触动开发者奔赴大模型的神经,但产品经理或者领导的一句:能不能开发一个“agent”,能不能实现一条“cha…

    2025年11月27日 科技
    000
  • 10万美元+26天,一个低成本千亿参数LLM就诞生了

    包括仅解码器结构(如 GPT 和 LLAMA 系列模型)、仅编码器结构(如 BERT)和编码器 – 解码器结构(如 T5)以及它们的变体模型在内的大型语言模型(LLM)已经取得了非凡的成功,并已被广泛用于各种语言处理和多模态任务。 尽管如此成功,训练 LLM 的成本还是过于高昂,以至于仅…

    2025年11月27日 科技
    000
  • 复旦大学团队发布中文智慧法律系统DISC-LawLLM,构建司法评测基准,开源30万微调数据

    随着智慧司法的兴起,智能化方法驱动的智能法律系统有望惠及不同群体。例如,为法律专业人员减轻文书工作,为普通民众提供法律咨询服务,为法学学生提供学习和考试辅导。 由于法律知识的独特性和司法任务的多样性,此前的智慧司法研究方面主要着眼于为特定任务设计自动化算法,难以满足对司法领域提供支撑性服务的需求,离…

    2025年11月27日 科技
    100
  • 陈丹琦团队创新之作:以5%成本取得SOTA,掀起“羊驼剪毛”大法热潮

    只用3%的计算量、5%的成本取得sota,统治了1b-3b规模的开源大模型。 这一成果来自普林斯顿陈丹琦团队,名为LLM-Shearing大模型剪枝法。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 以羊驼LLaMA 2 7B为基础,通过定…

    2025年11月26日 科技
    000
  • 使用Accelerate库在多GPU上进行LLM推理

    大型语言模型(llm)已经彻底改变了自然语言处理领域。随着这些模型在规模和复杂性上的增长,推理的计算需求也显著增加。为了应对这一挑战利用多个gpu变得至关重要。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 因此,这篇文章将在多个GPU上同…

    2025年11月26日 科技
    000
  • 创业180天估值20亿美元!欧版OpenAI爆火,Llama主创自立门户,英伟达都入股了

    “欧洲版openai”最新估值,逼近20亿美元! 总部位于巴黎的大模型初创公司Mistral AI最新一轮融资,4.87亿美元。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 投资方为安德森·霍洛维茨、英伟达、Salesforce等。 其中…

    2025年11月26日 科技
    200
  • 手机运行微软小模型胜过27亿参数的大模型

    微软 CEO 纳德拉在 Ignite 大会上宣布,上个月,Phi-2 小尺寸模型将完全开源。这一举措将显著改进常识推理、语言理解和逻辑推理的性能 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 今天,微软公布了 Phi-2 模型的更多细节以及…

    2025年11月26日 科技
    000
  • 阿里mPLUG-Owl新升级,鱼与熊掌兼得,模态协同实现MLLM新SOTA

    openai gpt-4v 和 google gemini 都展现了非常强的多模态理解能力,推动了多模态大模型(mllm)快速发展,mllm 成为了现在业界最热的研究方向。 MLLM 在多种视觉-语言开放任务中取得了出色的指令跟随能力。尽管以往多模态学习的研究表明不同模态之间能够相互协同和促进,但是…

    2025年11月26日 科技
    000
关注微信