训练

  • 无需注意力的预训练;被GPT带飞的In-Context Learning

    论文 1:ClimateNeRF: Physically-based Neural Rendering for Extreme Climate Synthesis 作者:Yuan Li等论文地址:https://arxiv.org/pdf/2211.13226.pdf 摘要:本文介绍了一种将物理模拟…

    2025年11月10日 科技
    000
  • 预训练无需注意力,扩展到4096个token不成问题,与BERT相当

    Transformer 作为 NLP 预训练模型架构,能够有效的在大型未标记的数据上进行学习,研究已经证明,Transformer 是自 BERT 以来 NLP 任务的核心架构。 最近的工作表明,状态空间模型(SSM)是长范围序列建模有利的竞争架构。SSM 在语音生成和 Long Range Are…

    2025年11月9日 科技
    100
  • 用7500条轨迹数据训练,CMU、Meta让机器人达到全能的厅堂与厨房水平

    仅仅通过使用7500条轨迹数据进行训练,这个机器人可以展示出12种不同的操作技能,在38个任务中,不仅仅限于拾取和推动,还包括关节对象操纵和物体重新定位。而且,这些技能还可以应用于数百个不同的未知情境,包括未知物体、未知任务,甚至完全未知的厨房环境。这样的机器人真的很酷吧! ☞☞☞AI 智能聊天, …

    2025年11月8日 科技
    100
  • 2023年编程语言榜单,Python继续领跑!SQL在工作需求中夺魁

    随着科技的迅速发展,编程语言已成为现代社会不可或缺的一部分: 无论是网站开发、移动应用、人工智能还是嵌入式系统,编程语言都扮演着关键角色。 当下流行的AI人工智能大多是通过Python语言实现的。 作为AI技术框架的基础语言,与其他编程语言相比,Python能够动态编译,不仅开发效率高,还可以搭建网…

    2025年11月8日 科技
    000
  • GPT-4:我写的代码你敢用吗?研究表明其API误用率超过62%

    语言建模的新时代已经到来,大型语言模型(LLM)能力非凡,不仅能理解自然语言,甚至能根据用户需求生成定制代码。 因此,越来越多的软件工程师选择查询大型语言模型来解答编程问题,比如使用 API 来生成代码段或检测代码中的 bug。相比于搜索 Stack Overflow 等网络编程论坛,大型语言模型可…

    2025年11月8日 科技
    1100
  • 简化文生图prompt,LLM模型生成高质量图像

    扩散模型已经成为主流的文本到图像生成模型,它可以通过文本提示来引导生成高质量且内容丰富的图像 如果输入的提示过于简洁,现有的模型在语义理解和常识推理方面都存在局限,这将导致生成的图像质量明显下降 中山大学HCP实验室的林倞团队提出了一种名为SUR-adapter的简单而有效的微调方法,旨在提高模型对…

    2025年11月8日 科技
    000
  • 吴恩达力赞!哈佛、MIT学者用下棋证明:大型语言模型确实「理解」了世界

    2021年,华盛顿大学语言学家Emily M. Bender发表了一篇论文,认为大型语言模型不过是「随机鹦鹉」(stochastic parrots)而已,它们并不理解真实世界,只是统计某个词语出现的概率,然后像鹦鹉一样随机产生看起来合理的字句。 由于神经网络的不可解释性,学术界也弄不清楚语言模型到…

    2025年11月8日 科技
    000
  • SupFusion:探索如何有效监督Lidar-Camera融合的3D检测网络?

    基于激光雷达相机融合的3d检测是自动驾驶的一项关键任务。近年来,出现了许多激光雷达相机融合方法,并取得了良好的性能,但是这些方法始终缺乏精心设计和有效监督的融合过程 本文介绍了一种名为SupFusion的新训练策略,它为激光雷达相机融合提供了辅助特征级监督,并显著提高了检测性能。该方法包括Polar…

    2025年11月8日 科技
    000
  • 文生3D模型大突破!MVDream重磅来袭,一句话生成超逼真三维模型

    这真是太不可思议了! 现在只需打几个字就能轻松地创造出精美而高质量的3D模型了? 这不,国外一篇博客引爆网络,把一个叫MVDream的东西摆到了我们面前。 用户只需要寥寥数语,就可以创造出一个栩栩如生的3D模型。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek…

    2025年11月8日 科技
    000
  • ​参数少近一半,性能逼近谷歌Minerva,又一个数学大模型开源了

    如今,在各种文本混合数据上训练出来的语言模型会显示出非常通用的语言理解和生成能力,可以作为基础模型适应各种应用。开放式对话或指令跟踪等应用要求在整个自然文本分布中实现均衡的性能,因此更倾向于通用模型。 不过如果想要在某一领域(如医学、金融或科学)内最大限度地提高性能,那么特定领域的语言模型可能会以给…

    2025年11月8日 科技
    000
关注微信