工程

  • 蚂蚁集团、浙江大学联合发布开源大模型知识抽取框架OneKE

    最近,由蚂蚁集团和浙江大学联合研发的大模型知识抽取框架 oneke 宣布开源,并且捐赠给 openkg 开放知识图谱社区。 知识图谱是实现大模型可信可控的关键技术之一,知识抽取可助力构建领域知识图谱。OneKE致力于帮助研究人员和开发者更好地处理信息抽取、文本数据结构化、知识图谱构建等问题。 通过O…

    2025年11月11日 科技
    100
  • CVPR 2024高分论文:全新生成式编辑框架GenN2N,统一NeRF转换任务

    ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 我们网站的AIxiv专栏是关于学术和技术内容的栏目。过去几年来,我们网站的AIxiv专栏已经收到超过2000篇内容,覆盖全球各大高校与企业的顶级实验室,有助于推进了学术交流与传播。如果您有优秀的…

    2025年11月11日 科技
    100
  • NeurIPS 2024 | 自我纠错如何使OpenAI o1推理能力大大加强?北大、MIT团队给出理论解释

    ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢…

    2025年11月11日 科技
    100
  • 大模型承重墙,去掉了就开始摆烂!苹果给出了「超级权重」

    去掉一个「超权重」的影响,比去掉其他 7000 个离群值权重加起来还要严重。 大模型的参数量越来越大,越来越聪明,但它们也越来越奇怪了。 两年前,有研究者发现了一些古怪之处:在大模型中,有一小部分特别重要的特征(称之为「超权重」),它们虽然数量不多,但对模型的表现非常重要。 如果去掉这些「超权重」,…

    2025年11月11日 科技
    000
  • 生成越长越跑偏?浙大商汤新作StarGen让场景视频生成告别「短片魔咒」

    浙江大学和商汤科技的研究人员提出了一种名为stargen的新型时空自回归框架,用于实现可扩展且可控的场景生成。该框架巧妙地结合了空间和时间双重条件机制,将稀疏视图的3d几何信息与视频扩散模型有效融合,从而解决了复杂场景长距离生成中时空一致性难题,显著降低了误差累积。 ☞☞☞AI 智能聊天, 问答助手…

    2025年11月10日 科技
    000
  • 大模型量化训练极限在哪?腾讯混元提出低比特浮点数训练Scaling Laws

    腾讯混元团队揭示大模型浮点量化训练规律,找到最佳性价比配置 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 大模型低精度训练和推理是降低成本的关键方向,而浮点量化因其损耗小而备受关注。然而,现有整数量化经验能否直接应用于浮点量化?浮点量化是否…

    2025年11月10日 科技
    000
  • 大模型推理新范式!清华&蚂蚁:用编程思维来思考,用自然语言来表达

    CodePlan:赋予大模型结构化思维,解锁推理潜能 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ AIxiv专栏持续报道全球顶尖AI研究成果。本文介绍清华大学和蚂蚁技术研究院的研究团队在ICLR 2025上提出的CodePlan框架,该框…

    2025年11月10日 科技
    100
  • VLDB 2023奖项公布,清华、第四范式、NUS联合论文获最佳工业界论文奖

    vldb 2023国际会议已经在加拿大温哥华成功举办。vldb会议是数据库领域历史悠久的三大顶级会议之一,其全称为国际大型数据库会议。每届会议都集中展示了当前数据库研究的前沿方向、工业界的最新技术以及各国的研发水平,吸引了全球顶级研究机构的投稿 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, …

    2025年11月8日 科技
    000
  • 用火山引擎,大模型将数据飞轮「点燃」

    在大模型对千行百业的改造进程中,火山引擎率先交出了一份数据行业的个性化答案。 9 月 19 日,在上海举办的 “数据飞轮・V-Tech 数据驱动科技峰会” 上,火山引擎宣布数智平台 VeDI 应用大模型(Large Language Models)能力。 产品升级后,能够实现用自然语言 “找数”、辅…

    2025年11月8日 科技
    500
  • 多模态版Llama2上线,Meta发布AnyMAL

    在多个基准测试中均刷新了业界最好的 zero-shot 性能。 一个统一的模型,可以对不同模态输入内容(文本、图像、视频、音频、IMU 运动传感器数据)实现理解,并生成文本响应,技术基于 Llama 2,来自 Meta。 昨天,多模态大模型 AnyMAL 的研究吸引了 AI 研究社区的关注。 大型语…

    2025年11月8日 科技
    000
关注微信