工程_第7页_创想鸟

蚂蚁集团、浙江大学联合发布开源大模型知识抽取框架OneKE

最近，由蚂蚁集团和浙江大学联合研发的大模型知识抽取框架 oneke 宣布开源，并且捐赠给 openkg 开放知识图谱社区。知识图谱是实现大模型可信可控的关键技术之一，知识抽取可助力构建领域知识图谱。OneKE致力于帮助研究人员和开发者更好地处理信息抽取、文本数据结构化、知识图谱构建等问题。通过O…

程序猿

2025年11月11日 • 用户投稿

3000

CVPR 2024高分论文：全新生成式编辑框架GenN2N，统一NeRF转换任务

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 我们网站的AIxiv专栏是关于学术和技术内容的栏目。过去几年来，我们网站的AIxiv专栏已经收到超过2000篇内容，覆盖全球各大高校与企业的顶级实验室，有助于推进了学术交流与传播。如果您有优秀的…

程序猿

2025年11月11日 • 用户投稿

2000

NeurIPS 2024 | 自我纠错如何使OpenAI o1推理能力大大加强？北大、MIT团队给出理论解释

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ AIxiv专栏是本站发布学术、技术内容的栏目。过去数年，本站AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢…

程序猿

2025年11月11日 • 用户投稿

2000

大模型承重墙，去掉了就开始摆烂！苹果给出了「超级权重」

去掉一个「超权重」的影响，比去掉其他 7000 个离群值权重加起来还要严重。大模型的参数量越来越大，越来越聪明，但它们也越来越奇怪了。两年前，有研究者发现了一些古怪之处：在大模型中，有一小部分特别重要的特征（称之为「超权重」），它们虽然数量不多，但对模型的表现非常重要。如果去掉这些「超权重」，…

程序猿

2025年11月11日 • 用户投稿

1000

生成越长越跑偏？浙大商汤新作StarGen让场景视频生成告别「短片魔咒」

浙江大学和商汤科技的研究人员提出了一种名为stargen的新型时空自回归框架，用于实现可扩展且可控的场景生成。该框架巧妙地结合了空间和时间双重条件机制，将稀疏视图的3d几何信息与视频扩散模型有效融合，从而解决了复杂场景长距离生成中时空一致性难题，显著降低了误差累积。 ☞☞☞AI 智能聊天, 问答助手…

程序猿

2025年11月10日 • 用户投稿

1000

大模型量化训练极限在哪？腾讯混元提出低比特浮点数训练Scaling Laws

腾讯混元团队揭示大模型浮点量化训练规律，找到最佳性价比配置 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 大模型低精度训练和推理是降低成本的关键方向，而浮点量化因其损耗小而备受关注。然而，现有整数量化经验能否直接应用于浮点量化？浮点量化是否…

程序猿

2025年11月10日 • 用户投稿

1000

大模型推理新范式！清华&蚂蚁：用编程思维来思考，用自然语言来表达

CodePlan：赋予大模型结构化思维，解锁推理潜能 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ AIxiv专栏持续报道全球顶尖AI研究成果。本文介绍清华大学和蚂蚁技术研究院的研究团队在ICLR 2025上提出的CodePlan框架，该框…

程序猿

2025年11月10日 • 用户投稿

1000

VLDB 2023奖项公布，清华、第四范式、NUS联合论文获最佳工业界论文奖

vldb 2023国际会议已经在加拿大温哥华成功举办。vldb会议是数据库领域历史悠久的三大顶级会议之一，其全称为国际大型数据库会议。每届会议都集中展示了当前数据库研究的前沿方向、工业界的最新技术以及各国的研发水平，吸引了全球顶级研究机构的投稿 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, …

程序猿

2025年11月8日 • 用户投稿

0000

用火山引擎，大模型将数据飞轮「点燃」

在大模型对千行百业的改造进程中，火山引擎率先交出了一份数据行业的个性化答案。 9 月 19 日，在上海举办的 “数据飞轮・V-Tech 数据驱动科技峰会” 上，火山引擎宣布数智平台 VeDI 应用大模型（Large Language Models）能力。产品升级后，能够实现用自然语言 “找数”、辅…

程序猿

2025年11月8日 • 用户投稿

5000