工程_第8页_创想鸟

手把手教你剪「羊驼」，陈丹琦团队提出LLM-Shearing大模型剪枝法

给 llama 2（羊驼）大模型剪一剪驼毛，会有怎样的效果呢？今天普林斯顿大学陈丹琦团队提出了一种名为 llm-shearing 的大模型剪枝法，可以用很小的计算量和成本实现优于同等规模模型的性能。自大型语言模型（LLM）出现以来，它们便在各种自然语言任务上取得了显著的效果。不过，大型语言模型需要…

程序猿

2025年11月8日 • 用户投稿

2000

高精度低成本游戏3D人脸重建方案，腾讯AI Lab ICCV 2023论文解读

3d 人脸重建是一项广泛应用于游戏影视制作、数字人、ar/vr、人脸识别和编辑等领域的关键技术，其目标是从单张或多张图像中获取高质量的 3d 人脸模型。借助摄影棚中的复杂拍摄系统，当前业界成熟方案已可得到媲美真人的毛孔级精度的重建效果 [2]，但其制作成本高、周期长，一般仅用于 s 级影视或游戏项目…

程序猿

2025年11月8日 • 用户投稿

0000

马斯克第二款AI产品PromptIDE公布，Grok的开发离不开它

网友评论：xai 团队的开发速度太快了！简直让人惊叹！ Grok 马斯克发起的基于大语言模型(LLM)的AI聊天机器人TruthGPT，现用名Grok 294 查看详情距离马斯克的 xAI 公布 Grok 才过去一天，刚刚，xAI 又公布了另一款 AI 产品，一个可用于 prompt 工程和可解释…

程序猿

2025年11月8日 • 用户投稿

0000

连葫芦娃都数不明白，解说英雄联盟的GPT-4V面临幻觉挑战

让大模型同时理解图像和文字可能比想象中要难。在被称为「ai 春晚」的 openai 首届开发者大会拉开帷幕后，很多人的朋友圈都被这家公司发布的新产品刷了屏，比如不需要写代码就能定制应用的 gpts、能解说球赛甚至「英雄联盟」游戏的 gpt-4 视觉 api 等等。不过，在大家纷纷夸赞这些产品有多好…

程序猿

2025年11月8日 • 用户投稿

1000

TRIBE实现领域适应的鲁棒性，在多真实场景下达到SOTA的AAAII 2024

测试时领域适应（Test-Time Adaptation）的目的是使源域模型适应推理阶段的测试数据，在适应未知的图像损坏领域取得了出色的效果。然而，当前许多方法都缺乏对真实世界场景中测试数据流的考虑，例如：测试数据流应当是时变分布（而非传统领域适应中的固定分布）测试数据流可能存在局部类别相关性（…

程序猿

2025年11月7日 • 用户投稿

0000

家具家电通用三维图文大模型系统中的首创无需指导、泛化使用形象化模型

这几天，家务活都被机器人抢着干了。前脚来自斯坦福的会用锅的机器人刚刚登场，后脚又来了个会用咖啡机的机器人 Figure-01 。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ Figure-01只需观看示范视频，再进行10小时的训练，就能…

程序猿

2025年11月7日 • 用户投稿

0000

网友盛赞：Transformer引领年度论文的简化版本来了

从大模型的根源开始优化。 transformer 架构可以说是近期深度学习领域许多成功案例背后的主力军。构建深度 transformer 架构的一种简单方法是将多个相同的 transformer 「块」（block）依次堆叠起来，但每个「块」都比较复杂，由许多不同的组件组成，需要以特定的排列组合才能…

程序猿

2025年11月7日 • 用户投稿

1000

模型推理加速：CPU性能提升5倍，苹果采用闪存进行大规模推理加速，Siri 2.0即将亮相？

苹果这项新工作将为未来 iPhone 加入大模型的能力带来无限想象力。近年来，gpt-3、opt和palm等大型语言模型（llm）在广泛的自然语言处理（nlp）任务中展现了强大的性能。然而，这些性能的实现需要大量的计算和内存推理，因为这些大型语言模型可能包含数千亿甚至万亿个参数，这使得在资源有限的…

程序猿

2025年11月7日 • 用户投稿

0000

无向图最小割问题取得新突破，谷歌研究获SODA 2024最佳论文奖

谷歌博客放出新研究，求解无向图的最小割问题。 1996 年，美国计算机科学家 David R Karger 连同其他研究者在论文《 A new approach to the minimum cut problem》中提出了一个令人惊讶的随机算法 Karger 算法，其在理论计算机科学中非常重要，…

程序猿

2025年11月7日 • 用户投稿

1000

在12个视频理解任务中，Mamba先打败了Transformer

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 本站发布学术、技术内容的专栏。近年来，本站AIxiv专栏接收报道超过2000篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道…

程序猿

2025年11月7日 • 用户投稿

1000