工程
-
手把手教你剪「羊驼」,陈丹琦团队提出LLM-Shearing大模型剪枝法
给 llama 2(羊驼)大模型剪一剪驼毛,会有怎样的效果呢?今天普林斯顿大学陈丹琦团队提出了一种名为 llm-shearing 的大模型剪枝法,可以用很小的计算量和成本实现优于同等规模模型的性能。 自大型语言模型(LLM)出现以来,它们便在各种自然语言任务上取得了显著的效果。不过,大型语言模型需要…
-
高精度低成本游戏3D人脸重建方案,腾讯AI Lab ICCV 2023论文解读
3d 人脸重建是一项广泛应用于游戏影视制作、数字人、ar/vr、人脸识别和编辑等领域的关键技术,其目标是从单张或多张图像中获取高质量的 3d 人脸模型。借助摄影棚中的复杂拍摄系统,当前业界成熟方案已可得到媲美真人的毛孔级精度的重建效果 [2],但其制作成本高、周期长,一般仅用于 s 级影视或游戏项目…
-
马斯克第二款AI产品PromptIDE公布,Grok的开发离不开它
网友评论:xai 团队的开发速度太快了!简直让人惊叹! Grok 马斯克发起的基于大语言模型(LLM)的AI聊天机器人TruthGPT,现用名Grok 294 查看详情 距离马斯克的 xAI 公布 Grok 才过去一天,刚刚,xAI 又公布了另一款 AI 产品,一个可用于 prompt 工程和可解释…
-
连葫芦娃都数不明白,解说英雄联盟的GPT-4V面临幻觉挑战
让大模型同时理解图像和文字可能比想象中要难。 在被称为「ai 春晚」的 openai 首届开发者大会拉开帷幕后,很多人的朋友圈都被这家公司发布的新产品刷了屏,比如不需要写代码就能定制应用的 gpts、能解说球赛甚至「英雄联盟」游戏的 gpt-4 视觉 api 等等。不过,在大家纷纷夸赞这些产品有多好…
-
TRIBE实现领域适应的鲁棒性,在多真实场景下达到SOTA的AAAII 2024
测试时领域适应(Test-Time Adaptation)的目的是使源域模型适应推理阶段的测试数据,在适应未知的图像损坏领域取得了出色的效果。然而,当前许多方法都缺乏对真实世界场景中测试数据流的考虑,例如: 测试数据流应当是时变分布(而非传统领域适应中的固定分布) 测试数据流可能存在局部类别相关性(…
-
家具家电通用三维图文大模型系统中的首创无需指导、泛化使用形象化模型
这几天,家务活都被机器人抢着干了。 前脚来自斯坦福的会用锅的机器人刚刚登场,后脚又来了个会用咖啡机的机器人 Figure-01 。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ Figure-01只需观看示范视频,再进行10小时的训练,就能…
-
网友盛赞:Transformer引领年度论文的简化版本来了
从大模型的根源开始优化。 transformer 架构可以说是近期深度学习领域许多成功案例背后的主力军。构建深度 transformer 架构的一种简单方法是将多个相同的 transformer 「块」(block)依次堆叠起来,但每个「块」都比较复杂,由许多不同的组件组成,需要以特定的排列组合才能…
-
模型推理加速:CPU性能提升5倍,苹果采用闪存进行大规模推理加速,Siri 2.0即将亮相?
苹果这项新工作将为未来 iPhone 加入大模型的能力带来无限想象力。 近年来,gpt-3、opt和palm等大型语言模型(llm)在广泛的自然语言处理(nlp)任务中展现了强大的性能。然而,这些性能的实现需要大量的计算和内存推理,因为这些大型语言模型可能包含数千亿甚至万亿个参数,这使得在资源有限的…
-
无向图最小割问题取得新突破,谷歌研究获SODA 2024最佳论文奖
谷歌博客放出新研究,求解无向图的最小割问题。 1996 年, 美国计算机科学家 David R Karger 连同其他研究者在论文《 A new approach to the minimum cut problem》中提出了一个令人惊讶的随机算法 Karger 算法,其在理论计算机科学中非常重要,…
-
在12个视频理解任务中,Mamba先打败了Transformer
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 本站发布学术、技术内容的专栏。近年来,本站AIxiv专栏接收报道超过2000篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道…