研究
-
Qwen 深度研究一夜升级!可生成网页和音频播客,新模型能认医生手写体
Qwen版深度研究迎来重大升级,一夜之间新增了听觉与视觉输出能力,现已支持网页生成和音频播客制作。 AI深度研究整合的内容可自动生成图文并茂的网页,用户还能一键部署,生成公开或私密链接,便于成果分享与对外展示。 长篇研究报告也能转换为音频播客,支持自由选择主持人与嘉宾音色,甚至包含多种方言,让信息吸…
-
10 行代码让大模型数学提升 20%,“野路子”研究谷歌也测上了,主要作者全靠自学成才
只要不到 10 行代码,就能让大模型数学能力(gsm8k)提升 20%! 几名独立学者提出了大模型采样的改进方案,引起了开源社区的关注。 目前该方法已在 Mistral-7B 上取得成效,在 Llama3-70B 上的测试也正在进行。 这种方法叫做最小 p 采样(min-p sampling),目的…
-
清华微软开源全新提示词压缩工具,长度骤降80%!GitHub怒砍3.1K星
在自然语言处理中,有很多信息其实是重复的。 如果能将提示词进行有效地压缩,某种程度上也相当于扩大了模型支持上下文的长度。 现有的信息熵方法是通过删除某些词或短语来减少这种冗余。 然而,基于信息熵的计算仅涵盖了文本的单向上下文,可能会忽略压缩所需的关键信息;而且,信息熵的计算方式并非完全符合压缩提示词…
-
最新研究:廉价锂电池缺陷率高达 15% 火灾风险激增
近日,cnmo 关注到一项最新研究,揭示了廉价锂离子电池存在的严重质量问题——平均每13个电池中就有1个存在重大制造缺陷。 该研究利用X光技术对1000节18650锂电池进行了详细检测,结果显示近8%的低价或假冒电池存在可能引发火灾的安全隐患。研究指出,主要问题出现在电极结构上:负极未能完全覆盖正极…
-
全身追踪、不怕遮挡,CMU两位华人做了个基于WiFi信号的DensePose
过去几年,在自动驾驶和 VR 等应用的推动下,使用 2D 和 3D 传感器(如 RGB 传感器、LiDARs 或雷达)进行人体姿态估计取得了很大进展。但是,这些传感器在技术上和实际使用中都存在一些限制。首先成本高,普通家庭或小企业往往承担不起 LiDAR 和雷达传感器的费用。其次,这些传感器对于日常…
-
回顾60多种 Transformer 研究,一文总结遥感领域最新进展
遥感成像技术在过去几十年取得显着进步。现代机载传感器在空间、光谱和分辨率上的不断提升,已经能覆盖地球表面大部分范围,因此遥感技术在生态学、环境科学、土壤科学、水污染、冰川学、土地测量和分析等众多研究领域发挥着至关重要的作用。由于遥感数据通常是多模态的、位于地理空间(地理定位)中,并且尺度通常是全球范…
-
谷歌、MIT提出统一框架MAGE:表征学习超MAE,无监督图像生成超越 Latent Diffusion
识别和生成是人工智能领域中的两大核心任务,如果能将二者合并到一个统一的系统中,这两个任务应该能实现互补。事实上,在自然语言处理中,像 BERT [1] 这样的模型不仅能够生成高质量的文本,还能够提取文本中的特征。 然而,在计算机视觉领域,目前的图像生成模型和识别模型大多是分开进行训练,没有充分利用这…
-
用量子纠缠当GPS,无信号地区也能精准定位了
量子纠缠(quantum entanglement)是指粒子之间发生的一种特殊耦合现象。在纠缠态下,我们无法单独描述各个粒子的性质,只能描述整体系统的性质的现象,这种影响不随距离的改变而消失,哪怕粒子之间相隔整个宇宙也不会变。 一项新的研究表明,使用量子纠缠机制,传感器可以在检测运动时更加准确且更快…
-
LeCun, 获得图灵奖的科学家表示支持使用LLM撰写论文。科研界的老将可能更不喜欢ChatGPT?
chatgpt发布后,「用语言模型辅助论文写作」到底算作弊剽窃,还是合理使用写作工具,目前各高校、论文会议中仍然没有统一标准,甚至不同的科研人员对chatgpt都持有不同的态度。 有人认为ChatGPT可以提高写作质量,让非英语母语者减少语法错误等;但也有人认为生成的文字并不属于作者,违反学术道德。…
-
LeCun力挺,马毅教授五年集大成之作:完全数学可解释的白盒Transformer,性能不输ViT
过去十多年,AI的飞速发展主要是工程实践上的进步,AI理论并没有起到指导算法开发的作用,经验设计的神经网络依然是一个黑盒。 而随着ChatGPT的爆火,AI的能力也被不断夸大、炒作,甚至到了威胁、绑架社会的地步,让Transformer架构设计变透明已刻不容缓! ☞☞☞AI 智能聊天, 问答助手, …