研究

  • 深入探讨模型、数据和框架:一份详尽的54页高效大语言模型综述

    大规模语言模型(LLMs)在许多重要任务中展现出了引人注目的能力,包括自然语言理解、语言生成和复杂推理,并对社会产生了深远的影响。然而,这些出色的能力却需要大量的训练资源(如左图所示)和较长的推理时间(如右图所示)。因此,研究人员需要开发有效的技术手段来解决它们的效率问题。 此外,从图的右侧还可以看…

    2025年11月7日 科技
    000
  • SD社区的I2V-Adapter:无需配置,即插即用,完美兼容图生视频插件

    图像到视频生成(I2V)任务是计算机视觉领域的一项挑战,旨在将静态图像转化为动态视频。这个任务的难点在于从单张图像中提取并生成时间维度的动态信息,同时保持图像内容的真实性和视觉上的连贯性。现有的I2V方法通常需要复杂的模型架构和大量的训练数据来实现这一目标。 近期,快手主导的一项新研究成果《I2V-…

    2025年11月7日 科技
    000
  • 『拯救』开放异构场景 | HEAL:最新可扩展协作感知框架

    协同感知技术在解决自动驾驶车辆感知问题方面具有重要意义。然而,现有研究往往忽视了智能体之间可能存在的异构性,即传感器和感知模型的多样性。实际应用中,智能体之间的模态和模型可能会存在显著的差异,这导致了域差异的出现,使得协同感知变得困难。因此,未来的研究需要考虑如何有效地处理智能体之间的异构性,以实现…

    2025年11月7日 科技
    000
关注微信