LowCode低码时代LowCode低码时代
  • 首页
  • 低代码/零代码动态
    低代码/零代码动态
    厂商融资信息、行业新闻、招投标、技术研究等动态
    Show More
    Top News
    AIGC点燃低/零代码市场
    3年 ago
    万字长文 | 低代码vs.传统开发:一个全面的比较
    2年 ago
    西门子Mendix低代码高级架构师卢春霖,将出席“低代码开发推动制造业数字化变革”线上研讨会
    2年 ago
    Latest News
    重磅!OpenAI开源首个Agent SDK,反击Manus
    1年 ago
    云计算巨头AI战略分化:谁将定义企业级AI的未来规则?
    1年 ago
    DeepSeek创造历史!登顶全球AI应用第2名,豆包排名第10
    1年 ago
    2025“赋能开发者”高峰论坛即将启幕,诚邀您报名参加!
    1年 ago
  • 市场研究
    市场研究Show More
    《Market Insight:中国低代码/零代码市场发展洞察 ( 2023 )》报告正式发布 | LowCode低码时代
    3年 ago
    国产大模型顶流「讯飞星火」:图片生成、代码生成,支持插件等重磅上线
    3年 ago
    报告 | 金现代:效能提升+内质跃迁,重塑电力IT领导者
    3年 ago
    Gartner:低代码的颠覆性力量
    3年 ago
    Gartner:什么是超级应用程序?
    3年 ago
  • 人物观点
    人物观点Show More
    原力CEO赵锐:ToDesk是国内唯一适合高精远程办公需求的解决方案
    2年 ago
    央视财经对话汪源:低代码最核心的是降低对写代码的人的要求
    3年 ago
    干货文章 | 低代码真的有价值吗?
    3年 ago
    壹沓科技融资近2亿元之后:以通用大语言模型赋能,构建数字机器人超级大脑
    3年 ago
    专访中银金科:数字营销成为新的增长引擎,未来业务转化是关键
    3年 ago
  • 活动
    活动
    最新活动,包含线上研讨会、技术预测峰会、线下峰会、…
    Show More
    Top News
    ISIG中国产业智能大会品牌介绍
    4年 ago
    炎黄盈动金融行业高级顾问张自刚,受邀出席“2022金融科技超自动化论坛”
    3年 ago
    超自动化·智启高效运营|艺赛旗2023年春季产品发布会成功举办
    3年 ago
    Latest News
    2024第五届ISIG产业智能大会,四大科技峰会共掀数字化创新浪潮
    1年 ago
    参赛者必看 | 拯救者杯OPENAIGC开发者大赛最全攻略指南来啦~
    2年 ago
    2024第四届ISIG产业智能大会(RPA超级自动化、AIGC大模型、低代码/零代码、流程挖掘)
    2年 ago
    超自动化·智启高效运营|艺赛旗2023年春季产品发布会成功举办
    3年 ago
  • 关于低码时代
    • LowCode原创研究
Reading: 高效大规模创新3D重建模型iLRM
Share
Notification Show More
Latest News
30部佳作突围!2025 AI视听创作嘉年华晋级名单揭晓,总决赛11月25日启幕
未分类
《2025 AI 大模型开发生态白皮书》正式发布 | 算泥社区
未分类
“AI幻想·未来亦城”2025AI视听创作嘉年华作品征集来了!
未分类
120万奖池,寻找最具想象力的AI创意开发者!2025骁龙人工智能创新应用大赛正式启动!
未分类
2025-10-21
未分类
Aa
LowCode低码时代LowCode低码时代
Aa
  • 低代码/零代码动态
  • 最新市场研究
  • 活动
  • 人物观点
  • 首页
  • 低代码/零代码动态
  • 最新市场研究
  • 人物观点
  • 活动
  • 关于低码时代
Have an existing account? Sign In
  • LowCode低码时代
Copyright©2015-2022 北京企智未来科技有限公司 All Rights Reserved.
LowCode低码时代 > Blog > 未分类 > 高效大规模创新3D重建模型iLRM
未分类

高效大规模创新3D重建模型iLRM

孙婷婷-LowCode低码时代
Last updated: 2025/09/01 at 6:02 下午
孙婷婷-LowCode低码时代 7月 ago
Share
SHARE

基于前馈网络的3D建模方法因其快速且高质量的重建能力而备受关注。尤其是直接生成显式3D表示的方法,因其快速渲染能力和广泛的应用前景而受到青睐。但多数现有的基于Transformer架构的模型在处理多视图输入时面临严重的可扩展性问题。

这些方法依赖于对所有输入视图的图像token进行全注意力计算,随着视图数量或图像分辨率的增加,计算成本呈二次方增长。所以,成均馆大学、延世大学的研究人员提出了创新3D重建模型iLRM来解决难题。

iLRM通过迭代细化机制生成3D高斯表示,并严格遵循三大核心原则:解耦场景表示与输入图像,从而实现紧凑的三维表示;将全注意力多视图交互分解为两阶段注意力方案,以减少计算成本;在每一层注入高分辨率信息,以实现高保真重建。

在架构设计的起始阶段,iLRM采用了视点标记化模块,其作用是将输入视图的相机姿态信息转化为模型可以处理的格式。研究人员利用Plücker射线嵌入来表示每个输入视图的几何信息。

Plücker坐标作为一种数学工具,能够有效捕捉像素和视图空间的变化,从而区分不同视图中的像素块。通过将每个视图的Plücker射线嵌入划分为非重叠的块,并将其重塑为一维向量,研究人员能够生成一个紧凑的视点标记集合。这些视点标记随后通过一个线性层进行编码,为后续的三维重建过程提供了一个高效的初始表示。

在处理输入图像时,iLRM进一步采用了多视图图像标记化。该模块的作用是将输入图像中的视觉信息提取出来,并将其与视点标记进行融合。对于每个输入视图图像,研究人员首先将其划分为非重叠的块,然后分别提取RGB图像块和Plücker射线块。这两个块被拼接在一起,并通过一个线性层进行投影,从而生成图像标记。

这些图像标记不仅包含了输入图像的视觉信息,还融合了相机姿态信息,为三维重建提供了丰富的上下文线索。这种设计使得模型能够在处理多视图输入时,充分利用每个视图的视觉信息,从而提高重建的准确性和细节表现。

在多视图上下文建模方面,iLRM提出了一种高效的两阶段注意力机制,以应对传统三维重建方法中常见的计算复杂度问题。传统的三维重建方法通常依赖于全注意力机制来处理多视图输入,但这种方法会导致计算复杂度随着视图数量和图像分辨率的增加而呈二次方增长。

为了解决这一问题,iLRM将多视图交互分解为两个阶段:交叉注意力和自注意力。在交叉注意力阶段,每个视点标记与其对应的图像标记进行交互,这种一对一的交互方式计算效率非常高。而在自注意力阶段,所有视点标记之间进行全局信息交互,从而捕捉到不同视图之间的依赖关系。这种两阶段设计不仅降低了计算复杂度,还保留了全局信息交互的能力,使得模型能够在处理大规模输入视图时保持高效的性能。

iLRM的核心是其更新块,这是一个迭代细化机制,用于逐步优化三维场景表示。更新块由多个Transformer模块组成,每个模块包含一个交叉注意力层和一个自注意力层。在交叉注意力层中,视点标记通过与图像标记的交互进行更新,从而引入视觉信息。在自注意力层中,视点标记之间进行全局信息交互,进一步优化其表示。

为了更好地捕捉视点标记和图像标记之间的空间对应关系,iLRM引入了一种标记提升策略。由于视点标记的分辨率通常低于图像标记,这种分辨率差异可能会限制模型对细节信息的捕捉能力。标记提升模块通过一个线性查询层将低分辨率的视点标记提升到更高的分辨率,从而生成更细粒度的查询标记。

这些提升后的标记与高分辨率的图像标记进行交叉注意力计算,从而更好地捕捉视觉对应关系。在交叉注意力计算完成后,提升后的标记被重新映射回原始分辨率,并通过一个线性投影层恢复到原始的嵌入维度。这种设计不仅保留了更新后的信息,还保持了后续自注意力层的计算效率。

在处理大规模输入视图时,交叉注意力的计算成本可能会成为瓶颈。为了解决这一问题,iLRM提出了一种小批量交叉注意力机制。该机制通过选择性地采样图像标记和视点标记,显著降低了交叉注意力的计算复杂度。研究人员设计了几种结构化的采样策略,这些策略在保持计算效率的同时,还能够有效地捕捉视图之间的视觉信息。

在训练阶段,iLRM通过最小化重建图像与真实图像之间的均方误差和感知损失来优化模型参数。感知损失使用预训练的VGG网络计算,以确保生成的图像在视觉上与真实图像相似。这种训练目标不仅关注重建图像的像素级准确性,还考虑了图像的视觉质量,从而使得模型能够生成高质量的三维场景表示。

在经过多层迭代更新后,iLRM将最终的视点标记解码为三维高斯参数。这一过程通过一个线性层完成,并应用后激活函数来生成高斯分布的均值、协方差、颜色和不透明度等参数。这些参数随后被用于渲染目标视图的图像,从而实现高质量的三维重建。

You Might Also Like

30部佳作突围!2025 AI视听创作嘉年华晋级名单揭晓,总决赛11月25日启幕

《2025 AI 大模型开发生态白皮书》正式发布 | 算泥社区

“AI幻想·未来亦城”2025AI视听创作嘉年华作品征集来了!

120万奖池,寻找最具想象力的AI创意开发者!2025骁龙人工智能创新应用大赛正式启动!

孙婷婷-LowCode低码时代 2025-09-01
Previous Article OpenAI刚刚发布GPT-Realtime,AI Agent进入超逼真对话时代
Next Article 腾讯开源WMT2025冠军大模型:拿下30个第一,同类最佳
Leave a comment

发表回复 取消回复

您的电子邮箱地址不会被公开。 必填项已用*标注

about us

关注中国低代码(LowCode)无代码/零代码领域,包括行业研究、市场报告、技术选型和媒体报道,推进低代码的技术普及、生态建设发展和产业应用,重塑IT开发和自动化的未来。

  • 最新市场研究
  • 人物观点
  • 低代码/零代码动态
  • 活动
  • 联系我们
  • RPA中国
  • 数字金融网
  • 信创中国
  • Xverse元宇宙

最新专家访谈

原力CEO赵锐:ToDesk是国内唯一适合高精远程办公需求的解决方案
央视财经对话汪源:低代码最核心的是降低对写代码的人的要求
干货文章 | 低代码真的有价值吗?
壹沓科技融资近2亿元之后:以通用大语言模型赋能,构建数字机器人超级大脑
专访中银金科:数字营销成为新的增长引擎,未来业务转化是关键
实现技术普惠 网易数帆轻舟低代码的差异化竞争之道
LowCode低码时代LowCode低码时代

Copyright©2015-2022 北京企智未来科技有限公司 All Rights Reserved.
京ICP备19023145号-8

  • LowCode低码时代
订阅最新动态!

订阅最新低代码/零代码市场报告、研究咨询、分析师趋势以及市场活动

Zero spam,可随时取消订阅.

Removed from reading list

Undo
欢迎回来!

登录你的账号

Lost your password?