3D Vision(39)
-
MegaSaM: Accurate, Fast, and Robust Structure and Motion from Casual Dynamic Videos
MegaSaM: Accurate, Fast, and Robust Structure and Motion from Casual Dynamic Videos Zhengqi Li, Richard Tucker, Forrester Cole, Qianqian Wang, Linyi Jin, Vickie Ye, Angjoo Kanazawa, Aleksander Holynski, Noah Snavely Abstract우리는 동적 장면의 캐주얼 단안 비디오에서 카메라 매개변수와 depth 맵을 정확하고 빠르고 견고하게 추정할 수 있는 시스템을 제시합니다.모션 및 단안 SLAM 기술의 대부분의 기존 구조는 주로 정적인 장면과 많은 시차를 가진 입력 비디오를 가정합니다.이러한 방법들은 이러한 조건이 없을 때 잘못된 추정치를 생성..
2025.06.19 -
Neural Inverse Rendering from Propagating Light (CVPR 2025 Best Student Paper)
Neural Inverse Rendering from Propagating Light Anagh Malik, Benjamin Attal, Andrew Xie, Matthew O’Toole, David B. Lindell Abstract우리는 전파하는 빛의 다중 시점 비디오에서 물리적 기반의 뉴럴 인버스 렌더링을 위한 최초의 시스템을 소개합니다.우리의 접근 방식은 뉴럴 래디언스 캐싱의 시간 분해 확장에 의존합니다 — 어느 방향에서든 도달하는 무한-바운스 래디언스를 저장하여 인버스 렌더링을 가속화하는 기술입니다.결과 모델은 직접 및 간접 빛 전송 효과를 정확하게 설명하며, 플래시 라이다 시스템에서 캡처한 측정값에 적용하면 강한 간접 빛이 존재하는 상황에서 SOTA 3D 재구성이 가능합니다.또한, 우리는 전파..
2025.06.18 -
VGGT: Visual Geometry Grounded Transformer (CVPR 2025 Best Paper)
VGGT: Visual Geometry Grounded Transformer Jianyuan Wang, Minghao Chen, Nikita Karaev, Andrea Vedaldi, Christian Rupprecht, David Novotny AbstractVGGT는 카메라 파라미터, 포인트 맵, depth 맵, 3D 포인트 추적 등 장면의 모든 주요 3D 속성을 하나, 몇 개, 수백 개의 뷰에서 직접 추론하는 피드포워드 신경망입니다.이 접근 방식은 모델이 일반적으로 단일 작업에 제한되고 전문화되어 온 3D 컴퓨터 비전에서 한 걸음 더 나아간 것입니다.또한 간단하고 효율적이며, 1초 이내에 이미지를 재구성할 수 있으며, 시각적 지오메트리 최적화 기법을 사용한 후처리가 필요한 대안들보다 여전히 뛰어난 ..
2025.06.17 -
Street Gaussians: Modeling Dynamic Urban Scenes with Gaussian Splatting
Street Gaussians: Modeling Dynamic Urban Scenes with Gaussian Splatting Yunzhi Yan, Haotong Lin, Chenxu Zhou, Weijie Wang, Haiyang Sun, Kun Zhan, Xianpeng Lang, Xiaowei Zhou, Sida Peng Abstract이 논문은 자율 주행 장면을 위한 동적인 도시 스트리트 모델링 문제를 해결하는 것을 목표로 합니다.최근 방법들은 추적된 차량 포즈를 애니메이션 차량에 통합하여 NeRF를 확장하여 역동적인 도시 거리 장면을 사진사실적으로 시각적으로 합성할 수 있게 합니다.그러나 학습 속도와 렌더링 속도가 느리다는 점에서 큰 한계가 있습니다.우리는 이러한 한계를 극복하기 위한 새로운 ..
2025.04.09 -
CityGaussianV2: Efficient and Geometrically Accurate Reconstruction for Large-Scale Scenes
CityGaussianV2: Efficient and Geometrically Accurate Reconstruction for Large-Scale Scenes Yang Liu, Chuanchen Luo, Zhongkai Mao, Junran Peng, Zhaoxiang Zhang Abstract최근 3D Gaussian Splatting (3DGS)은 효율적이고 고충실도의 새로운 뷰 합성을 나타내며 래디언스 필드 재구성에 혁명을 일으켰습니다.그러나 특히 크고 복잡한 시나리오에서 표면을 정확하게 표현하는 것은 3DGS의 비정형적인 특성으로 인해 여전히 중요한 과제로 남아 있습니다.이 논문에서는 기하학적 정확성과 효율성과 관련된 중요한 문제를 해결하는 대규모 장면 재구성을 위한 새로운 접근 방식인 Cit..
2025.03.24 -
VastGaussian: Vast 3D Gaussians for Large Scene Reconstruction
VastGaussian: Vast 3D Gaussians for Large Scene Reconstruction Jiaqi Lin, Zhihao Li, Xiao Tang, Jianzhuang Liu, Shiyong Liu, Jiayue Liu, Yangdi Lu, Xiaofei Wu, Songcen Xu, Youliang Yan, Wenming Yang Abstract기존의 NeRF 기반 대형 장면 재구성 방법은 종종 시각적 품질과 렌더링 속도에 한계가 있습니다.최근 3D 가우시안 스플랫팅은 소규모 및 객체 중심 장면에서 잘 작동하지만, 이를 큰 장면으로 확장하는 것은 제한된 비디오 메모리, 긴 최적화 시간, 눈에 띄는 외관 변화로 인해 도전 과제가 됩니다.이러한 문제를 해결하기 위해 3D 가우시안 스플..
2025.03.20