전체 글(223)
-
ViSER: Video-Specific Surface Embeddings for Articulated 3D Shape Reconstruction
ViSER: Video-Specific Surface Embeddings for Articulated 3D Shape Reconstruction Gengshan Yang, Deqing Sun, Varun Jampani, Daniel Vlasic, Forrester Cole, Ce Liu, Deva Ramanan Abstract 단안 비디오에서 굴절된 3D 모양과 조밀한 3D 궤적을 복구하는 방법인 ViSER를 소개합니다. 동적 3D 모양의 고품질 재구성에 대한 이전 작업은 일반적으로 여러 카메라 보기, 강력한 범주별 사전 작업 또는 2D 키포인트 감독에 의존합니다. 2D 개체 마스크와 2프레임 광학 흐름만 입력으로 사용하여 비디오에서 장거리 대응을 안정적으로 추정할 수 있다면 이들 중 어느 것도 필요하지..
2022.02.09 -
MobileNetV2: Inverted Residuals and Linear Bottlenecks
MobileNetV2: Inverted Residuals and Linear Bottlenecks Mark Sandler Andrew Howard Menglong Zhu Andrey Zhmoginov Liang-Chieh Chen Google Inc. Abstract 이 논문에서는 다양한 모델 크기의 스펙트럼뿐만 아니라 여러 작업 및 벤치마크에서 모바일 모델의 최신 성능을 향상시키는 새로운 모바일 아키텍처인 MobileNetV2에 대해 설명합니다. 또한 우리는 SSDLite라고 하는 새로운 프레임워크에서 이러한 모바일 모델을 객체 감지에 적용하는 효율적인 방법을 설명합니다. 또한 Mobile DeepLabv3이라고 하는 축소된 형태의 DeepLabv3을 통해 모바일 의미론적 세분화 모델을 구축하는 방법을..
2022.02.08 -
FaceNet, A Unified Embedding for Face Recognition and Clustering 2021.11.19
-
NeRF−−: Neural Radiance Fields Without Known Camera Parametrs (번역)
NeRF−−: Neural Radiance Fields Without Known Camera Parametrs ZIRUI WANG, SHANGZHE WU, SHANGZHE WU, MIN CHEN, VICTOR ADRIAN PRISACARIU 이 논문은 알려진 카메라 포즈나 본질적인 요소 없이 2D 이미지에서 새로운 뷰 합성(NVS) 문제를 다룹니다. 다양한 NVS 기술 중 NeRF(Neural Radiance Field)는 놀라운 합성 품질로 인해 최근 인기를 얻고 있습니다. 기존 NeRF 기반 접근 방식은 각 입력 이미지와 관련된 카메라 매개변수가 학습 시 직접 액세스할 수 있거나 동작 구조와 같은 대응을 기반으로 하는 기존 기술로 정확하게 추정할 수 있다고 가정합니다. 이 작업에서 우리는 미리 계산된..
2021.07.27 -
NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis (번역)
NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis Ben Mildenhall, Pratul P. Srinivasan, Matthew Tancik, Jonathan T. Barron, Ravi Ramamoorthi, Ren Ng Abstract 희소한 입력 뷰 세트를 사용하여 기본 연속 체적 장면 함수를 최적화하여 복잡한 장면의 새로운 뷰를 합성하기 위한 최첨단 결과를 달성하는 방법을 제시합니다. 우리의 알고리즘은 완전히 연결된 (비컨볼루션) 심층 네트워크를 사용하는 장면을 나타냅니다, 입력은 단일 연속 5D 좌표(공간적 위치 (x, y, z) 및 보기 방향 (θ, Φ))이고 출력은 해당 공간 위치에서 볼륨 밀도 및 뷰에 따라 방..
2021.05.24 -
Deeper Depth Prediction with Fully Convolutional Residual Networks (번역)
Deeper Depth Prediction with Fully Convolutional Residual Networks Iro Laina, Christian Rupprecht, Vasileios Belagiannis, Federico Tombari, Nassir Navab Abstract 이 논문은 하나의 RGB 이미지가 주어진 장면의 깊이 맵을 추정하는 문제를 다룹니다. 우리는 단안 이미지와 깊이 맵 사이의 모호한 매핑을 모델링 하기 위해 잔차 학습을 포함하는 완전 컨볼루션 아키텍처를 제안합니다. 출력 해상도를 개선하기 위해 네트워크 내에서 피쳐 맵 업샘플링을 효율적으로 학습할 수 있는 새로운 방법을 제시합니다. 최적화를 위해 우리는 특히 당면한 작업에 적합하고 깊이 맵에 일반적으로 존재하는 값 분포에..
2021.04.19