전체 글(224)
-
Block-NeRF: Scalable Large Scene Neural View Synthesis
Block-NeRF: Scalable Large Scene Neural View Synthesis Matthew Tancik, Vincent Casser, Xinchen Yan, Sabeek Pradhan, Ben Mildenhall, Pratul Srinivasan, Jonathan T.Barron, Henrik Kretzschmar Abstract 대규모 환경을 나타낼 수 있는 Neural Radiance Fields의 변형인 Block-NeRF를 제시한다. 특히, 우리는 여러 블록에 걸쳐 도시 규모의 장면을 렌더링하기 위해 NeRF를 스케일링할 때, 장면을 개별적으로 학습된 NeRF로 분해하는 것이 중요하다는 것을 보여준다. 이 분해를 통해 렌더링 시간을 장면 크기에서 분리하고 렌더링을 임의로 큰 ..
2022.04.12 -
Center-based 3D Object Detection and Tracking
Center-based 3D Object Detection and Tracking Tianwei Yin, Xingyi Zhou, Philipp Kr¨ahenb¨uhl Abstract 3차원 객체는 일반적으로 포인트 클라우드에서 3D 박스로 표현된다. 이 표현은 잘 연구된 이미지 기반 2D 바운딩 박스 탐지를 모방하지만 추가 과제를 수반한다. 3D 월드의 객체는 특정 방향을 따르지 않으며, 박스 기반 검출기는 모든 방향을 열거하거나 회전하는 객체에 축 정렬 바운딩 박스를 장착하는 데 어려움을 겪는다. 본 논문에서는 대신 3D 객체를 포인트로 표현, 감지 및 추적할 것을 제안한다. 우리의 프레임워크인 CenterPoint는 먼저 키포인트 검출기를 사용하여 물체의 중심을 감지하고 3D 크기, 3D 방향 및 속..
2022.04.06 -
Feature Pyramid Networks for Object Detection
Feature Pyramid Networks for Object Detection Tsung-Yi Lin, Piotr Doll´ar, Ross Girshick, Kaiming He, Bharath Hariharan, and Serge Belongie Abstract 피처 피라미드는 다양한 스케일의 객체를 검출하기 위한 인식 시스템의 기본 컴포넌트입니다. 그러나 최근 딥러닝 객체 검출기는 컴퓨팅과 메모리 부하가 높기 때문에 피라미드 표현을 피하고 있습니다. 이 논문에서는 심층 컨볼루션 네트워크의 고유한 멀티 스케일 피라미드 계층을 이용하여 한계 추가 비용으로 피쳐 피라미드를 구축한다. 횡방향 접속이 있는 탑다운 아키텍처는 모든 척도에서 높은 수준의 시맨틱 피쳐 맵을 구축하기 위해 개발된다. Feature ..
2022.04.05 -
PointPillars: Fast Encoders for Object Detection from Point Clouds
PointPillars: Fast Encoders for Object Detection from Point Clouds Alex H. Lang, Sourabh Vora, Holger Caesar, Lubing Zhou, Jiong Yang, Oscar Beijbom Abstract 포인트 클라우드에서 물체 감지는 자율 주행과 같은 많은 로봇 애플리케이션의 중요한 측면입니다. 이 논문에서는 포인트 클라우드를 다운스트림 감지 파이프라인에 적합한 형식으로 인코딩하는 문제를 고려한다. 최근의 문헌에 의하면, 고정 인코더는 고속이지만 정확도가 저하되는 경향이 있는 반면, 데이터에서 학습한 인코더는 정확도가 향상되지만 속도가 저하되는 경향이 있습니다. 본 연구에서는 PointNets를 활용하여 수직 열(필러)로 구..
2022.03.31 -
Mip-NeRF: A Multiscale Representation for Anti-Aliasing Neural Radiance Fields
Mip-NeRF: A Multiscale Representation for Anti-Aliasing Neural Radiance Fields Jonathan T. Barron, Ben Mildenhall, Matthew Tancik, Peter Hedman, Ricardo Martin-Brualla, Pratul P. Srinivasan Abstract Neural Radiance Field (NeRF)에서 사용되는 렌더링 절차는 픽셀당 단일 ray로 장면을 샘플링하므로 학습 또는 테스트 영상이 다른 해상도로 장면 내용을 관찰할 때 지나치게 블러하거나 앨리어스되는 렌더링을 생성할 수 있습니다. 픽셀당 여러 개의 ray를 사용하여 렌더링하여 슈퍼샘플링을 수행하는 간단한 솔루션은 각 ray를 렌더링할 때 멀..
2022.03.29 -
Pyramid Stereo Matching Network
Pyramid Stereo Matching Network Jia-Ren Chang, Yong-Sheng Chen Abstract 최근 연구는 스테레오 이미지 쌍으로부터의 depth 추정이 컨볼루션 뉴럴 네트워크(CNN)로 해결되는 지도 학습 과제로 공식화될 수 있다는 것을 보여주었다. 다만, 현재의 아키텍처는 패치 기반의 Siamse 네트워크에 의존하고 있기 때문에, 부적절한 장소에서의 대응 관계를 검출하기 위한 컨텍스트 정보의 이용 수단이 없습니다. 이 문제를 해결하기 위해, 우리는 공간 피라미드 풀링과 3D CNN이라는 두 개의 주요 모듈로 구성된 피라미드 스테레오 매칭 네트워크인 PSMNet을 제안한다. 공간 피라미드 풀링 모듈은 다양한 규모와 위치의 컨텍스트를 집계하여 비용 볼륨을 형성함으로써 글..
2022.03.25