전체 글(252)
-
Feature Pyramid Networks for Object Detection
Feature Pyramid Networks for Object Detection Tsung-Yi Lin, Piotr Doll´ar, Ross Girshick, Kaiming He, Bharath Hariharan, and Serge Belongie Abstract 피처 피라미드는 다양한 스케일의 객체를 검출하기 위한 인식 시스템의 기본 컴포넌트입니다. 그러나 최근 딥러닝 객체 검출기는 컴퓨팅과 메모리 부하가 높기 때문에 피라미드 표현을 피하고 있습니다. 이 논문에서는 심층 컨볼루션 네트워크의 고유한 멀티 스케일 피라미드 계층을 이용하여 한계 추가 비용으로 피쳐 피라미드를 구축한다. 횡방향 접속이 있는 탑다운 아키텍처는 모든 척도에서 높은 수준의 시맨틱 피쳐 맵을 구축하기 위해 개발된다. Feature ..
2022.04.05 -
PointPillars: Fast Encoders for Object Detection from Point Clouds
PointPillars: Fast Encoders for Object Detection from Point Clouds Alex H. Lang, Sourabh Vora, Holger Caesar, Lubing Zhou, Jiong Yang, Oscar Beijbom Abstract 포인트 클라우드에서 물체 감지는 자율 주행과 같은 많은 로봇 애플리케이션의 중요한 측면입니다. 이 논문에서는 포인트 클라우드를 다운스트림 감지 파이프라인에 적합한 형식으로 인코딩하는 문제를 고려한다. 최근의 문헌에 의하면, 고정 인코더는 고속이지만 정확도가 저하되는 경향이 있는 반면, 데이터에서 학습한 인코더는 정확도가 향상되지만 속도가 저하되는 경향이 있습니다. 본 연구에서는 PointNets를 활용하여 수직 열(필러)로 구..
2022.03.31 -
Mip-NeRF: A Multiscale Representation for Anti-Aliasing Neural Radiance Fields
Mip-NeRF: A Multiscale Representation for Anti-Aliasing Neural Radiance Fields Jonathan T. Barron, Ben Mildenhall, Matthew Tancik, Peter Hedman, Ricardo Martin-Brualla, Pratul P. Srinivasan Abstract Neural Radiance Field (NeRF)에서 사용되는 렌더링 절차는 픽셀당 단일 ray로 장면을 샘플링하므로 학습 또는 테스트 영상이 다른 해상도로 장면 내용을 관찰할 때 지나치게 블러하거나 앨리어스되는 렌더링을 생성할 수 있습니다. 픽셀당 여러 개의 ray를 사용하여 렌더링하여 슈퍼샘플링을 수행하는 간단한 솔루션은 각 ray를 렌더링할 때 멀..
2022.03.29 -
Pyramid Stereo Matching Network
Pyramid Stereo Matching Network Jia-Ren Chang, Yong-Sheng Chen Abstract 최근 연구는 스테레오 이미지 쌍으로부터의 depth 추정이 컨볼루션 뉴럴 네트워크(CNN)로 해결되는 지도 학습 과제로 공식화될 수 있다는 것을 보여주었다. 다만, 현재의 아키텍처는 패치 기반의 Siamse 네트워크에 의존하고 있기 때문에, 부적절한 장소에서의 대응 관계를 검출하기 위한 컨텍스트 정보의 이용 수단이 없습니다. 이 문제를 해결하기 위해, 우리는 공간 피라미드 풀링과 3D CNN이라는 두 개의 주요 모듈로 구성된 피라미드 스테레오 매칭 네트워크인 PSMNet을 제안한다. 공간 피라미드 풀링 모듈은 다양한 규모와 위치의 컨텍스트를 집계하여 비용 볼륨을 형성함으로써 글..
2022.03.25 -
Mesh R-CNN (번역)
Mesh R-CNN Georgia Gkioxari, Jitendra Malik, Justin Johnson Abstract 2D 지각의 급속한 발전으로 인해 실제 영상의 물체를 정확하게 감지하는 시스템이 생겨났습니다. 그러나 이 시스템은 세계의 3D 구조를 무시하고 2D로 예측한다. 동시에, 3D 형상 예측의 진보는 대부분 합성 벤치마크와 분리된 물체에 초점을 맞추고 있습니다. 우리는 이 두 분야에서 진보를 통합한다. 우리는 실제 이미지에서 물체를 감지하여 각 물체의 완전한 3D 형상을 제공하는 삼각형 메쉬를 제작하는 시스템을 제안한다. Mesh R-CNN이라고 하는 우리의 시스템은 메쉬의 정점과 에지에 걸쳐 작동하는 그래프 컨볼루션 네트워크로 다듬어진 거친 복셀 표현을 먼저 예측하여 다양한 위상 구조의..
2022.03.23 -
DeepFusion: Lidar-Camera Deep Fusion for Multi-Modal 3D Object Detection
DeepFusion: Lidar-Camera Deep Fusion for Multi-Modal 3D Object Detection Yingwei Li, Adams Wei Yu, Tianjian Meng, Ben Caine, Jiquan Ngiam, Daiyi Peng, Junyang Shen, Bo Wu, Yifeng Lu2, Denny Zhou, Quoc V. Le, Alan Yuille, Mingxing Tan Abstract 라이다와 카메라는 자율주행 시 3D 감지를 위한 보완 정보를 제공하는 중요 센서입니다. 일반적인 멀티모달 방식[34, 36]은 원시 라이다 포인트 클라우드를 카메라 피쳐로로 장식하여 기존 3D 검출 모델에 직접 제공하지만, 본 연구에서는 원시 포인트 대신 깊이 있는 라이다 피쳐..
2022.03.22