전체 글(223)
-
NeRF++: Analyzing and Improving Neural Radiance Fields
NeRF++: Analyzing and Improving Neural Radiance Fields Kai Zhang, Gernot Riegler, Noah Snavely, Vladlen Koltun Abstract Neural Radiance Fields(NeRF)는 경계 장면의 360˚ 캡처와 경계 및 경계 없는 장면의 정향 캡처를 포함한 다양한 캡처 설정에 대해 인상적인 view synthesis 결과를 달성한다. NeRF는 뷰 불변도 및 뷰 의존적 컬러 볼륨을 나타내는 다층 퍼셉트론(MLP)을 훈련 이미지 세트에 맞추고 볼륨 렌더링 기술을 기반으로 새로운 뷰를 샘플링한다. 이 기술 보고서에서는 먼저 광도 장과 그 잠재적 모호성, 즉 형상 방사 모호성에 대해 언급하고, 그러한 모호성을 피하는 NeRF..
2022.02.23 -
NEURAL ARCHITECTURE SEARCH WITH REINFORCEMENT LEARNING
NEURAL ARCHITECTURE SEARCH WITH REINFORCEMENT LEARNING Barret Zoph, Quoc V. Le Abstract 신경망은 이미지, 음성 및 자연어 이해에서 많은 어려운 학습 과제에 잘 작동하는 강력하고 유연한 모델이다. 그들의 성공에도 불구하고, 신경망은 여전히 설계하기 어렵다. 본 논문에서, 우리는 반복 네트워크를 사용하여 신경망의 모델 설명을 생성하고 검증 세트에서 생성된 아키텍처의 예상 정확도를 최대화하기 위한 강화 학습으로 이 RNN을 훈련시킨다. CIFAR-10 데이터 세트에서, 우리의 방법은 처음부터 시작하여 테스트 세트 정확도 측면에서 인간이 발명한 최고의 아키텍처에 필적하는 새로운 네트워크 아키텍처를 설계할 수 있다. 우리의 CIFAR-10 모델..
2022.02.22 -
DROID-SLAM: Deep Visual SLAM for Monocular, Stereo, and RGB-D Cameras
DROID-SLAM: Deep Visual SLAM for Monocular, Stereo, and RGB-D Cameras Zachary Teed, Jia Deng Abstract 새로운 딥러닝 기반 SLAM 시스템인 DROID-SLAM을 소개합니다. DROID-SLAM은 밀도 번들 조정 레이어를 통해 카메라 포즈와 픽셀 단위 깊이의 반복적인 업데이트로 구성된다. DROID-SLAM은 정확하여 이전 작업에 비해 크게 개선되었으며, 치명적인 고장이 훨씬 적습니다. 단안 영상 훈련에도 불구하고 스테레오나 RGB-D 영상을 활용해 테스트 시 성능 향상을 이룰 수 있다. 1. Introduction 동시 로컬라이제이션 및 매핑(SLAM)은 (1) 환경 맵을 작성하고 (2) 환경 내에서 에이전트를 로컬라이제이션..
2022.02.16 -
PointNet: Deep Learning on Point Sets for 3D Classification and Segmentation
PointNet: Deep Learning on Point Sets for 3D Classification and Segmentation Charles R. Qi, Hao Su, Kaichun Mo, Leonidas J. Guibas Abstract 포인트 클라우드는 기하학적 데이터 구조의 중요한 유형이다. 불규칙한 형식 때문에 대부분의 연구자들은 이러한 데이터를 일반 3D 복셀 그리드 또는 이미지 모음으로 변환한다. 그러나 이로 인해 불필요하게 많은 양의 데이터가 생성되어 문제가 발생합니다. 본 논문에서, 우리는 입력에 있는 점의 순열 불변성을 잘 존중하는 포인트 클라우드를 직접 소비하는 새로운 유형의 신경망을 설계한다. PointNet이라는 이름의 네트워크는 객체 분류, 부품 분할, 장면 의미 파싱에..
2022.02.15 -
Volume Rendering of Neural Implicit Surfaces
Volume Rendering of Neural Implicit Surfaces Lior Yariv, Jiatao Gu, Yoni Kasten, Yaron Lipman Abstract 신경 볼륨 렌더링은 희박한 입력 이미지 세트에서 장면의 새로운 뷰를 합성하는 데 성공했기 때문에 최근 인기가 높아지고 있다. 지금까지 신경용적 렌더링 기법으로 학습한 지오메트리는 일반밀도함수를 이용해 모델링했다. 또한 기하학 자체는 밀도 함수의 임의 수준 세트를 사용하여 추출되어 노이즈가 많고 종종 낮은 충실도의 재구성을 초래했다. 이 논문의 목표는 신경 볼륨 렌더링에서 지오메트리 표현 및 재구성을 개선하는 것이다. 우리는 부피 밀도를 기하학의 함수로 모델링함으로써 그것을 달성한다. 이것은 부피 밀도의 함수로 지오메트리를 ..
2022.02.11 -
EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks
EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks Mingxing Tan, Quoc V. Le Abstract ConvNets(Convolutional Neural Networks)는 일반적으로 고정된 리소스 예산으로 개발된 다음 더 많은 리소스를 사용할 수 있는 경우 정확도를 높이기 위해 확장됩니다. 이 논문에서 우리는 모델 스케일링을 체계적으로 연구하고 네트워크 깊이, 너비 및 해상도의 균형을 신중하게 조정하면 더 나은 성능으로 이어질 수 있음을 확인합니다. 이러한 관찰을 바탕으로 우리는 간단하지만 매우 효과적인 복합 계수를 사용하여 깊이/너비/해상도의 모든 차원을 균일하게 스케일링하는 새로운 스케일링 방법을 제안합니다...
2022.02.10