Computer Vision(16)
-
Deeper Depth Prediction with Fully Convolutional Residual Networks (번역)
Deeper Depth Prediction with Fully Convolutional Residual Networks Iro Laina, Christian Rupprecht, Vasileios Belagiannis, Federico Tombari, Nassir Navab Abstract 이 논문은 하나의 RGB 이미지가 주어진 장면의 깊이 맵을 추정하는 문제를 다룹니다. 우리는 단안 이미지와 깊이 맵 사이의 모호한 매핑을 모델링 하기 위해 잔차 학습을 포함하는 완전 컨볼루션 아키텍처를 제안합니다. 출력 해상도를 개선하기 위해 네트워크 내에서 피쳐 맵 업샘플링을 효율적으로 학습할 수 있는 새로운 방법을 제시합니다. 최적화를 위해 우리는 특히 당면한 작업에 적합하고 깊이 맵에 일반적으로 존재하는 값 분포에..
2021.04.19 -
DenseNet: Densely Connected Convolutional Networks (번역)
Densely Connected Convolutional Networks Gao Huang, Zhuang Liu, Laurens van der Maaten, Kilian Q. Weinberger Abstract 최근 연구에 따르면 컨볼루션 네트워크는 입력에 가까운 레이어와 출력에 가까운 레이어 사이에 더 짧은 연결을 포함할 경우 훨씬 더 깊고 정확하며 효율적으로 훈련할 수 있습니다. 이 논문에서는 이러한 관찰을 수용하고 피드 포워드 방식으로 각 레이어를 다른 모든 레이어에 연결하는 DenseNet (Dense Convolutional Network)을 소개합니다. L계층이 있는 기존의 컨볼루션 네트워크에는 각 계층과 후속 계층 사이에 하나씩 L연결이 있는 반면, 우리 네트워크에는 L(L+1)/2 직접 연..
2021.03.04 -
ResNeXt: Aggregated Residual Transformations for Deep Neural Networks (번역)
Aggregated Residual Transformations for Deep Neural Networks Saining Xie1 Ross Girshick2 Piotr Doll´ar2 Zhuowen Tu1 Kaiming He2 1UC San Diego 2Facebook AI Research Abstract 이미지 분류를 위한 간단하고 고도로 모듈화된 네트워크 아키텍처를 제시합니다. 우리의 네트워크는 동일한 토폴로지로 일련의 변환을 집계하는 빌딩 블록을 반복하여 구성됩니다. 우리의 단순한 설계는 몇 개의 하이퍼 매개 변수만 설정할 수 있는 동종의 다중 분기 아키텍처를 만듭니다. 이 전략은 깊이와 너비의 차원 외에도 필수 요소로 "cardinality"(변환 집합의 크기)라고 하는 새로운 차원을 제공합니다..
2021.03.03 -
GAN : Generative Adversarial Nets (번역)
Generative Adversarial Nets Ian J. Goodfellow, Jean Pouget-Abadie, Mehdi Mirza, Bing Xu, David Warde-Farley, Sherjil Ozair, Aaron Courville, Yoshua Bengio Abstract 우리는 적대적 프로세스를 통해 생성 모델을 추정하기 위한 새로운 프레임 워크를 제안합니다, 여기서 두 모델을 동시에 학습시킵니다: 데이터 분포를 캡처하는 생성 모델 G와 G보다 학습 데이터에서 표본이 나올 확률을 추정하는 차별 모델 D입니다. G에 대한 훈련 절차는 D가 실수를 할 확률을 최대화하는 것입니다. 이 프레임 워크는 미니 맥스 2인용 게임에 해당합니다. 임의의 함수 G와 D의 공간에는 G가 훈련 데이터 분..
2021.03.02 -
Mask R-CNN (번역)
Mask R-CNN Kaiming He Georgia Gkioxari Piotr Doll´ar Ross Girshick Facebook AI Research (FAIR) Abstract 개체 인스턴스 분할을 위한 개념적으로 간단하고 유연하며 일반적인 프레임워크를 제시합니다. 우리의 접근 방식은 이미지의 객체를 효율적으로 감지하는 동시에 각 인스턴스에 대해 고품질 분할 마스크를 생성합니다. Mask R-CNN이라고 하는이 방법은 경계 상자 인식을 위해 기존 분기와 병렬로 오브젝트 마스크를 예측하는 분기를 추가하여 Faster R-CNN을 확장합니다. Mask R-CNN은 학습이 간단하며 5fps로 실행되는 Faster R-CNN에 약간의 오버헤드만 추가합니다. 또한 Mask R-CNN은 다른 작업으로 일반..
2021.03.02 -
SPPnet: Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition (번역)
Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition Kaiming He, Xiangyu Zhang, Shaoqing Ren, and Jian Sun Abstract 기존 심층 컨볼루션 신경망(CNN)에는 고정 크기(예 : 224x224) 입력 이미지가 필요합니다. 이 요구사항은 "인공적"이며 임의의 크기/스케일의 이미지 또는 하위 이미지에 대한 인식 정확도를 떨어뜨릴 수 있습니다. 이 작업에서는 위의 요구사항을 제거하기 위해 네트워크에 또 다른 풀링 전략인 "공간 피라미드 풀링"을 장착합니다. SPP-net이라고 하는 새로운 네트워크 구조는 이미지 크기/스케일에 관계없이 고정 길이 표현을 생성할 수 있습니다. 피라미드..
2021.02.26