본문 바로가기

반응형

전체 글

(34)
인공지능 수첩 ( human pose estimation / Efficient Object Localization / CPM / Stacked Hourglass Network / Deep High-Resolution Network / SimpleBaseline ) human pose estimation 2D HPE 는 2D 이미지에서 (x, y) 2차원 좌표들을 찾아내고 3D HPE 는 2D 이미지에서 (x, y, z) 3차원 좌표들을 찾아내는 기술 ​ ​ Top-down 모든 사람의 정확한 keypoint를 찾기 위해 object detection 을 사용 crop한 이미지 내에서 keypoint 를 찾아내는 방법으로 표현 detector가 선행되어야 하고 모든 사람마다 알고리즘을 적용해야 하기 때문에 사람이 많이 등장할 때는 느리다는 단점 ​ Bottom-up detector가 없고 keypoint를 먼저 검출합니다. 한 사람에 해당하는 keypoint 를 clustering함. detector 가 없기 때문에 다수의 사람이 영상에 등장하더라도 속도 저하가 크..
인공지능 수첩 ( SSD / TinaFace / RetinaFace / DSFD / S3FD / Multi-face detector ) SSD (Single Shot MultiBox Detector) 다양한 크기의 feature map을 사용 -> 원본 이미지에서 grid 크기를 다르게 하는 효과 convolution을 할 때 비율이 다른 default box를 설정 각 레이어에서 피쳐 맵들을 가져와 Object Detection을 수행한 결과들을 모두 합하여 localization loss와 confidence loss를 구한 다음, 전체 네트워크를 학습시키는 방식 학습 전에 ground truth와 defalt box의 jaccard overlap(IoU)이 0.5 이상인 것을 미리 매칭시켜 positive sample로 설정 ​ TinaFace 백본으로 ResNet50을 사용했고 기존에 존재했던 모듈(Feature Pyramid N..
인공지능 수첩 ( YOLO v1, v2, v3, v4 / PPYOLO / YOLOR / YOLOX / YOLOS ) YOLO v1 (You Only Look Once) 전체 이미지를 보는 횟수가 1회 클래스에 대한 정보와 주변 정보까지 한번에 학습하고 처리 Localization과 Classification을 동시에 수행 이미지를 신경망에 넣어주기만 하면 바로 detection이 가능 스트리밍 비디오에서도 실시간으로 객체를 detection할 수 있음. Object detection을 회귀 문제로 관점을 전환함. 여러 도메인에서 object detection이 가능 "이미지 내의 작은 영역을 나누면 그곳에 객체가 있을 수 있다." → grid 내에 객체가 존재한다. YOLO v1에서 grid는 고정되고, 각 grid 안에 객체가 있을 확률이 중요 이미지를 S x S grid로 나누고, box regression 단계와..

반응형