한 권으로 비전 시스템 기본기 다지기
이 도서는 “한빛미디어 <나는 리뷰어다> 활동”을 위해서 책을 제공받아 작성된 서평입니다.
2월에 시작했던 한빛 미디어 도서 리뷰가 벌써 추석을 앞두고 있다.
한 달에 한 권 읽기를 목표로 했던 나의 리뷰 도서단 활동은 이번으로 7회째이고, 꾸준히 책을 읽는 과정은 역시 업무적나 커리어적으로 많은 도움이 되고 있다.
이번에 읽은 책은 “비전 시스템을 위한 딥러닝”이라는 책으로 현업 개발자가 읽으면 당연한 지식들을 풀어놓은 것으로 보일지 모르나, 이제 코세라 등에서 딥러닝 강의를 막 보고 한 번 실습이나 간단한 프로젝트를 시도해보고 싶은 사람, 또는 R-CNN / YOLO 계열 논문이나 GAN 등 이미지 생성 등에 대해 한국어 글을 읽고 이에 대한 프로젝트를 시도해 보고 싶은 사람 등이 보면 매우 많은 도움이 될 것이다.
(딥러닝 학습 욕구를 불러일으키는 방법 중 하나는 내가 배울 분야가 어떻게 적용되는지를 직접 눈으로 확인하는 것이고, 나는 내 인생 최고 영화에서 YOLO 모델이 적용된 것을 봤던 순간을 잊을 수가 없다.)
이 글을 읽고 실습할 자료를 찾아다니면서 느낀 점은, 요즘만큼 딥러닝과 인공지능에 배우기 좋은 시점이 없는 것 같다는 것이다.
2016년 이세돌 & 알파고 대국 이후 많은 인공지능 학습 관련 자료가 국문으로 번역되기 시작했고, 텐서플로우나 파이토치 등에 대한 자료와 딥러닝을 업으로 삼는 많은 리서치 엔지니어들이 논문에 대한 리뷰를 올리기 시작했다.
그러나 책으로 특정 논문에 대해 설명을 해주거나 어떻게 사용되는지에 대해 풀이를 해주는 것은 아직까지 찾아보지 못했었는데, 때마침 “비전 시스템을 위한 딥러닝”에서 이러한 내용들을 설명해주고 있었다.
내 스스로 제일 인상 깊었던 것은 크게 2가지였다.
첫번째는 R-CNN 계열에 대한 해설이 책에 포함되어 있다는 점이다. 예전에 업스테이지라는 스타트업의 딥러닝 코딩 테스트를 본적 있고, 이 코테는 Faster R-CNN을 사용해서 재활용품을 분리하는 모델을 구성하는 것이었다.
당시에 논문과 다른 한국어 자료들을 2일에 걸쳐 찾아보면서 정리하고 나서 과제를 시작했는데, 이렇게 책으로 보니 반갑지 않을 수가 없다.
그리고 딥러닝 기초 학습 내용에 대해서도 앞부분에서 다루고 있기 때문에 온라인으로 강의를 한 번 이상 들어봤던 사람이라면 소화하기 위한 단계로 이 책을 보는 것도 상당히 좋은 선택이 될 것이다.
나는 최근에 한국어 음성 AI 경진대회를 참여하고 있고, 다행스럽게도 데이터 기본 전처리 능력은 통과한 덕분에 현재 예선전을 치르고 있다.
기본 업무가 Ops 쪽이다보니, 아직 딥러닝 모델을 다룰 일이 많이 없어 조금 버겁지만, 이 책을 참고하면서 모델을 작업하고 추론하면서 모델 성능을 조금씩 올리고 있다.
놀라운 것은 베이스라인 코드로 제공받은 내용에서 KoSpeech라는 모델에 VGG가 포함되는 것인데, 요새는 많은 비전 논문에서 VGG를 본인들이 작업한 모델과의 성능 비교 또는 본인들의 모델에 포함시켜 작업하는 경우가 꽤 있는데, 음성 인식에도 이 VGG라는 것이 사용된다.
합성곱 신경망 (CNN)도 사실 이미지에만 쓰이는 것 같지만 NLP에도 꽤 쓰이는 것 같아서 결국 리눅스가 CS 공부의 근본이 되는 것처럼 분야에 상관없이 배우는 딥러닝 기초 지식 (순전 & 역전파, 하이퍼 파라미터 튜닝 등)은 동일하게 적용된다는 뜻이다.
MLOps 업무를 더 깊이있고, 튼튼하게 수행하기 위해서는 무엇보다도 모델에 대한 이해가 수반되어야 한다.
나는 그 기반 작업을 하고 있는 것이고, 지금 배운 지식이 앞으로 어떻게 활용될지는 모르지만, 분명히 내 성장에 기여할 것이다.
앞으로 5년, AI가 세상을 변화시키는데 큰 일조를 할 것이라 믿기 때문에 내 인생의 5년을 한 번 AI에 올인해보고자 한다.
작은 욕심이지만,,, 한빛 미디어에서 딥러닝 & MLOps 관련 책을 선정 도서에 더 많이 넣어줬으면 좋겠다..ㅋㅋ
Ryan