인사이드 머신러닝 인터뷰 도서 리뷰

Ryan Kim
4 min readApr 28, 2024

--

머신러닝 인터뷰 질문으로 보는 머신러닝 기본기 자료 찾아보기

“한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.”

한빛 미디어에서 정기적으로 도서를 받아 보고 리뷰를 남기는 “나는 리뷰어다” 활동이 어느덧 2년 4개월째에 접어들었다.

개발 관련 트렌드를 이해하는 것과 동시에 MLOps Engineering을 하려면 머신러닝에 관한 개발 기본 지식을 이해하는 것도 필수이기에 이번엔 머신러닝 엔지니어의 인터뷰에 관한 도서를 선정하게 되었다.

짧은 시일 내에 내가 머신러닝 모델을 직접 연구하는 일은 거의 없을 것이라 판단하지만 (모델 연구에 관한 논문을 읽고 직접 구현하는 것에 대한 지식이 사실 없다고 판단해도 되므로), 회사에서 머신러닝 연구하는 분들의 작업을 멀리서 바라보면 요즘은 잘 만들어진 LLM 오픈소스 모델을 기반으로 본인 분야에 응용하는 것을 더 업무에 많이 활용하는 것 같고, 이 때문에 하이퍼 파라미터 튜닝이나 피처 값에 대한 처리, 그리고 데이터 품질 관리 및 경사하강법 등에 대한 용어들이 더 빈번하게 나타나는 것을 들어볼 수 있었다.

때문에 모델 개발에 직접 기여하는 것은 아니더라도 유관 업무를 수행해야만하는 내 입장에선 용어와 쓰임새에 대한 이해가 반드시 필요하다고 봤다.

(그리고 최근 딥러닝 토이 프로젝트 하나를 너무 하고 싶어서 중고 장비를 하나씩 구매해서 워크 스테이션을 맞췄는데, 책에서 나오는 용어들을 이해해 나가면서 On-device ML을 공부해보려고 하고 있다.)

회사 다니면서 내내 조립했던 서버들. 그리고 이젠 어떻게 조립해야할지 훤히 보인다.

무엇보다 추후에도 머신러닝 엔지니어들과의 커뮤니케이션은 반드시 필요하므로 이 책을 읽는 것은 큰 도움이 될 것이라 생각해서 선택하게 되었다.

이 책을 읽으면서 가장 큰 장점으로 생각했던 것은 ML 엔지니어가 아닌 소프트웨어 엔지니어가 볼 때 구글에 광범위하게 흩뿌려져 있는 ML 관련 용어들을 한 권으로 정리할 수 있다는 점이라고 생각했다.

조금 아쉬웠던 건, 이 책은 종이책으로 구매해서 각 용어 단위로 회사에서 어떤 상황에 이 용어가 언급되었고 어떻게 사용되는지에 대해 용어별로 주석처럼 기록하면 200% 활용할 수 있었을텐데 출퇴근하면서 지하철에서 읽어야하다보니 전자책으로 주문해서 읽은 게 안타까웠다.

가령, 하이퍼 파라미터 튜닝에 관련해서 회사에서 ML 엔지니어들이 Optuna를 사용하고 있고 최적화를 위해 Optuna study를 1000으로 설정해 Experiment 데이터와 Artifact를 MLFlow에 기록하고 있으며 이 때 매 study마다 값의 변경을 유도한 하이퍼 파라미터 값이 무엇인지 등을 함께 주석으로 기록하면서 봤다면 책의 이해도가 무척 높아졌으리라 생각한다.

게다가 ML 알고리즘 인터뷰에 대한 준비 문항도 함께 책에 수록되어 있는데, ML 쪽에 특화되어 있는 알고리즘을 물어볼 것이라고는 전혀 생각하지 못했다.

기본적으로 소프트웨어 엔지니어들과 동일한 알고리즘 문제를 풀 것이라 생각했는데 그것과는 확실히 차이가 있어보인다.

ML 엔지니어 관점에서는 당연한 것에 대한 개념 풀이라서 책에 대한 리뷰가 어떻게 달라질지는 모르겠지만, 적어도 이 책에 기록된 용어들에 대한 내용을 기반으로 본인이 수행했던 사이드 프로젝트에서는 어떤 것들을 사용했고, 어떤 문제들이 있었으며, 어떻게 이 문제들을 해결해나갔는지를 잘 설명하면 큰 도움이 될 수 있을 것이라 생각한다.

책에 대한 첫 인상은 마치 “인사이드 프론트엔드 인터뷰”, “인사이드 백엔드 인터뷰” 라는 책이 나왔다면 범위가 무척 넓은데 인터뷰 질문과 시스템 디자인에 대한 내용을 한 권에 담을 수 있을까 싶었는데 다행이 이 책은 300페이지 남짓한 분량에 각 용어들에 대한 충분한 설명을 포함하고 있다.

(다시 한 번 얘기하지만 이 책을 골자로 경험했던 것들을 채워나가면 금상첨화일 것이다!)

면접에 대한 주제가 194개나 있는 만큼 여기서 다뤄지는 개념들을 중심으로 학습하면 ML 쪽 면접 준비는 탄탄히 해놓을 수 있을 것이라 본다.

책 활용도가 높아서 지금 수행하는 on-device ml 공부하면서 틈틈이 자료를 찾아보며 학습해야겠다.

Ryan

--

--