Google ML Bootcamp 2021 텐서플로우 자격증 취득 준비하기
구글 머신러닝 부트캠프 참여한지 벌써 한달이 다 되어 간다.
다른 수강생들과 달리 코세라 강의를 조금 빨리 들은 덕분에 시간이 남아서 본래 계획이라면 바로 GCP Data Engineer Certicate를 취득하는 것을 목표로 했으나 9월 중에 2주 정도의 시간을 할애해서 텐서플로우 자격증 취득을 먼저하는 것으로 목표를 약간 추가하게 되었다.
보다시피 구글 운영팀에서 쿠폰을 받아 시험을 등록하게 되었고, 시험 일자는 지정해서 보는 게 아니라 시험 등록 후에 6월 내에 자기가 보고 싶은 때 등록해서 보는 것으로 취득하는 형태로 보인다.
그런데 시험을 온라인으로 치르면서 환경 설정을 직접 준비해서 치르는 형태로 진행되는 것 같다.
파이참 환경에서 텐서플로우 플러그인을 설치하고 해당 환경에서 제작한 모델을 직접 제출하는 방식으로 작업을 진행하는 것 같은데 내 노트북이 M1 실리콘 맥북이다 보니 텐서플로우 2.5.0 버전이 지원하지 않는 상황이 발생했다.
어떻게든 우회하는 방법을 생각해봤으나 (아키텍처 단계에서 반도체가 다른 거라 애플리케이션에서 로제타처럼 우회하는 방식으로 사용하는 게 맞는지도 의문이고) 우회해서 설치하는 방식은 현재 2.4.0까지만 지원하고 있다.
결과적으론 내 노트북에 시험에 필요한 가상환경 구축이 어렵겠다고 판단, Colab 또는 주피터 노트북을 제공하는 가상 머신을 써야겠다고 판단하게 되었다.
버전 자체는 큰 차이가 안나겠지만, 텐서플로우 시험에서 안내하고 있는 것처럼 아나콘다를 쓰지 않으면서 텐서플로우, 텐서플로우 데이터셋, 판다스, 넘파이를 설치해야하는데 M1 맥북에서 거의 대부분의 시험 환경에 필요한 버전 호환이 아나콘다를 사용 안하면 설정이 안된다.
실제 시험을 봐야 알겠지만 시험 환경에서 파이참의 시험 플러그인만 설치하고 코드는 모두 가상머신에서 .h5 모델 파일을 생성해서 작업하는 형태로 진행이 될 듯 싶다.
코랩을 사용해서 아래와 같이 설정하고자 했으나 문제가 발생했다.
해당 방식을 따라 설치해도 계속해서 버전이 코랩에 내장된 버전으로 돌아간다.
설정 버튼을 클릭해서 설치한 모듈을 고정하는 방식도 있어서 시도해봤으나 시간이 지나면 또 다시 초기화된다.
거기다 설치하는 모듈들 용량이 크지도 않은데 설치하는데 시간 정말 오래 걸린다.
시험을 빨리 봐야하는데 환경 구축 테스트에서 시간이 너무 오래 소요되서, 어떻게 시험을 어떻게 봐야하나 싶었는데, 다행히 내가 현재 참여하고 있는 프로젝트의 다른 팀에서 가상머신 서비스를 10월 중순까지 무료로 제공하고 있어서 이걸 토대로 테스트 환경을 구축하게 되었다.
디폴트 설정이 텐서플로우 2.5.0이고 파이썬 언어도 3.8 버전이라 이걸 사용하기로 결정하게 되었다.
(아마 이 환경으로 다른 사람들이 나와 동일하게 시험보기는 어렵지 않을까 싶다.)
나처럼 노트북의 문제로 인해 클라우드 환경을 구축해서 시험을 치뤄야하는 상황이라면 코랩의 유료 버전을 잠깐 결제해서 사용하는 것도 하나의 방법이 될 수 있고, 본인이 사용할 수 있는 가상 머신이 있다면 그걸 사용하는 것도 답이 될 수 있다.
추가적으로 위의 코드 내용을 이미지에서 보고 따라 치는 게 귀찮은 사람은 순서대로 아래 코드를 복사해서 사용하면 된다.
아래의 첫번째 코드는 파이썬 3.8.0을 주피터 노트북에 설치하는 방법이다.
2번째 코드는 # !pip install tensorflow-datasets==4.3.0 Pillow==8.2.0 pandas==1.2.4의 주석을 풀고 실행하면 모듈이 모두 잘 설치된다.
참고로 모듈 설치하고 기존에 설치되어 있는 모듈은 커널을 재시작해야 업데이트되는 점을 참고하자.
위의 2개의 환경 설정은 코랩과 Backend.ai 모두 정상적으로 동작한다.
Backend.ai를 사용하면서 좋은점은 GPU를 최대 2대나 지원해줘서 GPU 연산 속도를 체험해 볼 수 있다는 점이다 (M1 맥북도 GPU 있는데 얼른 써보고 싶다.. 후;)
시험은 곧 보고 후기를 남기겠다.
후기
자격증 취득에 성공했다 (2021.09.16)
최종 수료증은 2주 내에 올 예정이고, 시험은 전혀 어렵지 않았다.
코세라에서 제공하는 Tensorflow-in-Practice를 잘 공부하면 바로 취득할 수 있다.
총 학습 기간은 대략 2주 조금 못미치게 본 것 같고, 시험 등록 과정은 이 영상을 보면 도움이 될 것이다.
그리고 가상환경 걱정은 애초에 할 필요가 없었다… 플러그인 설치하고 시험 시작하면 알아서 온라인 에디터로 연결되서 채점하는 것으로 보여서 굳이 환경 설정을 내가 할 필요가 없었다.
이거 환경 설정하는 것만 어제 8시간이나 썼는데, 정말 허탈하다.
시험 자체가 너무 쉬워서 큰 도움이 될 거라는 생각은 안되지만, 이제 프로젝트 중심으로 최종 학습을 진행하고 GCP Data Engineer Certificate를 준비하자.
Peace!
Ryan