뮤트 개발일지

제로베이스 데이터사이언스 스쿨 3기 4개월 차 후기 본문

제로베이스

제로베이스 데이터사이언스 스쿨 3기 4개월 차 후기

박뮤트 2022. 8. 29. 21:12

https://zero-base.co.kr/event/school_DS

 

제로베이스 데이터 취업 스쿨 | zero-base

제로베이스에서 취업까지 누구나 원하는 데이터 직무로 취업하는 온라인 교육과정

zero-base.co.kr

이제 3분의 2가 지났다. 시간 참 빠르다. 그리고 정신없다. 몸과 마음은 조금씩 지쳐가는 게 느껴지지만 좀 더 기운을 내 볼 때 인 것 같다.


1. 본격적인 ML 학습에 도입하게 된 소감

1.1 프로젝트 시작

머신러닝과 딥러닝 파트가 시작 됐다. 사실 이제는 강의에 맞춰서 진도를 나간다기보다는 지금 시작한 프로젝트에 맞는 공부를 하고 있다고 보는 게 더 맞다. 나는 물 웅덩이를 감지하는 프로젝트에 참여하게 되었다. 그래서 딥러닝, 그 중에서도 CV 파트를 더 공부하고 있다. 사용하는 모델은 YOLO와 R-CNN이 될 것 같다. 현재는 CNN 공부를 하고, R-CNN을 다시 살펴보고 있다. 이제 구한 데이터셋으로 테스트를 진행하려는 단계이다.

 

이렇게 딥러닝에 조금 더 초점이 맞춰져 있지만, kaggle 스터디를 하면서 머신러닝도 계속 붙잡고 공부하는 중이며, 중간중간 머신러닝 과제나 EDA 과제를 하면서 감을 잃지 않으려 노력 중이다. 

 

1.2 과제

1. 머신러닝 과제 1: 컴퓨터 언어 책 분석

현재 우리나라에서 출판된 컴퓨터 언어 책 데이터를 가져와서 분석하는 과제였다. 머신러닝 과제라고 명칭이 붙긴했으나, EDA 과제라고 보는 게 더 맞다. 크롤링을 통해 데이터를 수집하고, 언어별, 출판사별, 책의 페이지 수 등 다양한 방법으로 데이터를 분석하는 과제였다.

 

2. 머신러닝 과제 2: 야구선수 연봉 예측

투수 선수들의 연봉과 데이터를 가져와서 최동원 선수가 지금 현역이라면 연봉을 얼마나 받을까?하는 문제였다. 연봉 데이터를 구하는 것이 어려웠고 데이터의 수가 적어 예측이 잘 된 것 같지는 않았지만, 아무튼 나름대로 논리를 세워 문제를 해결해 나갔다. 시간이 적어 랜덤 포레스트, linear regression 정도밖에 사용을 못 해봤지만, 아무튼 그래도 재밌었던 과제였다. 기분 좋았던 것은 나름 주피터 노트북을 잘 정리해서 칭찬?을 받았다는 거다. :) 약간의 정리병이 있는 나에게는 정리 안 한 파일들이 더 괴롭지만, 암튼 이런 이유로 잘했다고 칭찬받으니 기분은 좋았다~

 

1.3 EDA level test 2

이 레벨 테스틑 왜 한 건지 잘 모르겠는데.. 아무튼 했다. 이거는 진짜.. 솔직히 별로였고, 하기 싫었다. 

일정표가 공유되는데, 며칠 전까지만 해도 일정표에 없던 테스트가 갑자기 생겼고, 시간도 금요일 오후 6시에 문제가 배포되어 다음날 아침인 토요일 오전 6시에 제출하라는 공지가 내려왔다... 당일에 일이 있었던 나는 그냥 안 하고 말까 하다가 찜찜해서 새벽에 문제를 풀었다.. 후.. 이런 일정은 밤을 새라는 게 디폴트가 아닌가. 문제를 풀면서도 짜증 나고 기분 나빴던 기억이 있다.

 

문제 자체는 크게 어렵지 않았다. 수월하게 풀었는데, 마지막 문제에 오류가 있었다. 문제 자체가 중의적 표현이 들어가 있었고, 이런 저런 방법으로 풀었는데도 결국 안 풀려서 새벽 5시? 경에 슬랙에 문제 오류인 것 같다, 채점에 유의해달라 남긴 후 제출하고 뻗었다..ㅋㅋㅋ 결국 문제 오류가 맞았고, 이 문제는 모두 맞은 것으로 하기로 했다.

 

사실 이 테스트는 어떤 의미로 주어지는 건지도 모르겠는 상황에서 새벽에 테스트를 진행했기 때문에 기분이 나빴던 것 같다. 테스트를 진행하는 이유에 대해서 말해줬다면 흔쾌히 했을 것 같다. EDA에 대한 감을 잃지 않는 게 중요하다고 본인도 생각하고 있기 때문이다. 암튼 소통이 참 잘 안된다. (이렇게 후기를 적어도 되나 싶지만 솔직한 심정이다. 뭐)


암튼 전반적으로 이제야 모델링도 하고 깊은 단계로 내려온 게 실감이 난다. 프로젝트 얼른 진도 쑥쑥 빼고 싶다.

 

2. 처음의 나의 목표와 중간 과정의 목표 비교하기

포스팅 했던 1개월 차 후기를 다시 읽어봤다. 보니까 생각한 대로 잘하고 있는 것 같다. 영어 부분에서 주저함이 있었고, 그걸 극복하기 위해서 캐글 스터디도 영어 노트북을 보면서 공부 중이다. 스택 오버 플로우나, 외국 사이트를 중점적으로 구글링 하면서 예전보다는 읽는 속도가 빨라진 걸 느낀다. 역시 익숙해지는 게 최고야.

 

그리고 조금 더 목표나 방향이 구체화되었다. CV에 관심이 많았는데, CV에서도 의료 쪽을 해보고 싶다는 생각이 든다. 또 데이터 분석가와 데이터 사이언티스트 중 뭐가 더 잘 맞을 지 고민했었는데(큰 차이 없는 기업들도 많지만) 데이터 분석보다는 모델링하는 것에 더 큰 흥미를 느끼고 있는 것 같다. 아직 비즈니스적인 사고가 부족한 탓이 큰 것 같지만..! 

 

암튼 차근차근 잘 하고 있다..!

4개월을 마무리 하면서 세워보는 목표!

1. 2개월 안에 부지런히 이번 프로젝트 완수하기 (현재는 1개월 안에 끝내는 걸 목표로 삼고 있다.)

2. 이력서, 자소서, 포트폴리오 잘 정리하기

 

남은 2개월도 지금처럼만 내 속도에 맞춰서 준비하면 괜찮을 것 같다.

다만, 우려스러운 점은 몸과 마음이 지쳐간다는 것이다. 좀 쉬는 시간이 필요한 것 같아 지난 주말동안 한적한 곳에 다녀왔는데, 마음껏 쉬었다는 느낌이 안 들었다... 속상... 이걸 타파하는 방법을 좀 고민해봐야 할 것 같다..

그래도 잘 될 거라는 믿음으로, 꾸준히 열심히 해보자..! 화이팅!

 


💡 이 글은 소정의 대가를 받고 작성됨 💡