뮤트 개발일지

제로베이스 데이터사이언스 스쿨 3기 5개월 차 후기 본문

제로베이스

제로베이스 데이터사이언스 스쿨 3기 5개월 차 후기

박뮤트 2022. 9. 30. 17:15

https://zero-base.co.kr/category_data_camp/school_DS

 

제로베이스 데이터 취업 스쿨 | zero-base

제로베이스에서 취업까지 누구나 원하는 데이터 직무로 취업하는 온라인 교육과정

zero-base.co.kr

벌써 5개월이 끝났다. 시간이 너무 빠른 듯 안빠른 듯 빠른...(?)


1. 프로젝트 진행 상황

고여있는 물을 감지하는 프로젝트를 진행하고 있다.

이 프로젝트는 민형기 강사님께서 기업과 연계해서 진행하는 프로젝트인데, 이슈가 좀 있었다.

 

프로젝트에 관해 잠시 설명하자면, 

원래 치과 의료용 기계 개발을 위해서 입 안에 있는 침과 피를 detection하는 프로젝트였다.

그런데 입 안의 침과 피를 찍은 데이터셋을 구하기 어려워  물 웅덩이를 먼저 detection하고 이후에 기업 측으로부터 데이터셋을 받아서 좀 더 진행해볼 여지가 있는 프로젝트였다. 또한 물 웅덩이를 감지하는 모델을 만들면, 다른 곳에서도 쓰일 곳이 많아(예로 공장 바닥에 있는 물을 감지하여 청소하는 로봇 개발 등) 이렇게 진행하게 되었다. 

 

그래서 데이터셋을 구할 때 여러 물 웅덩이 영상이 있었지만, 치과에서 사용하기 위해서는 침이 투명해서 치아와 혀가 다 비치니, 물이 투명한 게 잘 드러나는 데이터셋을 구해야겠다고 생각했다. 그래서 유튜브에서 구한 물이 매우 투명한 갯바위 영상으로 진행했다. 물이 너무 투명해서 라벨링을 하는 동안에도 이게 돌인지 물인지 나조차도 구분이 안되어서 걱정이 많았다.

 

약 2주 동안 라벨링을 진행했다.

labelme를 사용하였고, 거의 2주동안 점만 찍어대니 손목이 시큰거렸다... (이래서 3d라고 하는구나.. 뼈져리게 느끼며...^^.....)

그런데..!

라벨링이 마무리 되었을 때 기업이 바뀌었다는 소식을 들었다..!

바뀐 기업의 목표는 도로에 있는 물을 감지하는 것이었고, 생각해보면 영상에서의 물이 투명할 필요가 없을 것 같은......(도로에 있는 물은 마른 바닥에 비해서 색이 좀 더 진하므로...) 어쨌든 라벨링을 다 진행했기 때문에 그냥 해 놓은 데이터셋으로 일단 진행하고 있다.

 

물 웅덩이를 감지하는 건, 물 웅덩이의 형태가 고정되어 있지 않기 때문에 난이도가 좀 있는 편이라고 했다.

거기다가 우리 팀 영상은 더 난이도가 있다. 그래서 모델이 잘 탐지할 수 있게 만들면 오히려 좋은 거 아닐까?ㅎㅎ...

 

현재까지는 영상이 아니라 영상에서 프레임별로 추출한 사진 데이터로 먼저 진행했다.

이정도라도 해줘서 고마워ㅠㅠㅠㅠㅠ

물론 IOU나 mAP로 본 결과는 좋지 않지만, 얼추 감지하는 걸 보고 감사했다...

라벨링하면서 얼마나 걱정했는지ㅠㅠㅠㅠㅠ

 

사용한 모델은 Faster RCNN, Mask RCNN이었고, 이후 U-Net으로도 한 번 해보고 싶은데 어떻게 될지 모르겠다.

MMDetection으로 진행했는데, 얘한테는 U-Net이 없어서 backbone 작업을 해야하고, 

MMSegmentation으로 진행하려면 현재 사용한 Coco 데이터셋을 변환시켜야한다.

 

암튼 앞으로 영상으로도 해보고, 현재는 epoch를 12번밖에 안 돌렸는데, 파라미터 조정도 해보고 epoch도 늘려서 성능을 좀 더 개선하는 방법들을 찾아봐야할 것 같다.


2. EDA Test

이번 달에도 어김없이 EDA Test가 있었다.

문제는 전과 동일하게 슬랙으로 배포되고 문제를 푼 다음 같이 준 파이썬 파일을 이용해 채점을 진행한 뒤 제출하는 형식이다.

프로젝트로 정신없는 와중에 테스트가 있었기 때문에, 솔직히 이번 테스트 그냥 안하고 넘길까 고민을 엄청했다.

근데 왜인지 안하고 넘어가기엔 찝찝한..? 그래서 일단 해보고 시간이 너무 오래 걸리면 패스하자, 하고 풀기시작했는데..

역시나 안 풀리면 끝까지 잡고 있는 버릇이 나왔다..ㅋㅋㅋㅋㅋㅋㅋ

 

중간에 문제에서 groupby한 후 해결해야하는 문제가 나왔는데,

이전부터 멀티 인덱스를 잘 다루지 못했기 때문에 오기가 생겨서 구글링 엄청하고 이것저것 시도해보았다.

그러다가 원리가 이해되면서 풀리는 순간..! 환희와 기쁨...ㅋㅋㅋㅋㅋ 이래서 코딩하지ㅠㅠㅠㅠㅠ 

문제 풀기전: 하.. 왜 프로젝트로 바쁜데 테스트까지 보는 거야ㅠㅠ 짜증나ㅠㅠ 하기 싫어ㅠㅠㅠㅠ
문제 풀고 나서: 역시 중간중간 EDA 감을 잃지 않게 해줘야 한다니까? ㅋㅋㅋㅋㅋ
(태세전환)

3. 커리어 서비스 

9월 말에 커리어 상담 서비스가 시작됐다.

두 가지를 제공하는데,

1. 박신영 코치의 이소서 첨삭

2. 2명의 모의 면접관과 모의 면접 진행

 

이소서 첨삭은 9월 말에 한 번 받고, 이후 한 번 더 받을 수 있는 것 같다.

그러나 나는 아직 이력서와 자소서가 준비되어 있지 않고, 다른 곳에서 몇 번 대략적인 첨삭을 받은 적이 있어서 이번에는 신청하지 않았다.

그래서 후기를 남기기에는 모호하지만, 다른 분들에게 들은 내용으로는 <뻔한 내용 반 + 도움되는 내용 반>이라고 한다. 

2명에게 이야기를 들었는데, 공통적으로 추천하는 바는 열심히 준비한 이력서와 자소서를 들고가면 도움을 받을 것이라고 한다.

잘 준비해서 이후에 첨삭을 한 번 받아봐야겠다.

 

그리고 모의면접은 10월 초에 받는 걸로 신청해놨다.

모의면접에서 나올 질문들을 먼저 받고, 또 이력서와 자소서를 먼저 보내드리면 첨삭도 받을 수 있다.

먼저 받았던 지인의 말로는 이분에게 많은 도움을 받았다고 한다. 딱딱하게 진행되지도 않았고, 현업에서의 이야기와 자신이 궁금했던 얘기까지 다 물어보고 답변받을 수 있었던 좋은 시간이었다고 한다. 그래서 클로바로 녹음하고 정리까지 해뒀다는...

 

아직 커리어 서비스를 본격적으로 받은 것은 아니지만,

10월에 있을 모의면접이 기대된다. 모의 면접 준비도 잘 하고, 이소서도 잘 작성해서 보내봐야겠다.


이제 한 달정도 남았다. 후우... 준비가 되어가고 있음을 느낀다.

사회생활을 한지 오래되었는데, 다시 사회에 나갈 준비중..!

끝까지 잘 마무리하고 사이드 프로젝트도 해보면서 포폴을 늘려가보자!

화이팅!