데일리 미션/Article

Article : 데이터에 입덕한지 1300일째 깨달은 6가지

pipiiiiii 2024. 8. 8. 16:37

https://playinpap.github.io/data-analyst/

 

데이터에 입덕한지 1300일째 깨달은 6가지

🕵🏻 이 글의 원문은 저자의 블로그 에서 확인하실 수 있습니다. Intro 안녕하세요. 데이터 분석가 주정…

playinpap.github.io

 

 

<아티클 내용 요약>

1. 정량과 정성 그 사이 어딘가

정량 데이터 100%가 아닌 정량과 정성 분석이 함께 해야 더 큰 시너지를 낼 수 있다는 걸 깨달았다. 실무에서는 정성 관점에서 나온 인사이트를 정량화하는 것이 액션과 성과로 이어질 확률이 높다. 

 

O2O 플랫폼 같은 경우도 오프라인 현장에서는 생각지도 못했던 일들이 많이 발생한다. 유저의 많은 케이스들을 데이터로 모두 예측할 수 없기 때문에 데이터만 믿고 섣불리 판단하면 안 된다. 내가 본 데이터의 정합성이 안 맞을지도, 일반화의 오류일 수도 있다. 그래서 넘쳐나는 데이터 속에서 요즘은 정성적인 부분들도 어떻게 정량화할 수 있을지 고민하게 된다. 

 

 

2. Kaggle은 독이 될 수도 있다. 

처음 데이터를 2년 정도 공부했을 때는 데이터만 보고 달려들던, 머신러닝만 돌릴 줄 알면 된다고 생각하던, 모델 정확성만 따졌다. 그러나 공모전과 캐글에서 하던 모델링과 현업에서의 모델링은 달랐다. 데이터 분석가의 주관적인 관점에서 캐글의 가장 큰 문제점은 문제를 던져준다는 것이다. 현업에서 일을 하면서 내가 직접 어떤 문제를 풀어야 할지부터 정의해야 한다. 따라서 데이터 분석가가 캐글에서 얻어가야 할 포인트는 EDA 과정이지 좋고 빠르고 정확한 모델링을 완성하냐가 아니다. 

분석가냐 엔지니어냐의 관점에 따라 캐글을 대하는 접근법이 달라야 한다. 

 

 

3. 도메인 선정의 중요성

데이터분석은 첫째도 둘째도 비즈니스라고 생각한다. 내가 속한 산업의 비즈니스 모델을 제대로 파악하지 못한다면 좋은 분석의 방향으로 흘러갈 수 없다. 데이터 분석은 숲에서 나무를 봐야 한다고 생각한다. 따라서 데이터가 잘 활용되고 잘 흘러가는 산업을 선택하는 것도 중요하다.   

 

 

4. Easy 하게 말과 글 : 보고서와 커뮤니케이션

데이터 분석가에게 중요한 역량 중 보고서와 커뮤니케이션 역량이 70% 이상 차지한다는 생각이 든다. 그래서 내가 속한 팀이 기능 조직인지 목적 조직인지는 굉장히 중요하다. 

 

기증 조직에서 데이터 분석가들과 실무 커뮤니케이션을 할 때, 목적 조직에서 다른 직무분들에게 보고서를 써야 할 때, 데이터 분석가끼리 소통할 때 할 수 있는 말과 글은 크게 다르다. 나와 같은 전공을 가진 사람과 일을 할 때의 갭은 굉장히 크고 어떤 단어를 스킵하고 넘어갈 수 있을지, 주석을 달아서 설명해야 할지를 고민하게 된다. 

 

데이터를 깊게 파고들면 제삼자가 보면 어려운 영역입니다. 보고서를 쓸 때도 대시보드를 만들 때도 이제는 '이 것도 모를까?'가 아니라 '이런 부분들까지도 심플하게 설명해 드려야겠다'라고 이해할 수 있게 됐다. 기업의 규모가 커질수록 다양한 구성원이 존재하고 내가 한 분석이 의사결정에 반영되려면 통계적인 부분이 기각될 수도 있고 좀 더 심플해져야 할 수도 있다. 

 

 

5. 데이터 분석가는 조직에서 아웃라이어다. 

데이터 팀만 경험했을 때는 몰랐지만 목적 조직을 경험했을 때 크게 깨달을 수 있었다. 우리는 조직에서 기획자, 마케터 등 다양한 분야의 동료들과 일한다. 대부분의 사람들은 통계를 좋아하지 않고 어려워한다. 통계학과 출신조차도 잘 이해하고 설명할 수 있는 사람이 많지 않다.

 

사람들을 만날 때 어떤 멋진 통계적 기법이자 수단을 사용할지가 아니라 내가 어떻게 통계적 수단을 언제 심플하게 활용할 수 있을지, 쉽게 설명해 줄 수 있을까부터 고민하게 된다. 아무리 멋진 통계와 알고리즘을 사용해도 조직에서 모두가 공통적으로 이해하지 못하면 그 의미가 적다고 생각한다. 

 

 

6. 데이터 프로덕트화

데이터 분석 업무를 처음 했을 때, 기능 조직이든 목적 조직이든 ad-hoc성의 데이터 추출 업무를 무수히 경함 하게 된다. 수비수인 리포트와 시각화 머신, 쿼리몽키에서 벗어나는 방법은 공격수가 되는 것이다. 

 

서포트 업무 외에도 비즈니스 또는 서비스에 적용될 수 있는 부분들을 제안하는 것도 좋을 것 같다. 공격수가 되어서 AB 테스트 실험 설계부터 결과 배포까지 내가 직접 기획한 것들이 서비스에 적용되어야 한다. 내가 한 분석이 기획되어 서비스에 Action으로 이어지는 것이 베스트라고 생각한다.    

 

 

<알게 된 개념>

예전에 봤던 아티클들의 이야기들이 모여있다고 생각했다.

데이터 분석가로 처음 일을 할 때 어떻게 해야 내가 성장할 수 있는지, 어떤 소프트 스킬이 필요한지 등의 다양한 정보들이 한 아티클에 다시금 정리되어 나에게 잊으면 안 된다고 알려주는 느낌이 들었다.