데일리 미션/Article

Article : 단순 데이터 추출은 멈추자

pipiiiiii 2024. 7. 30. 13:28

https://playinpap.github.io/data_extraction/

 

단순 데이터 추출은 멈추자

*DW/BI 업무를 주로했던 시절 경험을 토대로 데이터 추출에 대해 개인적인 경험에 대해서 정리하였습니다.…

playinpap.github.io

 

 

 

<아티클 내용 요약>

데이터 관련 업무를 하다 보면 데이터 추출을 생각보다 많이 하게 된다. 

그리고 하루 종일 쿼리만 보면서 단순히 데이터 추출을 하고 있으면 '그냥 반복 업무 아닌가, 이걸 왜 해야 하지, 나에게 아무런 도움도 안 되는 거 같아'라고 생각할 수밖에 없다. 

 

그러나 여기서 핵심은 '단순히 데이터 추출만 한다면' 그렇다는 것이다. 

 

단순한 데이터 추출이란 아래와 같다. 

  • 누군가 나에게 '이러한 지표 어떻게 뽑아주세요'라고 요청한 경우 그것을 그대로 실행해 데이터를 뽑아주는 것

 

그렇다면 단순한 데이터 추출이 아닌 것은 무엇일까? 아래와 같다. 

  1. 요청 주신 데이터가 과연 목적에 맞는 데이터일까?
    추출 요청이 오면 요청 목적과 데이터 형식을 받게 된다. 
    이때, 데이터 형식에 맞게 쿼리를 작성하려고만 하는 것이 아니라 해당 목적에 과연 그 데이터를 보는 것이 맞는지를 먼저 생각해야 한다. 

  2. 목적에 맞는 데이터(지표)들을 추가적으로 제공하자. 
    목적을 위해 어떤 데이터를 보는 것일지 생각해 보는 것도 좋지만 핵심은 목적에 맞게 능동적으로 데이터를 구상하여 제공한다는 것이다. 

    목적에 맞게 데이터를 구상하여 제공하는 것은 말은 쉬워 보이지만 굉장히 많은 생각을 해야 하고 중요하다. 
    '목적과 가설에 따른 측정 지표를 세울 수 있어야 한다'는 말은 분석에서도 그리고 데이터 추출에서도 모두 공통적으로 중요한 말이다. 

  3. Ad-hoc 탐색적 분석 결과도 같이 제공하자.
    데이터를 뽑아서 데이터만 주는 것보다 해당 데이터를 탐색한 시각화 및 그에 대한 의견도 같이 전달하는 것이 좋다. 

    탐색적 분석한 결과를 제공하면 다음과 같은 이점이 있다. 
    - 탐색 과정에서 파생되는 문제를 발견할 수 있다. 
    - 데이터 추출을 요청한 사람에게 더 명확한 정보를 제공할 수 있다.
    - 데이터 추출을 요청한 사람과 해당 목적에 대해 가설을 다시 세우고 단순 추출이 아닌 의미 있고 임팩트 있는 분석으로 진행될 수 있다. 

    단순히 데이터 추출만 제공하는 것이 아닌 능정독인 데이터 구상과 탐색적 분석의 결과를 같이 제공하게 되면 데이터 리터러시 역량을 성장시킬 수 있고, 과정 속에서 생각지도 못한 인사이트가 발견될 수 있으며, 가설을 세워 테스트 혹은 사업의 방향성을 결정하는데 크게 기여할 수 있다. 

 

이처럼 추출 업무도 내가 어떻게 하는가에 따라 단순 노동이 될 수 있고 혹은 의미 있고 임팩트 있는 일이 될 수 있다. 

추출뿐만 아니라 어떠한 일들이라도 다시 한번 회고해 보고 어떻게 더 효율적/회사에 이득이 되는 방향으로 진행할 수 있는지 고민해 보는 것도 좋다. 

 

 

 

<알게 된 개념>

데이터 분석가로 취업을 한다면 분석보다 추출 업무를 더 많이 한다는 것을 알 수 있었다.

그리고 무슨 일을 하든 내가 어떻게 하느냐에 따라 나의 역량이 향상되는지 혹은 그냥 머무르게 되는지도 새삼 생각하게 됐다. 

 

무슨 일을 하든 시키는 일만 하는 것과 더 필요한 것은 없는지, 어떤 방향으로 나아가면 나에게 더 도움이 되고 다른 사람에게 더 도움이 되는지를 생각하고 하는 것은 다르다는 것을 인지하고 무슨 일이든 더 좋은 방향으로 나아갈 수 있게 해야겠다.