데일리 미션/미션

데이터 분석 보고서(분석 리포트)

pipiiiiii 2024. 8. 6. 15:07

데이터 분석 보고서

데이터 분석 보고서란 주제를 정하고 주제에 포함된 문제에 대해 데이터 분석을 통해 해결 방법을 찾고, 결과 및 활용 방안에 대하여 기술한 것으로 보고서에는 뚜렷한 목표와 분석 결과물과 결론이 있어야 한다.  

 

 

데이터 분석 보고서를 작성하는 이유

현재 어떤 상황인지 공유하고 앞으로 무엇을 해야 할지 결정하는데 도움 되기 위해 보고서를 작성한다. 

그렇기 때문에 보고서를 쓰느라 시간이 많이 들면 안 된다. 왜냐하면 작성된 보고서를 보고  Action을 하기 위해서인데 Action은 사실 때를 놓치면 의미가 없는 경우가 종종 있기 때문이다.  

 

 

데이터 분석 보고서 작성 순서

1. 논리구조 결정

거의 모든 보고서의 기본 틀은 바바라 민토의 경력과 노하우가 담겨있는 '논리의 기술'이라는 책에 담겨있다. 

책에 있는 내용을 통해 논리 구조와 구조 별 작성법에 대해 아래와 같이 정리해 봤다. 

  • 피라미드 구조
    • 민토의 구조는 피라미드 모양으로 표현될 수 있다. 
      주제 문장이 꼭대기에 위치하고 뒷받침 주장, 근거 데이터가 하위 단계로 나뉘어 구성된다. 이 구조를 통해 독자나 청중이 정보를 쉽게 이해하고 따를 수 있다.
    • 가장 먼저 핵심 메시지를 두괄식으로 전한다. 
      예를 들어 '저출산 문제 해결'에 대한 보고서라면 주제 문장을 '우리나라 저출산 문제의 해결을 위해 종합적인 정책 및 제도 개선이 필요하다'라고 작성해 보는 사람이 무엇을 말하고자 하는지 주제에 대해 정확히 인식시키는 것이다.  
    • 그다음에 전달한 주제에 대한 주장을 펼친다.  
    • 마지막으로는 앞서 설명하고 증명했던 내용을 다시 한번 더 요약해 준다.
    • 간결하게 표현하면 핵심 메시지 → 뒷받침 주장들 →  근거 데이터들 → 결론으로 이어지는 것이다.  

  • 중복과 누락 없이 MECE
    • 전체를 이루는 부분들이 겹쳐서 중복되거나, 부분들의 합이 하나도 누락되지 않는 것을 말한다. 
    • MECE는 상호 배타적이며 전체를 완전히 포괄하는 원칙을 의미한다. 
    • ME(상호 배타적, Mutually Exclusive)는 각 항목이 다른 항목과 중복되지 않고 분류되는 것을 말한다. 
      다시 말해, 하나의 범주에 속하는 항목은 다른 범주에 속하지 않아야 하는 것이다. 이는 중복을 피하고 각 항목을 명확하게 정의하는 데 도움을 준다.
    • CE(전체를 완전히 포괄하는, Collectively Exhaustive)는 모든 가능한 항목이 포함되어야 한다는 것을 의미한다. 
      모든 항목을 고려하여 아무것도 빠뜨리지 않고 완전한 범주를 형성하는 것이 중요하다. 
    • MECE 원칙을 활용하면 정보를 체계적으로 분류하고 전체적인 관점을 가질 수 있다. 이를 통해 분석 결과를 명확하게 정리하고 의사 결정을 내릴 때 빠짐없이 고려할 수 있다. 즉, 정확성과 명확성을 갖춘 구조화된 사고를 촉진하며, 효과적인 커뮤니케이션과 문제 해결에 도움이 된다.  
    • 앞선 피라미드에서 각 주장 간에 중복이나 누락이 없어야 하며, 근거 데이터들 또한 마찬가지로 중복과 누락이 없어야 한다.  
  • 전개 방식 SCQA 
    • SCQA는 상황-전개-질문-답변이다. 
    • 데이터 분석 리포트를 재미있게 만드는 스토리텔링이므로 독자의 관심을 끌기 위해 매우 중요하다. 
    • 이와 같이 전개하면 복잡한 문제를 구조화하여 이해하고, 적절한 질문을 던지며, 명확한 답변을 도출할 수 있다. 이를 통해 후에 데이터 분석과 결론 도출을 효과적으로 진행할 수 있다.  

 

2. 데이터 분석 프로세스

데이터 분석을 '데이터 분석 = 코딩 = python'이라고 인식하는 경우가 많은데 데이터 분석은 해당 도메인 지식을 기반으로 의사결정이나 행동을 이끌어내는 것을 목표로 하는 일련의 과정이다. 

 

데이터 분석에서 중요한 것은 목적이다. 데이터는 분석하는 목적과 맞아야 한다. 그리고 데이터를 분석한 목적에 대한 답을 줄 수 있어야 한다. 즉, 결론을 내리는 것이다.

 

결론과 데이터는 일치해야 한다. 

사용하는 데이터가 말하고자 하는 결론과 일치할 때, 결론을 뒷받침하는 논리적 설득력을 갖출 수 있다. 그리고 데이터와 결론의 중간에 들어가는 과정이 바로 '결과'다. 

 

결과는 데이터에서 결론을 이어주는 과정이자, 데이터를 설명하고 과학적으로 결론까지 이어주는 징검다리 역할을 한다. 데이터를 설명하는 결과가 나오고, 결과를 기반으로 결론을 맺게 된다. 

 

그렇다면 데이터로부터 바로 결론을 말하면 안 되는 것일까? 

그렇게 한다면 중간 과정 없이 훌쩍 뛰어넘는 것이기 때문에 듣는 사람이 불편하거나 이해하기 어려워진다. 

그러니 다양한 데이터의 종류와 수를 가지고 데이터 분석-시각화-결과-결론의 흐름으로 보고서를 작성하는 것이 좋다.  

 

3. 인사이트 도출

인사이트의 뒷받침 주장은 데이터가 반드시 근거로서의 역할을 할 때 신뢰를 줄 수 있다. 

그렇기 때문에 데이터 분석 보고서를 작성할 때는 뒷받침 주장에 대한 근거들이 명확한 데이터로 뒷받침되고 있는지 스스로 질문해야 한다.

 

그리고 데이터 분석의 결과로 도출한 인사이트가 내가 주장하는 바와 일치해야 한다. 만약 일치하지 않는다면 주장은 잘못된 것이다. 바로 이 부분이 데이터가 보여주는 현상을 무시하고, 말하는 이가 의도적으로 왜곡할 수 있는 포인트다. 

반대로 데이터의 출처, 시점, 기준, 조사방법 등 정의가 명확하고, 실력 있는 데이터 분석 전문가에 의해 인사이트가 도출되었다면 '올바른 데이터로부터, 올바른 결과를 도출했다'라고 말한다. 

 

데이터에서 인사이트를 도출하는 방법은 많이 있다. 하지만 기본적으로 4가지 방법을 통해 인사이트를 도출한다.   

  • 크기
    • 데이터의 양이나 규모를 나타내는 요소로, 인사이트를 도출하는 과정에서 중요한 역할을 한다. 
      크기를 통해 주어진 현상의 중요도를 이해할 수 있다. 
    • 크기를 도출하기 위해 다양한 방법을 사용할 수 있는데 대표적으로 크기에서 인사이트를 찾을 때는 '기준'이 있어야 한다. 
    • 기준은 다양하게 적용될 수 있다. 해당 데이터의 평균, 시계열 데이터인 경우 전년도 동월 대비 크기 등이 있고 크기를 나타내는 데이터에는 빈도, 양, 면적, 거리, 시간, 용량 등이 있다. 

      기준은 듣는 사람이 이해하기 쉬운 대상이어야 한다. 면적으로 예를 든다면 '축구장 만하다'라는 방식이 있다. 

      또한, 기준으로 시간과 공간 데이터를 비교할 수도 있다. 시점과 공간을 한 데 비교하는 데이터 분석 기술을 이용해 듣는 이에게 정확히 말하고자 하는 바를 전달할 수 있다.  
    • 일반적으로 크기를 비교하는 가장 기본적인 방법은 특정 변수의 빈도수, 합계 또는 총계를 계산하는 것이다. 이러한 결과는 주로 숫자로 표현되며, 막대그래프, 히스토그램, 파이 차트 등의 그래프를 활용하여 시각적으로 표현할 수 있다.
    • 정리하자면 크기는 익숙한 대상, 시간과 공간, 전년 등과 비교를 통해 인사이트를 도출한다. 이때 대표적으로 막대그래프, 히스토그램, 히트맵, 워드클라우드 등을 통해 데이터를 표현할 수 있다.    
  • 추세
    • 추세는 데이터의 변화 패턴을 분석하여 미래의 방향성을 예측하고, 데이터가 보여주는 현상에 대한 통찰력을 제공한다. 
    • 추세를 파악하기 위해서는 기간별 데이터를 비교하고 결과를 시간의 흐름에 따라 시각화해야 한다. 여러 기간의 데이터를 비교해 상승, 유지, 하락 등의 추세를 확인하고 해당 추세의 이유를 탐구해야 한다.  이를 위해선 해당 데이터 정의, 조사방법, 관련된 다른 지표, 동향 등을 고려해 데이터를 해석해야 한다. 
    • 추세를 표현하는 방법은 다양하다. 
      가장 일반적인 방법은 시계열 데이터에서의 선형 회귀 분석이나 지수 평활법 등을 사용하는 것이다. 
    • 추세를 도출하는 결과는 주로 그래프로 나타내어지며, 선 그래프, 산점도, 로그 차트 등을 활용해 변화 패턴을 시각적으로 분석할 수 있다.  
  • 편차
    • 편차는 데이터의 분포와 중심으로부터 편향 정도를 분석하는 데 사용된다. 
    • 데이터의 변별력을 알려주며 평균, 중앙값, 표준편차, 분위수 등을 계산하여 도출할 수 있다. 편차를 시각화할 때는 주로 히스토그램, 상자 그림, 산점도 등을 활용한다.  
  • 비율
    • 데이터 간의 상대적인 비교를 위해 사용되며, 두 변수 간의 관계를 파악하는 데 도움을 준다. 
    • 비율을 도출하기 위해 분석할 데이터의 범주를 설정하고, 해당 범주 내에서 각 항목의 비율을 계산한다. 이러한 결과는 주로 백분율, 비율 그래프, 파이 차트 등으로 표현된다.

데이터의 인사이트를 도출하는 방법에 대해 알아보았지만, 모든 데이터가 타입도 구조도 다르고 다루는 방식도 다르기 때문에 인사이트 도출 시 한 기준으로만 좁혀야 하는 것은 아니다. 여러 개의 기준을 사용해 조합하고 결론을 낼 수 있으며, 그럴 경우 더욱더 입체적이고 깊이 있는 결론에 도달할 가능성도 크다. 데이터를 분석하기 전 '데이터에서 어떠한 결과를 도출할 수 있을까, 무슨 말을 하지?'라고 생각해 보고 분석 방법을 결정하는 것이 좋다. 

 

결론적으로 데이터에서 인사이트를 도출하기 위해서는 크기, 추세, 편차, 비율을 포괄적으로 분석해야 한다. 이를 통해 데이터의 다양한 측면을 이해하고 명확한 결과를 도출할 수 있다. 

 

데이터 분석의 목적과 분석하고자 하는 데이터의 특성에 맞게 적절한 방법과 그래프를 선택해 분석을 수행하고, 객관적이고 정확한 분석 결과를 통해 인사이트를 도출하면 의사결정을 내릴 수 있다.  

 

4. 데이터 소스 정리  

데이터의 조사 방법이나 대상에 따라 결과가 달라질 수 있다. 그러니 우리는 데이터 분석 콘텐츠를 받아들이거나 수행할 때 아래의 내용을 주의해야 한다. 

  1. 데이터 정의와 지표명
    • 데이터 정의에 대해 명확히 해주어야 혼란이 없다. 
    • 데이터에 대한 정의, 지표명을 명시함으로써 데이터를 분석하고 활용하는 사람에 대해 혼란을 방지할 수 있다. 또한, 통계에 대한 한계점을 인식하고 정확히 데이터를 활용하는 출발점이 될 수 있다. 
  2. 데이터 출처와 기준
    • 둘 이상의 데이터를 비교할 때는 그 기준 시점을 통일해줘야 한다. 마치 우리가 다양한 물건의 길이를 잴 때, '자'라는 측정장치의 '0' 시점에서 모든 물건의 끝을 가져다 대는 것과 같다. 
  3. 조사 방법 / 기간 / 대상
    • 조사 방법
      • 크게 2가지로 나눌 수 있다. 조사 대상 모두를 조사하는 '전수 조사'와 전체 집단을 대표하는 표본을 뽑아 조사하는 '표본 조사'가 있다. 
      • 대부분은 표본을 사용해 모집단을 대표하는 데이터를 얻는다.
      • 올바른 표본을 추출하는 것은 매우 중요한데 어떤 추출방법을 사용하느냐에 따라 결과가 달라질 수 있다. 
      • 추출 방법에는 무작위 추출(랜덤), 체계적 추출(일정 간격), 비례 추출(집단 비율에 맞춰서), 다단계층화 추출(집단 특성별로), 군집 추출(대표하는 집단만 추출)이 있다.
    • 조사 기간
      • 조사 기간이 길어질수록 보다 정확한 대푯값을 얻을 수 있다. 
      • 그럼 각 지표마다 최소 얼마동안의 데이터를 조사해야 할까? 그에 대한 답은 '최소 하나의 주기(Cycle)'이 완성된 데이터다. 하나의 주기 데이터는 최소한 조사 기간에 포함되어야 한다. 
    • 조사 대상
      • 조사 방법이 아무리 체계적이고 과학적이라고 해도, 어느 정도의 절대적인 숫자가 되지 않으면 조사 결과에 대한 신뢰도는 낮을 수밖에 없다. 
      • 최소한의 샘플 개수는 30개 이상이어야 한다. 그래야 정규분포를 이루게 된다. 

 

지금까지 데이터 분석 리포트 작성방법을 크게 4가지로 구분해서 알아보았다. 이것을 데이터 분석 보고서 작성에 표현하면 다음과 같다. 

 

말하고자 하는 바인 결론 또는 목적을 가장 먼저 생각한다.

그리고 데이터에서 얻어낸 인사이트를 통계적, 분석적 지식에 의거하여 인사이트를 결과로 정리한다.

이때 인사이트 도출에 쓰이는 주요 방법은 크기/추세/편차/비율이 있고, 다양한 데이터 시각화 스킬을 이용해 부분과 전체로 나눠 표현할 수 있으며, 데이터 소스에 대해 데이터 정의와 지표명, 출처와 기준시점, 조사방법/기간/대상을 데이터에 표현함으로 데이터의 신뢰도를 높일 수 있다.  

 

데이터 분석 보고서 작성 팁

신뢰할 수 있고, 명확하고 간결하며, Action 하고 싶은 보고서를 작성할 수 있는 다양한 팁을 알아봤다. 

  • 스토리텔링 기법을 사용한다. 
  • '만약에~' 기법을 사용한다. 
    • 만약에를 사용하면 청자의 상상력을 불러일으키고, 그 상황에 감정이입하게 할 수 있다. 
  • 고객을 주인공으로 캐스팅한다. 
    • 고객을 주인공으로 캐스팅하여 역경과 이를 극복할 Action Item 들을 제시하여 고객의 입장에서 공감할 수 있도록 이야기를 전개할 수 있다.  
  • 3줄에서 4줄로 전체 내용 요약한다. 
    • 시간이 없는 경영진, 리포트를 읽기 전 전체 내용을 파악하고 싶은 실무자들을 위해 핵심 내용을 요약해 독자를 배려하는 것이다.  
  • 독자 / 청자를 파악하고 구체화한다.  
    • 독자와 청자를 명확하게 파악해야 그에 맞는 정보 전달과 Action Item 발굴이 가능하다. 
  • 시각화와 목적에 맞는 그래프 사용한다.  
    • 시각화 또는 그래프를 그릴 대 각 데이터를 대표할 수 있는 색상을 일관되게 사용하는 것이 좋다. 
  •  Action Item 여러 가지 제시한다. 
    • 여러 가지 방법에 대해 논의할 수 있게 A안, B안, C안 등을 제시하는 것이 더 좋다.  
  • 한계점과 가정 명시한다. 
    • 분석 보고서가 지닌 한계점을 명시하되, 굳이 말할 필요 없는 것들은 타 부서의 책임으로 느껴질 수 있으니 필요한 경우 한계점을 충분히 설명한다. 그리고 분석에 사용한 가정을 설명한다.  
  • 그 외 확인하면 좋은 것들   
    • 차트에서 끔찍한 색을 사용하지는 않았는지
    • 일관된 폰트와 폰트 사이즈를 사용했는지
    • 테이블의 모든 셀이 동일한 정렬을 갖추고 있는지
    • 숫자를 표시하는 기준은 동일한지
    • 셀프 피드백하기(하루 뒤에 보기, 오타 확인, 내용을 누가 봐도 이해가 가능한지 확인)
    • 주변 직장 동료, 지인에게 피드백받기
    • 리포트를 미리 공유해  Action Item에
    • 토론 자리를 만들 수 있다면 제시한 각각의  Action Item이 어떻게 진행되고 있는지 파악하기  

 

 

분석 보고서 작성 시 주의 사항

1. 내가 일한 순서대로 전부 나열하지 말기

내가 어떻게 작업했는지 보고 받는 사람은 관심이 없다. 그러니 이 보고서를 쓰는 목적이 무엇인지 되짚어보고, 그 목적을 잘 달성하기 위한 전체적인 목차를 구성해야 한다. 

 

블로그의 글을 쓴다는 심정으로 목차를 잡고 그 목차를 뒷받침하기 위해 어떤 내용의 그래프 또는 표가 들어가면 좋겠다고 전체적인 스토리라인을 잡는 게 데이터 시각화의 첫 번째 스텝이다. 

 

2. 꼭 있어야 하는 그래프 빼고 다 지우기

왜 있는지 모르겠는 그래프를 나열해서 보고서를 쓰는 것보다 각각의 그래프가 왜 필요한지, 진짜로 필요한지 판단한 후 사용해야 한다. 있으나 없으나 상관없는 그래프들을 모두 다 빼기만 해도 깔끔한 보고서가 된다. 

 

3. 한눈에 들어오게 시각화하기 

선이나 바의 색상을 의미가 통하는 색상으로 사용하는 것이 좋다. 예를 들어 성별을 표시한다면 빨간색은 여성, 파란색은 남성으로 색을 정하는 것이다. 또한, 영어로 된 변수명은 한글로 바꾸고, 숫자에 콤마도 찍어주는 것이 좋다. 사소하고 작은 차이지만 기껏 열심히 한 결과물인데 그 사소한 것 때문에 남이 제대로 안 읽어주면 본인만 손해다.

 

4. 적절한 제목과 설명 붙이기

그림만 그리지 말고 글도 써야 한다. 같은 그래프를 가지고도 다른 해석을 하고 그 해석을 악용하는 사람도 있기 때문이다. 그리고 제목은 정말 중요하다. 제목만 보고 보고서나 그래프를 자세히 봐야 하는지 아닌지 판단하는 사람도 있기 때문이다. 그러니 내용을 가장 잘 설명할 수 있으면서 매력적인 제목을 지어주면 좋다.          

 

 

 

인사이트

분석 보고서 작성은 클라우드 다음으로 많이 보이는 직무여서 자세하게 알아봤다. 

막상 알아보니 분석 보고서를 작성하는 것에도 다양한 정보가 있어서 새로웠고, 나도 프로젝트를 한 후에 분석 보고서를 작성해 보면 경험도 쌓이고 도움도 되지 않을까 생각하게 됐다. 

 

생각해 보면 그동안 분석 보고서를 제대로 작성한 적은 없는 것 같다. 그리고 작성하더라도 오늘 본 다양한 글처럼 상대를 설득하고, 정보를 알려주는 방식이 아니라 내 정보를 나열하는 방식으로 작성한 것 같다. 

 

앞으로 프로젝트를 하게 되면 다 한 후 꼭 분석 보고서까지 작성해서 경험을 계속 쌓아야겠다.   

 

 

 

 

 

 

참고 자료

 

'데일리 미션 > 미션' 카테고리의 다른 글

인사이트  (0) 2024.08.12
클라우드 알아보기  (0) 2024.07.28
게임 이탈률 분석  (0) 2024.07.19
게임 로그 분석  (0) 2024.07.14
일주일 쉬려다 한 달 쉰 후기  (0) 2024.06.25