공부일기 44

결론 도출

1. 결과와 결론의 차이 결과 데이터 처리, 분석, 모델링 후에 얻어진 구체적인 데이터의 출력이다. 숫자, 통계, 그래프, 차트 등의 형태로 나타낼 수 있다. 계산과 분석을 해서 나온 결과물이다. 무엇을 결론 분석된 데이터 결과를 바탕으로 이끌어낸 의미나 통찰이다. 데이터에 기반한 해석, 추론 또는 권고 사항을 포함한다. 목적에 대해 어떤 의미가 있는지 설명하는 것이다. 그것이 왜 중요한지 우리에게 필요한 것은 '결론'이지만, 보통 '결과'를 많이 이야기한다. 결과와 결론은 이르는 과정이 본질적으로 동일하지만, 표현 방식이 다르다. 결론 도출 시 주의사항 결과 - 결론 도출 시에는 스토리텔링이 필요하다. 필요 이상으로 자신의 해석을 융합하변 안된다. 데이터를 통해 알 수 있는 범위에서만 생각해야 한다. ..

지표 설정

1. 지표 설정 1. 지표란? 특정 목표나 성과를 측정하기 위한 구체적이고 측정 가능한 기준이다. 목표 달성도를 파악하고 전략적 결정에 필요한 핵심 정보를 제공한다. 정의한 문제에 대해 정확하게 파악하기 위해서 필요하다. '어떤 결과를 기대하는가?'에 대한 정량화된 기준이다. 2. 주요 지표 이해하기 1. Active User(활성유저) Active User에 대한 정의에 따라 전략과 방향이 달라진다. Active User에 대한 정의로 '이탈 유저'가 정의된다. 서비스 지표에 중요한 역할을 한다. Active User 설정 예시 사이트 진입 유저 - 메인 홈 화면 진입 시 활성 유저로 정의한다. - 허들이 가장 낮다. - Active User 지표가 가장 높게 측정된다. - 그러나 해당 유저 대상 액션..

데이터의 유형

1. 정성적 데이터 vs 정량적 데이터 정성적 데이터 비수치적인 정보로 사람의 경험이나 관점, 태도와 같은 주관적인 요소를 포함한다. 대부분 텍스트, 비디오, 오디오 형태이다. 정형되지 않고 구조화되어있지 않다. 구조화하기 어렵다. 새로운 현상이나 개념에 대한 이해를 심화하는 데 사용한다. 정량적 데이터 수치적으로 표현되는 정보로 양적인 측정과 분석을 통해 얻을 수 있다. 숫자 형태로 존재하기 때문에 통계적으로 분석하기 쉽다. 개인의 해석이나 주관이 적게 작용하고 객관적이다. 자료 만들기가 용이하다 설문조사, 실험, 인구통계, 지표 분석 등에 활용된다. 비즈니스 목표를 위해 두 가지 데이터를 적절하게 활용하는 것이 필요하다. 자료 설정과 분석에 활용하기 위한 정량적 데이터를 중점으로 볼 예정이다. 2. ..

문제 정의

1. 문제 정의란 데이터 분석 프로젝트의 성공을 위한 초석이다. 분석하려는 특정 상황이나 현상에 대한 명확하고 구체적인 진술이다. 프로젝트의 목표를 설정을 분석하고, 분석 방향을 설정한다. 모든 것을 시작하는 첫걸음이다. 2. 문제 정의 예제 - 예제를 통해 알 수 있던 것 문제를 정의할 때 문제인 것인지, 근본적인 문제인 것인지에 대한 구분이 중요하다. 근본적이거나 중요한 문제인 경우 어떤 것을 의미하는지 명확하게 하는 것이 필요하다. 문제 정의는 더 복잡하고, 시간이 많이 소요된다. 항상 '문제를 올바르게 정의하였는가'라는 물음을 가지고 임해야 한다. 3. 문제 정의 방법론 MECE - 문제 해결과 분석에서 널리 사용되는 접근 방식이다. - 문제를 상호 배타적이면서 전체적으로 포괄적인 구성 요소로 나..

데이터 리터러시

1. 데이터 리터러시의 정의 데이터를 읽는 능력( = 해석하는 능력) 데이터를 이해하는 능력 데이터를 비판적으로 분석하는 능력 → 이 세 가지로 종합적인 결론을 내릴 수 있다. - 위 세 가지를 결과에 대한 의사소통 시 활용할 수 있다. - 리터러시란? 데이터 수집과 원천을 이해하는 것이다. 주어진 데이터에 대한 다양한 활용법을 이해하는 것이다. 데이터를 통한 핵심 지표를 이해하는 것이다. 이해들을 통해 자기 자신에게 올바른 질문을 던질 수 있게 하는 것이다. 2. 데이터 분석에 대한 착각 데이터 분석에 대해 시작할 때 분석 스킬이 부족한 것 같아 SQL, Python, Tableau를 배운다. 배운 툴을 이용해 데이터 분석을 하지만 결과가 나오지 않아 스스로가 부족하다고 여기거나 다른 공부를 더 한다...

03. 프로그램의 구조를 쌓는다! 제어문

출 처 : 박응용, 『Do it! 점프 투 파이썬 - 전면 개정 2판』, 서울 : 이지스퍼블링(23.08.01.), 1장 03 - 1. if문 if 문은 왜 필요할까? - 프로그래밍에서 조건을 판단하여 해당 조건에 맞는 상황을 수행하는데 쓰인다. if 문의 기본 구조 ( 이미지 출처 : https://wikidocs.net/20 ) - 조건문을 테스트해서 참이면 if 문 바로 다음 문장들을 수행한다. - 거짓이면 else 문 다음 문장들을 수행한다. - else 문은 if 문 없이 독립적으로 사용할 수 없다. 들여 쓰기 방법 알아보기 - if 문에 속하는 모든 문장에 들여 쓰기 해야 한다. - 들여 쓰기를 하지 않으면 오류가 난다. - 들여 쓰기는 spacebar와 tab 중 무엇이 좋을까? - 정답이 ..

02. 파이썬 프로그래밍의 기초, 자료형

출 처 : 박응용, 『Do it! 점프 투 파이썬 - 전면 개정 2판』, 서울 : 이지스퍼블링(23.08.01.), 2장 02 - 1. 숫자형 숫자형이란 숫자 형태로 이루어진 자료형 숫자형은 어떻게 만들고 사용할까? 정수형 : 정수를 뜻하는 자료형 실수형 : 소수점이 포함된 숫자 8진수와 16진수 - 8진수 : 숫자가 0o 또는 0O로 시작 - 16진수 : 0x로 시작 숫자형을 활용하기 위한 연산자 사칙 연산 : 연산자를 사용해 사칙 연산을 수행한다. x의 y제곱을 나타내는 ** 연산자 : 사용했을 때 x의 y제곱 값을 리턴한다. 나눗셈 후 나머지를 리턴하는 % 연산자 : %는 나눗셈의 나머지 값을 리턴한다. 나눗셈 후 몫을 리턴하는 // 연산자 02 - 2. 문자열 자료형 문자열이란 문자, 단어 등으로..

01. 파이썬이란 무엇인가?

출 처 : 박응용, 『Do it! 점프 투 파이썬 - 전면 개정 2판』, 서울 : 이지스퍼블링(23.08.01.), 1장 01 - 1. 파이썬이란? 1990년 암스테르담의 귀도 반 로섬이 개발한 인터프리터 언어이다. 사전적 의미는 '고대 신화에 나오는 파르나소스 산의 동굴에 살던 큰 뱀'을 뜻한다. 사전적 의미로 인해 파이썬 책 표지와 아이콘이 뱀 모양으로 그려져 있다. 파이썬 프로그램은 공동 작업과 유지 보수가 매우 쉽고 편리하다. 01 - 2. 파이썬의 특징 파이썬은 인간다운 언어이다. - 프로그래밍이란 인간이 생각하는 것을 컴퓨터에 지시하는 행위다. - 파이썬은 사람이 생각하는 방식을 그대로 표현할 수 있는 언어다. 문법이 쉬워 빠르게 배울 수 있다. 무료이지만 강력하다. - 프로그래머는 만들고자 ..

데이터 분석 종합반 1주차 개발일지

데이터 분석 맛보기 · 캐글에서 유명한 예제인 '타이타닉 생존율 구하기'로 데이터 분석 기초 살펴보기 ▶ 캐글 : 데이터 사이언티스트들에게 유명한 커뮤니티 플랫폼 · 데이터 분석을 위한 스프레드 시트를 가져오면 제일 먼저 결측치 제거를 진행해 데이터 전처리를 한다. → 결측치 제거 : 데이터 전처리를 할 때 분석에 방해가 되는 부분을 미리 제거하는 것 → 데이터 전처리 : 본격적인 데이터 분석 전 준비 단계 · 데이터 분석의 기분 준비 3단계 1. 데이터 표를 가져온다. (데이터 가져오기) 2. 데이터 표를 확인하고 어떤 부분을 볼 것인지, 고려 사항은 없는지 고민한다. (데이터 살펴보기) 3. 잘 분석할 수 있도록 입맛에 맞게 원하는 형태로 데이터를 만든다. (데이터 다듬기) · 데이터 분석 기초를 위..

엑셀보다 쉬운 SQL 5주차 개발일지

SQL의 명령어 익히기 · 조회한 데이터에 값이 없을 경우 두 가지 방식을 사용하면 된다. ① null문을 사용하여 사용할 수 없는 값을 제한다. ex) ② 다른 값으로 대체해서 사용한다. (1) if문을 활용한다. ex) (2) 없는 데이터를 전부 다 다른 값으로 바꾼다. → coalesce를 사용한다. ex) · 비상식적인 데이터 결과가 나올 때는 조건문으로 값의 범위를 지정해서 처리한다. ex) · SQL로 엑셀에서 사용하는 pivot table 만들어 사용할 수 있다. → pivot table이란 2개 이상의 기준으로 데이터를 집계할 때, 보기 쉽게 배열하여 보여주는 것이다. ex) → pivot view는 두 가지 단계를 거쳐서 만들 수 있다. ① 베이스 데이터를 만들어준다. ② 베이스 데이터를..