전체 글 147

데이터 분석 트랙을 신청한 이유

내가 데이터 분석 코스에 참여한 계기는 무엇인가요? 컴퓨터와의 대화에는 다양한 언어가 필요하다는 것을 모르고 살던 저는 데이터 분석가라는 직업을 알게 되면서 새로운 세상을 알게 됐습니다. 하지만 세상에 뛰어들기 위해서는 먼저 다양한 언어를 알아야 했고, 그 언어들을 배우기 위해 스파르타 코딩클럽의 문을 두드리게 됐습니다. 물론 데이터 분석을 배울 수 있는 곳은 스파르타 코딩클럽 외에도 많은 것으로 알고 있지만 가장 기초부터 업무에 필요한 능력까지 골고루 배울 수 있는 곳이라고 생각되어 스파르타 코딩클럽 데이터 분석 코스에 참여하게 됐습니다. 내가 이해한 데이터 분석가는 어떤 역할을 하는 사람인가요? 저는 데이터 분석가란 가교 역할을 하는 사람이라고 생각합니다. 가교 역할을 하는 사람이란 회사에서 모으고 ..

데이터 분석 종합반 1주차 개발일지

데이터 분석 맛보기 · 캐글에서 유명한 예제인 '타이타닉 생존율 구하기'로 데이터 분석 기초 살펴보기 ▶ 캐글 : 데이터 사이언티스트들에게 유명한 커뮤니티 플랫폼 · 데이터 분석을 위한 스프레드 시트를 가져오면 제일 먼저 결측치 제거를 진행해 데이터 전처리를 한다. → 결측치 제거 : 데이터 전처리를 할 때 분석에 방해가 되는 부분을 미리 제거하는 것 → 데이터 전처리 : 본격적인 데이터 분석 전 준비 단계 · 데이터 분석의 기분 준비 3단계 1. 데이터 표를 가져온다. (데이터 가져오기) 2. 데이터 표를 확인하고 어떤 부분을 볼 것인지, 고려 사항은 없는지 고민한다. (데이터 살펴보기) 3. 잘 분석할 수 있도록 입맛에 맞게 원하는 형태로 데이터를 만든다. (데이터 다듬기) · 데이터 분석 기초를 위..

엑셀보다 쉬운 SQL 5주차 개발일지

SQL의 명령어 익히기 · 조회한 데이터에 값이 없을 경우 두 가지 방식을 사용하면 된다. ① null문을 사용하여 사용할 수 없는 값을 제한다. ex) ② 다른 값으로 대체해서 사용한다. (1) if문을 활용한다. ex) (2) 없는 데이터를 전부 다 다른 값으로 바꾼다. → coalesce를 사용한다. ex) · 비상식적인 데이터 결과가 나올 때는 조건문으로 값의 범위를 지정해서 처리한다. ex) · SQL로 엑셀에서 사용하는 pivot table 만들어 사용할 수 있다. → pivot table이란 2개 이상의 기준으로 데이터를 집계할 때, 보기 쉽게 배열하여 보여주는 것이다. ex) → pivot view는 두 가지 단계를 거쳐서 만들 수 있다. ① 베이스 데이터를 만들어준다. ② 베이스 데이터를..

엑셀보다 쉬운 SQL 4주차 개발일지

SQL의 명령어 익히기 ·여러 번의 연산을 한 번의 쿼리문으로 끝내고 싶다면 subquery문을 사용하면 된다. → subquery문은 여러 번의 연산을 수행할 때, 조건문에 연산 결과를 사용할 때, 쿼리 결과를 조건에 사용하고 싶을 때 사용된다. → subquery문은 쿼리안에 서브로 들어가 있는 구문이다. ex) · 실습 - 음식점의 평균 단가별 segmentation을 진행하고, 그룹에 따라 수수료 연산하기 → 수수료 구간 : ~ 5,000원 미만 0.005%, ~ 20,000원 미만 1%, ~ 30,000원 미만 2%, 30,000원 초과 3% → 내 쿼리문 및 수정사항 · 실습 - 음식점의 지역과 평균 배달 시간으로 segmentation 하기 → 내 쿼리문 및 수정사항 · 실습 - 음식 타입별..

엑셀보다 쉬운 SQL 3주차 개발일지

SQL의 명령어 익히기 · 특정 문자를 다를 문자로 바꾸고 싶다면 replace를 사용하면 된다. ex) · 원하는 문자만 남기고 싶다면 substr(=substring)를 사용하면 된다. ex) · 여러 컬럼의 문자를 합치고 싶다면 concat을 사용하면 된다. ex) → concat은 원하는 만큼 붙일 수 있다. · 실습 - 서울 지역의 음식 타입별 평균 음식 주문 금액 구하기 → 출력 : 서울, 타입, 평균 금액 → 내 쿼리문 및 수정사항 → group by에 사용된 1, 2는 select에 있는 컬럼을 의미한다. 1은 첫번째 컬럼, 2는 두 번째 컬럼이다. 컬럼의 이름을 쓰지 않고 숫자로도 표현할 수 있다. · 실습 - 이메일 도메인별 고객 수와 평균 연령 구하기 → 내 쿼리문 및 수정사항 → s..

엑셀보다 쉬운 SQL 2주차 개발일지

SQL의 명령어 익히기 · 숫자 연산을 사용할 수 있다. - 숫자 연산에는 +, -, *, /가 있다. · 함수를 사용할 수 있다. - 함수의 종류 ① SUM(컬럼) : 합계 ② AVG(컬럼) : 평균 ③ COUNT(컬럼) : 데이터 개수 → COUNT 함수는 컬럼 자리에 '1' 혹은 '*' 사용이 가능하다. 이때 '1'과 '*'은 모든 데이터의 개수를 의미한다. ④ DISTINCT(컬럼) : 몇 개의 값을 가지고 있는지 구할 때 ⑤ MIN(컬럼) : 최솟값 ⑥ MAX(컬럼) : 최댓값 → 함수는 대소문자를 구분하지 않아 편하게 사용이 가능하다. · 범주형 컬럼은 group by를 사용하여 한번에 계산할 수 있다. → 범주형 컬럼은 나이별, 나라별, 음식별 등을 의미한다. ex) · order by를 사..

엑셀보다 쉬운 SQL 1주차 개발일지

용어 정리 · SQL = Query - Query를 작성한다고 말하기도 한다. · 데이터 베이스 = 폴더 · 테이블 = 파일 - 테이블은 엑셀과 구조가 비슷하다. · 열 = 필드 혹은 컬럼 - 강의를 하는 동안 컬럼으로 통일해서 지칭한다. SQL의 기본 구조 익히기 · 데이터를 가져오는 명령어 : select · 모든 칼럼을 가져오는 명령어 : * · 데이터를 가져 올 테이블을 특정하는 명령어 : from · SQL에서 사용하게 될 경우 [실습] payments 테이블의 데이터 조회하기 [실습] customers 테이블의 데이터 조회하기 SQL의 명령어 익히기 · 테이블에서 원하는 컬럼만 가져오고 싶은 경우 select 다음에 컬럼명을 작성한다. ex) ·여러 개의 컬럼을 가져오고 싶은 경우 ', '를 ..