데일리 미션/미션

데이터 분석 용어 정리

pipiiiiii 2023. 12. 4. 21:16

 

JD 분석을 하면서 본 용어를 정리하고자 한다. 

 

  • 데이터 수집 : 자료 처리 시스템에 들어갈 자료를 모으는 일 또는 여러 장소에 있는 자료를 한 곳으로 모으는 일을 말한다.
  • 데이터 전처리 : 수집한 자료를 제거하거나 조작하는 작업을 말한다. 
  • 빅데이터 : 디지털 환경에서 생성되는 데이터로 그 규모가 방대하고, 생성 주기도 짧고, 형태도수치 데이터 외에 문자, 영상 데이터를 포함하는 대규모 데이터를 말한다.  
  • 빅데이터 분석 : 소셜 빅데이터, 실시간 사물지능통신 센서 데이터, 기업 고객관계 데이터 등 도처에 존재하는 다양한 성격의 빅데이터를 효과적으로 분석하는 것을 말한다.
  • 아키텍처( Architecture) : 목표하는 대상에 대하여 그 구성과 동작 원리, 구성 요소 간의 관계 및 시스템 외부 환경과의 관계 등을 설명하는 설계도 혹은 청사진을 말한다. 
  • 플랫폼 : 재화나 서비스를 공급 혹은 소비를 원하거나 또는 단순히 검색, 조사, 연구, 지원, 관리 등 어떤 목적으로든 서비스 이용자 모두가 한 자리에 모이게 되는 공간을 말한다. 
  • 스템 아키텍처(TA) : 컴퓨터 프로그램이나 시스템의 구조와 구성 요소들이 어떻게 조직되어 동작하며 상호작용하는지에 대한 계획이나 설계를 말한다. (시스템 아키텍처 상세 설명 참고 주소 : https://boardmix.com/kr/skills/system-architecture/ )
  • JAVA : 웹 애플리케이션 코딩에 널리 사용되는 프로그래밍 언어를 말한다.  
  • Java Script : 개발자가 대화식 웹 페이지를 만들기 위해 사용하는 프로그래밍 언어를 말한다. 처음 만들어졌을 때는 LiveScript라고 불렸으나, 만들어진 당시 JAVA의 인기가 아주 높은 상황인 것을 활용해 JAVA의 동생 격인 언어로 홍보하기 위해서  Java scrip라고 이름을 바꿨다고 한다.  
  • SQL : 데이터 베이스에서 데이터를 추출하고 조작하는 데에 사용하는 데이터 처리 언어를 말한다. 
  • 프레임워크(Framework) : 목적에 따라 고민할 필요 없이 이용할 수 있도록 일괄로 가져 다 쓰도록 만들어 놓은 틀을 말한다 (프레임워크 상세 설명 참고 주소 : https://www.castingn.com/sourcing/kkultip_detail/110 )
  • Spring Framework : 자바 플랫폼을 위한 오픈 소스 애플리케이션 프레임워크로 간단히 스프링이라고도 한다.
  • Spring Boot : 스프링을 더 쉽게 이용하기 위한 도구를 말한다. (스프링과 스프링부트 차이 상세 설명 참고 주소 : https://www.inflearn.com/blogs/3315
  • 전자정부 프레임워크 : 정부 및 공공기관, 공기업 등의 웹사이트에 자주 쓰이는 공통 기능들을 미리 만들어 놓은 틀을 말한다. (전자정부 프레임워크 상세 설명 참고 주소 : https://velog.io/@jojo_devstory/Spring-전자정부프레임워크란 )
  • R : 통계 계산과 그래픽을 위한 프로그래밍 언어이자 소프트웨어 환경이다. 
  • Python : 멀티 패러다임 언어로 다양한 프로그래밍 패러다임을 지원하는 언어이다. 
  • Power BI : 마이크로소프트사에서 만든 비즈니스 인텔리전스 툴/소프트웨어( Business Intelligence tool, BI )이다. (Power BI 상세 설명 참고 주소 : https://m.blog.naver.com/daxingintherain/221967790891 )
  • 머신러닝(=기계학습) : 사용하는 데이터를 기반으로 학습 또는 성능 향상을 지원하는 시스템을 구축하는데 초점이 맞춰진 컴퓨터 알고리즘의 연구이다. 
  • MySQL : 세계에서 가장 많이 쓰이는 오픈 소스의 관계형 데이터베이스 관리 시스템이다. 
  • PostgreSQL :  "Post-GRES"로 발음하며 뛰어난 안정성, 유연성, 개방형 기술 표준 지원으로 잘 알려져 있는 오픈 소스 데이터베이스이며 다른 관계형 데이터베이스 관리 시스템과 달리 비관계형 및 관계형 데이터 유형을 모두 지원합니다. 
  • API :  Application Programming Interface(애플리케이션 프로그램 인터페이스)의 줄임말로 응용 프로그램에서 사용할 수 있도록, 운영 체제나 프로그래밍 언어가 제공하는 기능을 제어할 수 있게 만든 인터페이스를 뜻한다. 
  • 정보처리기사 : 소프트웨어 개발 관련 자격증으로 과학기술정보통신부에서 주관하고 한국산업인력공단에서 시행하는 국가자격시험 및 자격증을 말한다. 
  • 통계집단적 현상이나 수집된 자료의 내용에 관한 수량적인 기술. 대상이 되는 집단을 일정한 시점에서 파악하는 것을 정태 통계, 일정한 기간에서 파악하는 것을 동태 통계라 하며, 사회나 자연 현상을 정리분석하는 수단으로 쓰기도 한다.
  • 통계분석 : 사회 현상에 관한 자료를 수량적으로 파악하여 통계적으로 수집정리하여 실태를 밝히는 일을 말한다.
  • 정형 분석 : 구글 스프레드시트 또는 마이크로소프트 엑셀과 같은 스프레드시트 프로그램에 표시할 수 있는 모든 데이터들로 일반적으로 RDBMS(관계형 데이터베이스 관리 시스템)에 저장되는 데이터들을 말한다. 
  • 비정형 분석 : 정형 데이터가 아닌 모든 데이터를 말한다. 
  • 데이터 마이닝 : 대량 데이터 세트의 처리 및 탐색을 위한 분석에 사용되는 데이터 지원 기법을 말한다. 
  • 데이터 시각화 : 차트, 플롯, 인포그래픽, 애니메이션 등 그래픽으로 데이터를 표현하는 것을 말한다. 
  • 로그 데이터 : 실제 현실에서 발생하는 사건을 데이터로 기록한 것을 말한다. 
  • Tableau : 무료데이터 시각화 플랫폼이다.  
  • 크롤링 : 개인 혹은 단체에서 필요한 데이터가 있는 웹페이지의 구조를 분석하고 파악하여 가져오는 것을 말합니다. 
  • Lookers studio : 데이터를 맞춤형 정보 보고서 및 대시보드로 변환하기 위한 온라인 도구이다.