https://yozm.wishket.com/magazine/detail/1178/
<아티클 내용 요약>
- 데이터 분석가나 데이터 과학자가 되는 길은 쉽지 않다. 수학이나 통계학적인 지식을 갖춰야 함은 물론 머신러닝, 딥러닝 알고리즘에 대한 이해, 프로그래밍 언어에 대한 숙달까지 갖춰져야 하기 때문이다.
빅데이터를 위한 프로그래밍 언어
- 프로그래밍 언어라 하면 컴퓨터 소프트웨어를 작동시키기 위해 작성하는 언어를 뜻한다.
- 프로그래밍 언어의 종류
- 세상에는 너무나 많은 프로그래밍 언어가 존재한다.
- C, C++, Java, 파이썬 등 다양한 언어 체계가 존재하고, 이를 모두 학습하는 것은 지나치게 많은 시간과 노력이 소비된다.
R vs 파이썬
- 빅데이터 처리를 위한 프로그래밍 언어는 딱 두 가지로 압축할 수 있다. 바로 R과 파이썬이다.
- 그 외에도 많은 프로그램들이 빅데이터 처리를 위해 존재하지만 R과 파이썬에 비해 영향력이 작다.
- 공통점
- 두 가지 프로그래밍 언어 모두 데이터 분석을 위한 패키지를 다양하게 제공해 준다.
- R과 파이썬은 데이터 분석가 혹은 데이터 과학자에 주요 이용자층이 형성되어 있기에, 최신 머신러닝 알고리즘의 업데이트 등 데이터 분석을 위한 다양한 기능을 제공해주고 있다.
- 두 프로그래밍 언어 모두 오픈소스다. - R의 특징
- R의 경우 통계라는 한 단어로 특징을 정의할 수 있다.
- R이라는 프로그램 및 언어를 만든 사람이 통계학자이다.
- R은 통계 분석에 있어 정말 다양한 기능들을 제공한다.
- 통계분석을 실시할 경우 같은 것이라도 파이썬에 비해 R이 더욱 상세한 결과물을 보여준다.
- R은 같은 코드를 작성할 때, 파이썬보다 더욱 자세하고명료하게 분석 결과를 제공해 주는 경향이 있다.
- 하지만 프로그래머가 아닌 통계학자가 프로그램을 만들었기 때문에, 수행 속도 측면에서 R은 파이썬에 비해 단점을 보인다. - 파이썬의 특징
- 통계 분석 외의 측면에서 상대적으로 장점을 보인다.
- 그중 파이썬의 가장 큰 장점은 바로 최신 머신러닝, 딥러닝 알고리즘을 제공한다는 점이다.
- R에서도 제공하지만 파이썬과 많은 차이를 보인다.
- 하지만 통계 분석 측면에서는 R에 비해 확연히 단점을 보인다.
- 많은 노력을 기울여 파이썬에서 통계 분석 알고리즘을 돌린다고 해도 R에 비해 결과물이 상세하지 못한 점이 있어 분석가들을 다소 허망하게 만들기도 한다.
어떤 프로그래밍 언어를 선택해야 하는가?
- 분석 목적에 적합한 프로그래밍 언어
- 데이터를 분석하고자 하는 목적을 명확하게 가지고 있다면, 그 목적에 부합하는 프로그래밍 언어를 선택해야 한다.
- 하지만 아쉽게도 대부분의 데이터 분석가 혹은 과학자는 통계 분석과 AI 알고리즘을 모두 이용해야 하는 경우가 많다.
- 단순히 분석 목적이 아니라 다양한 측면에서 어떤 프로그래밍 언어를 선택할지 고민해야 한다. - 많은 사람들이 사용하는 프로그래밍 언어
- 다른 사람들도 많이 사용하고 있는 언어를 선택하는 것은 생각보다 중요한 이슈다.
- 많은 사람들이 특정 프로그래밍 언어를 사용한다면 그 자체로 그 언어에 대해 많은 장점이 있다는 것을 의미한다.
- 또한 최신 알고리즘이나 새로운 기능들은 많은 사람들이 사용하고 있는 프로그램에 우선적으로 배포되는 경향이 있다.
- 많은 사람들이 특정 프로그래밍 언어를 사용하고 있다면, 이는 코딩을 하다 모르는 문제가 생겼을 시 쉽게 검색이 가능하다는 것을 의미한다.
- 빅데이터 분야 사람들의 관심 영역인 R과 파이썬으로 한정시켜 보면 R보다 파이썬의 이용가가 더 많은 것은 사실이다. 그러나 이것이 무조건 파이썬만이 데이터 분석에 있어 정답이라는 말은 아니다.
선택의 몫
- 프로그래밍 언어를 선택할 때는 본인의 목적이 무엇인지, 그리고 다른 사람들은 같은 분야에서 어떤 프로그램을 많이 사용하고 있는지를 잘 고려해보아야 한다.
- 하나의 언어에 익숙해졌다면 상대적으로 다른 언어를 학습하는 것 역시 쉬워져, 두 가지 프로그램을 모두 능숙하게 다루는 것이 불가능한 일은 아니다.
- 데이터 분석가로서 R을 선택할지, 파이썬을 선택할지, 둘 모두를 선택할지는 주요 특징들을 고려해 선택하면 된다.
<알게 된 개념>
- 파이썬만 알면서 공부했었는데 데이터 분석에 있어 R이라는 것도 있다는 것을 알게 되었다. 또한 두 언어의 장단점을 알고 앞으로 내가 배워야 하는 것인가도 고민할 수 있는 내용이었다.
지금의 나는 일단 파이썬을 먼저 배워서 익힌 후에 R을 생각해야겠다고 판단했다.
왜냐하면 현재 배우고 있기도 하고, 분석은 R보다 파이썬이 주력으로 가능할 것 같다고 생각하는 부분도 있어서이다.
그래도 뭘 해야 하는지 새로운 걸 알아서 좋았다.
'데일리 미션 > Article' 카테고리의 다른 글
Article : 신뢰할 수 있는 데이터를 확보하기 위한 3가지 체크 리스트 (1) | 2024.01.11 |
---|---|
Article : 사용자 정성 데이터는 어떻게 시각화할 수 있을까? (1) | 2024.01.10 |
Article : 데이터 분석에서 가설을 설계하는 방법 (0) | 2024.01.08 |
Article : 데이터 아키텍처? 쉽게 배워봅시다 (1) | 2024.01.05 |
Article : 데이터 분석가에게 코딩테스트가 필요할까? (2) | 2024.01.04 |