데일리 미션/Article

Article : R vs 파이썬, 빅데이터 분석엔 무엇이 더 좋을까?

pipiiiiii 2024. 1. 9. 12:00

https://yozm.wishket.com/magazine/detail/1178/

 

R vs 파이썬, 빅데이터 분석엔 무엇이 더 좋을까? | 요즘IT

데이터 분석가와 과학자는 수학이나 통계학적인 지식을 갖춰야 함은 물론 머신러닝, 딥러닝 알고리즘에 대한 이해, 프로그래밍 언어에 대한 숙달까지 갖춰야 합니다. 특히 프로그래밍 언어를

yozm.wishket.com

 

 

 

<아티클 내용 요약>

- 데이터 분석가나 데이터 과학자가 되는 길은 쉽지 않다. 수학이나 통계학적인 지식을 갖춰야 함은 물론 머신러닝, 딥러닝 알고리즘에 대한 이해, 프로그래밍 언어에 대한 숙달까지 갖춰져야 하기 때문이다. 

 

빅데이터를 위한 프로그래밍 언어

- 프로그래밍 언어라 하면 컴퓨터 소프트웨어를 작동시키기 위해 작성하는 언어를 뜻한다. 

  • 프로그래밍 언어의 종류 
    - 세상에는 너무나 많은 프로그래밍 언어가 존재한다. 
    - C, C++, Java, 파이썬 등 다양한 언어 체계가 존재하고, 이를 모두 학습하는 것은 지나치게 많은 시간과 노력이 소비된다. 

 

R vs 파이썬

- 빅데이터 처리를 위한  프로그래밍 언어는 딱 두 가지로 압축할 수 있다. 바로 R과 파이썬이다. 

- 그 외에도 많은 프로그램들이 빅데이터 처리를 위해 존재하지만 R과 파이썬에 비해 영향력이 작다. 

  1. 공통점
    - 두 가지 프로그래밍 언어 모두 데이터 분석을 위한 패키지를 다양하게 제공해 준다.
    - R과 파이썬은 데이터 분석가 혹은 데이터 과학자에 주요 이용자층이 형성되어 있기에, 최신 머신러닝 알고리즘의 업데이트 등 데이터 분석을 위한 다양한 기능을 제공해주고 있다. 
    - 두 프로그래밍 언어 모두 오픈소스다. 

  2. R의 특징
    - R의 경우 통계라는 한 단어로 특징을 정의할 수 있다.
    - R이라는 프로그램 및 언어를 만든 사람이 통계학자이다. 
    - R은 통계 분석에 있어 정말 다양한 기능들을 제공한다. 
    - 통계분석을 실시할 경우 같은 것이라도 파이썬에 비해 R이 더욱 상세한 결과물을 보여준다. 
    - R은 같은 코드를 작성할 때, 파이썬보다 더욱 자세하고명료하게 분석 결과를 제공해 주는 경향이 있다. 
    - 하지만 프로그래머가 아닌 통계학자가 프로그램을 만들었기 때문에, 수행 속도 측면에서 R은 파이썬에 비해 단점을 보인다. 

  3. 파이썬의 특징
    - 통계 분석 외의 측면에서 상대적으로 장점을 보인다.
    - 그중 파이썬의 가장 큰 장점은 바로 최신 머신러닝, 딥러닝 알고리즘을 제공한다는 점이다.
    - R에서도 제공하지만 파이썬과 많은 차이를 보인다. 
    - 하지만 통계 분석 측면에서는 R에 비해 확연히 단점을 보인다. 
    - 많은 노력을 기울여 파이썬에서 통계 분석 알고리즘을 돌린다고 해도 R에 비해 결과물이 상세하지 못한 점이 있어 분석가들을 다소 허망하게 만들기도 한다. 

 

어떤 프로그래밍 언어를 선택해야 하는가?

  1. 분석 목적에 적합한 프로그래밍 언어
    - 데이터를 분석하고자 하는 목적을 명확하게 가지고 있다면, 그 목적에 부합하는 프로그래밍 언어를 선택해야 한다. 
    - 하지만 아쉽게도 대부분의 데이터 분석가 혹은 과학자는 통계 분석과 AI 알고리즘을 모두 이용해야 하는 경우가 많다. 
    - 단순히 분석 목적이 아니라 다양한 측면에서 어떤 프로그래밍 언어를 선택할지 고민해야 한다. 

  2. 많은 사람들이 사용하는 프로그래밍 언어
    - 다른 사람들도 많이 사용하고 있는 언어를 선택하는 것은 생각보다 중요한 이슈다. 
    - 많은 사람들이 특정 프로그래밍 언어를 사용한다면 그 자체로 그 언어에 대해 많은 장점이 있다는 것을 의미한다. 
    - 또한 최신 알고리즘이나 새로운 기능들은 많은 사람들이 사용하고 있는 프로그램에 우선적으로 배포되는 경향이 있다. 
    - 많은 사람들이 특정 프로그래밍 언어를 사용하고 있다면, 이는 코딩을 하다 모르는 문제가 생겼을 시 쉽게 검색이 가능하다는 것을 의미한다. 
    - 빅데이터 분야 사람들의 관심 영역인 R과 파이썬으로 한정시켜 보면 R보다 파이썬의 이용가가 더 많은 것은 사실이다. 그러나 이것이 무조건 파이썬만이 데이터 분석에 있어 정답이라는 말은 아니다. 

 

선택의 몫

- 프로그래밍 언어를 선택할 때는 본인의 목적이 무엇인지, 그리고 다른 사람들은 같은 분야에서 어떤 프로그램을 많이 사용하고 있는지를 잘 고려해보아야 한다. 
- 하나의 언어에 익숙해졌다면 상대적으로 다른 언어를 학습하는 것 역시 쉬워져, 두 가지 프로그램을 모두 능숙하게 다루는 것이 불가능한 일은 아니다. 

- 데이터 분석가로서 R을 선택할지, 파이썬을 선택할지, 둘 모두를 선택할지는 주요 특징들을 고려해 선택하면 된다. 

 

 

 

<알게 된 개념>

- 파이썬만 알면서 공부했었는데 데이터 분석에 있어 R이라는 것도 있다는 것을 알게 되었다. 또한 두 언어의 장단점을 알고 앞으로 내가 배워야 하는 것인가도 고민할 수 있는 내용이었다. 

 

지금의 나는 일단 파이썬을 먼저 배워서 익힌 후에 R을 생각해야겠다고 판단했다.

왜냐하면 현재 배우고 있기도 하고, 분석은 R보다 파이썬이 주력으로 가능할 것 같다고 생각하는 부분도 있어서이다.

 

그래도 뭘 해야 하는지 새로운 걸 알아서 좋았다.