전체 글 147

Article : 인공지능 프레임워크, 좀 더 알아보자 : 케라스 편

https://brunch.co.kr/@f38b64b143b343c/10 인공지능 프레임워크, 좀 더 알아보자 : 케라스 편간편한 데다, 텐서플로우랑 만나면 그렇게 궁합이 좋다는데? | 오늘은 머신러닝, 딥러닝 프레임워크에 대해 좀 더 알아보는 시간입니다. 앞선 콘텐츠에서 목적, 개발 환경 또는 개발자의 습관이brunch.co.kr    요약>'케라스'는 '텐서플로우'와 함께 대표적인 파이썬 딥러닝 라이브러리로 케라스는 정확히 말하면 파이썬으로 작성된 신경망 라이브러리다. 딥러닝 엔진을 쉽게 다룰 수 있는 인터페이스 라이브러리인 데다 직관적인 API를 제공하고 있고 오픈 소스라는 점 등이 더해져 '텐서플로우'와 함께 긴 시간 사랑받아왔다.   케라스? 약간 헤어 제품 이름 같기도 하고...?2015년 3..

회귀 분석(Regression Analysis)의 통계적 기초

회귀 분석 종속 변수와 하나 이상의 독립 변수 간의 미래 사건을 예측하는 방법이다. 예를 들어 난폭 운전과 운전자에 의한 교통사고 총 건수 사이의 상관관계를 예측하거나 비즈니스 상황에서는 특정 금액을 광고에 사용했을 때와 그것이 판매에 미치는 영향 사이의 관계를 예측하는 데 사용할 수 있다.  회귀 분석은 머신러닝의 일반적인 모델 중 하나로, 회귀 분석 모델은 수치적 가치를 추정한다는 측면에서 관측치가 어느 범주에 속하는지를 식별하는 분류 모델과 다르다.  예측, 시계열 모델링 및 변수 간 인과관계 발견 등에 주로 사용된다.  중요성회귀 분석은 연속 숫자를 포함하는 모든 머신러닝 문제 해결에 필수적이며, 여기에는 아래와 예들이 포함된다. 금융 관련 예측판매 및 프로모션 예측자동차 테스트날씨 분석 및 예측..

Article : 인공지능 프레임워크, 좀 더 알아보자 : 텐서플로우 편

https://brunch.co.kr/@f38b64b143b343c/7 인공지능 프레임워크, 좀 더 알아보자 : 텐서플로우 편Tensorflow, 거의 모든 프로젝트에 활용할 수 있다고?! | 여러분은 AI 개발 또는 학습이라는 말을 들으면, 어떤 프레임워크를 먼저 떠올리시나요? 머신러닝, 딥러닝 프레임워크는 아주 다양하고, 개brunch.co.kr     요약>머신러닝, 딥러닝, 프레임워크는 아주 다양하고, 개발 목적, 개발 환경 또는 개발자의 습관이나 취향에 따라 각기 다양한 프레임워크들이 쓰이고 있다. 그래서 어떤 프레임워크가 정답이라고 이야기하기에는 좀 어려운 부분이 있다.  그중 가장 많은 언급양, 높은 인기를 자랑하는 프레임워크는 단연 텐서플로우이다. python을 기본으로 하고 있지만 C++..

분산 분석(ANOVA)

분산 분석세 집단 이상의 비교에는 ANOVA를 사용한다. ANOVA는 Analysis of Variance의 줄임말이며 우리말로는 분산분석이다.  두 집단이든 세 집단이든 각 집단의 평균을 비교해, 어디가 제일 높고 낮은지 확인하면 충분하다. 그런데 표본 데이터에서의 차이가 통계적으로 유의한 지 검증해야 표본의 결과를 일반화할 수 있는데 이때 분산을 이용해 통계적 유의성을 검증하기 때문에 분산분석이라고 부른다.  두 집단 비교에서는 평균 차이를 이용했지만 세 집단 이상에서는 분산으로 통계정 유의성을 확인한다는 것에 유의해야 한다.  총분산의 분해분산 분석을 이해하는 첫 번째 단계는 총분산의 분해다. 총분산이란 집단을 구분하지 않고 모든 표본 데이터에서 구한 분산을 말한다. 총분산은 '총 분산 = 집단내 ..

공부일기/통계 2024.08.21

Article : 사용자 행동 데이터 분석 : ③데이터를 분석할 때 주의할 점 4가지

https://yozm.wishket.com/magazine/detail/1602/ 사용자 행동 데이터 분석: ③데이터를 분석할 때 주의할 점 4가지 | 요즘IT이전 글 ‘사용자 행동 데이터 분석: ②넷플릭스와 아마존은 데이터 분석을 어떻게 할까요?’에서 넷플릭스와 아마존의 사례를 통해 사용자 행동 데이터 분석이 실제 비즈니스에서 어떻게 활용yozm.wishket.com   요약>사용자 행동 데이터를 분석할 때 주의할 점 4가지1. 사용자들은 우리가 원하는 대로 서비스를 쓰지 않는다.기획자나 개발자가 '이렇게 사용하겠지'라고 예상하고 만든 기능들을 사용자가 그대로 사용할 것이라는 믿음은 잠시 접어두는 게 좋다.  예상한 대로 사용자 행동 데이터가 나오지 않아도 놀라지 않고 있는 그대로 데이터를 봐야 한다..

Article : 사용자 행동 데이터 분석 : ②넷플릭스와 아마존은 데이터 분석을 어떻게 할까요?

https://yozm.wishket.com/magazine/detail/1588/ 사용자 행동 데이터 분석: ②넷플릭스와 아마존은 데이터 분석을 어떻게 할까요? | 요즘IT사용자 행동 데이터 분석은 적은 비용으로 많은 사람의 행동을 분석할 수 있고, 데이터만 잘 쌓으면 사용자들의 행동 패턴을 원할 때 언제든 분석을 할 수 있어서 주목받는 중이라고 설명했습니yozm.wishket.com     요약>사용자 행동 데이터로 분석할 수 있는 것사용자 행동 데이터는 말 그대로 사용자들이 서비스 내에서 행동한 부분의 활동을 추적하는 데이터이므로 정말 다양한 분석이 가능하다.  데이터 분석을 해볼 수 있는 주제들은 아래와 같다.사용자들이 우리 서비스의 여러 기능을 어떤 순서로 사용하는지어느 기능(또는 페이지)에 관..

Article : 사용자 행동 데이터 분석 : ①사용자 행동 데이터 왜 필요할까요?

https://yozm.wishket.com/magazine/detail/1572/ 사용자 행동 데이터 분석: ①사용자 행동 데이터 왜 필요할까요? | 요즘IT사용자 행동 데이터는 고객들이 서비스를 잘 쓰고 있는지를 가늠할 수 있는 방법 중 하나입니다. 요즘에는 발 빠르게 고객의 요구사항을 확인하고, 서비스를 만들어야 하는 상황이라 사용자 행yozm.wishket.com   요약>사용자 행동 데이터는 고객들이 서비스를 잘 쓰고 있는지를 가늠할 수 있는 방법 중 하나다. 요즘에는 발 빠르게 고객의 요구사항을 확인하고, 서비스를 만들어야 하는 상황이라 사용자 행동 데이터가 갈수록 중요해지고 있다.   회사에서 볼 수 있는 데이터의 종류 2가지1. 서비스 데이터가입, 결제 등 서비스 운영을 위해서 반드시 필요..

상관 분석(Correlation Analysis)

상관 분석확률론과 통계학에서 두 변수 간에 어떤 선형적 관계를 갖고 있는 지를 분석하는 방법으로 상관계수를 이용해 측정한다.  좀 더 쉽게 이야기하면, 서로 관련된다고 예측되는 두 변수(구간, 비율척도)들 간에 얼마나 연관성이 있는지 알아보는 것이다. 두 변수 간의 관련성은 산점도 그래프를 통해 한눈에 확인할 수 있고, pearson의 상관계수를 통해 두 변수간 연관성이 어느 정도인지, 유의미한 상관관계가 있는지 검정할 수 있다.     상관 계수상관관계를 분석하는 데 있어서 가장 직관적인 방법은 산점도를 그려 직선의 형태와 가까운지 확인하는 것이다. 상관계수는 비교하고자 하는 두 확률 변수 X와 Y가 함께 변하는 정도를 의미하며 r이라고 표현한다.  X가 증가할 때 Y도 같은 방향으로 증가하면 상관계수..

공부일기/통계 2024.08.19

Article : 내일의 성장을 위해 '회고' 잘하는 법

https://yozm.wishket.com/magazine/detail/2708/ 내일의 성장을 위해 ‘회고’ 잘하는 법 | 요즘IT상반기가 지나면서 한 번쯤 ‘내가 혹은 우리 팀이 잘하고 있나?’라는 생각이 듭니다. 처음 프로젝트를 시작할 땐 목표 달성을 위해 프로세스와 일정을 꼼꼼히 계획하지만, 하다 보면 마음처럼yozm.wishket.com   요약>회고는 무엇이고, 어느 시점에 활용할까?회고란 미래의 행동과 현재의 행동에 있어 적극적으로 고려해야 하는 '과거'에서 추출한 경험이라고 한다. 즉, 앞으로 더 잘하기 위해 되돌아보는 과정을 의미한다.  그렇다면 회고는 언제 하는 게 좋을까? 아래와 같다.  1. 업무 시작 시점 업무 시작 시점에서의 회고는 기획 단계에서 참고할 점이 많다. 과거 유사한..

신뢰 구간(Confidence Interval)

신뢰 구간모수가 어느 범위 안에 있는지를 확률적으로 보여주는 방법이다. 집단 전체를 연구하는 것은 불가능하므로, 샘플링된 데이터를 기반으로 모수의 범위를 추정하기 위해 사용된다. 따라서, 신뢰 구간은 샘플링된 표본이 연구 중인 모집단을 얼마나 잘 대표하는지 측정하는 방법이다.  신뢰 구간에 모집단 실제 평균값이 포함될 확률을 'CI의 신뢰 수준(Confidence Level)'이라고 한다.  신뢰구간은 좁을수록 모집단 평균 추정치가 정확해진다. 일반적으로 관측 개수가 클수록 신뢰 구간이 좁아지므로 표본이 클수록 더 정확하게 모집단 평균을 추정할 수 있게 된다.  신뢰 구간의 '신뢰'는'평균값'이 등장했다고 믿을 수 있다는 뜻이다.  평균값은 t분포나 정규 분포를 따르는데, 평균값이 신뢰 구간 안에 들어온..

공부일기/통계 2024.08.16