왜 확률과 통계가 어려운가?
이번 글에서는
확률과 통계 카테고리는
어떻게 글을 작성해
나갈지 적어보겠습니다.
확률과 통계를 사전에 검색하면
‘실생활과 가장 밀접한 수학 교과’
설명이 나옵니다.
카지노에서 주사위 던지는 확률
계산할 때를 제외하고
써 본 적이 없는 것
같은데 말이죠.

확률과 통계를 공부할 때,
선형대수학처럼 그림으로
연결시켜 공부하기도 어렵고
확률변수, 확률분포,
이항분포, 연속확률변수 정규분포,
모집단, 표본, 모 평균, 표본평균…
같은 용어들도 다
비슷 비슷하게 생겼는데,
의미 차이는 또 왜 이리
헷갈린지 어지러워집니다.
Divide and Conquer 전략: 개념 하나씩 분해하자
확률과 통계 카테고리는
확률 변수, 사건 … 등등
작은 개념들로 쪼개서
개념 하나 하나가 익숙해지도록
글을 작성하려 합니다.
이렇게 하나의 용어를 딱 봤을 때,
개념을 생각할 필요도 없이
단단히 박혀야
다른 개념들과 충돌이
일어나지 않습니다.
점차 확장되는 내용에서도
설명했던 내용들은 계속해서
다시 리마인드 하기 위해
링크를 걸어 자주
노출시키려 합니다.
이러면 자연스럽게 용어의
개념이 단단해지고,
그 위에 어려운 개념들이
쌓이더라고요. (제 경험상)
즉, Divide and Conquer 방식으로
글을 작성하겠습니다.
하나씩 분리해 놓고
때리겠다는 거죠.
확률과 AI는 어떤 연결고리가 있는가?
확통이 왜 AI 와 연관이
있는가를 살짝 보면
AI의 역할은 아직 일어나지
않은 일을 예측하는 것입니다.
이 부분이 베이즈 정리와
연관이 깊으며,
데이터가 많으면
분포를 만들 수 있고,
분포를 이용하여 예측을
할 수 있게 됩니다.
우리가 사는 세계는 통계적이다
사실, 실제 세상에서
일어나는 모든 일이 분포를
그리고 있습니다.
예를 들면,
첫번째 예시로
우리가 언어를 사용한다는 것은
서로 약속된 규칙에 의해
의사소통을 할 수 있게
되는 거잖아요?
통계적으로 분석하면
우리가 실제로 사용하는 문장은
그리 많지 않습니다.
이 부분이 모국어가 아닌 다른 언어를
사용하면 직접적으로 느껴지는데,
대화에 지장 없는 수준으로
말하는데 그냥 문장 몇 개
돌려써도 문제가 없더라구요.
두번째 예시로는
우리가 서로 통한다는 것은
무언가에 대해 생각할 때
머리 속에서 예측 가능한
범위의 경계 (= 데이터 분포)
가 있기 때문입니다.
앞으로 천천히 살펴보도록 하겠습니다.
아쉽게도 3Blue1Blown
확률과 통계 동영상은
선형대수학처럼 시리즈
강의가 있지는 않고
부분적으로 있습니다.
참고자료
https://www.kdnuggets.com/2023/02/importance-probability-data-science.html