인공지능을 위한 수학 - 4. 확률과 통계(2nd)
📊 기초 통계 개념 정리 (수식 포함)
1. 평균 (Expectation)
어떤 값들이 있을 때, 그 값들의 중심이 어디쯤인지 나타내는 값입니다. 전체 데이터를 더한 뒤 개수로 나누어 구합니다.
$$\mu = \frac{1}{n} \sum_{i=1}^{n} x_i$$
2. 편차 (Deviation)
각 데이터가 평균에서 얼마나 떨어져 있는지를 나타냅니다. 양수면 평균보다 크고, 음수면 평균보다 작다는 뜻입니다.
$$\text{편차} = x_i - \mu$$
3. 분산 (Variance)
모든 데이터의 편차를 제곱해 평균을 낸 값으로, 데이터가 평균에서 얼마나 퍼져 있는지를 나타냅니다.
$$\sigma^2 = \frac{1}{n} \sum_{i=1}^{n} (x_i - \mu)^2$$
4. 표준편차 (Standard Deviation)
분산은 단위가 제곱된 형태이므로, 이를 다시 원래 단위로 되돌리기 위해 제곱근을 씌운 것이 표준편차입니다.
$$\sigma = \sqrt{\frac{1}{n} \sum_{i=1}^{n} (x_i - \mu)^2}$$
5. 공분산 (Covariance)
두 변수의 값이 함께 어떻게 움직이는지를 나타내며, 양수는 같은 방향, 음수는 반대 방향으로 변화함을 의미합니다.
$$\text{Cov}(X, Y) = \frac{1}{n} \sum_{i=1}^{n} (x_i - \bar{x})(y_i - \bar{y})$$
6. 표준점수 (Z-score)
데이터가 평균에서 얼마나 떨어져 있는지를 표준편차 기준으로 나타낸 값으로, 서로 다른 데이터끼리 비교할 때 유용합니다.
$$z = \frac{x - \mu}{\sigma}$$
📐 통계 분석 및 추정 기법
7. 상관계수 (Correlation Coefficient)
두 변수 간의 선형 관계의 강도와 방향을 -1에서 +1 사이의 수치로 나타낸 값입니다. +1은 강한 양의 상관, -1은 강한 음의 상관을 의미합니다.
$$r = \frac{\text{Cov}(X, Y)}{\sigma_X \sigma_Y}$$
8. 무차원수 (Dimensionless Number)
단위가 없는 순수한 수치로, 비교와 해석을 간편하게 해 줍니다. 비율이나 확률 등이 여기에 속합니다.
$$\text{비율} = \frac{\text{부분}}{\text{전체}}$$
9. 정규화 (Normalization)
데이터의 크기나 범위를 일정한 기준으로 맞추는 작업입니다. 기계학습이나 통계에서 다양한 범위의 데이터를 비교할 수 있게 도와줍니다.
Min-Max 정규화: 최소값과 최대값을 기준으로 0~1 사이로 변환
$$x' = \frac{x - \min(x)}{\max(x) - \min(x)}$$
Z-score 정규화: 평균과 표준편차를 기준으로 정규화
$$x' = \frac{x - \mu}{\sigma}$$
🎯 확률 기반 추정
10. 최대 가능도 추정 (MLE)
관측된 데이터가 실제로 나올 가능성을 가장 크게 해주는 모델의 파라미터를 찾는 방법입니다.
$$\hat{\theta}_{MLE} = \arg\max_\theta L(\theta)$$
11. 로그가능도함수
가능도 함수에 로그를 취해 계산을 더 쉽게 만들며, 여러 확률의 곱을 덧셈으로 바꿔줍니다.
$$\log L(\theta) = \sum_{i=1}^{n} \log P(x_i | \theta)$$
12. 베이즈 추정법 (Bayesian Estimation)
사전 확률을 고려해 새로운 데이터를 반영한 사후 확률을 계산하는 방식입니다. 확률적 불확실성을 반영할 수 있습니다.
$$P(\theta | D) = \frac{P(D | \theta) P(\theta)}{P(D)}$$