- 챗gpt 참고

 

확률 밀도 함수(PDF)도 상황과 조건에 따라 다양한 형태로 추론할 수 있으며, 정규분포(Gaussian Distribution) 외에도 여러 가지 중요한 확률 밀도 함수들이 존재합니다. 모든 확률밀도함수는 전체정의역에서의 확률밀도함수에서의 적분값이 1입니다. 단 비정규화된 함수는 확률밀도함수로 만들기 위해서는 정규화를 시켜줘야 합니다. 정규화란 전체정의역에서의 확률밀도함수에서의 적분값이 1이 되도록 만들어주는 계산과정을 말합니다.

1. 대표적인 확률 밀도 함수(PDF) 유형

다양한 확률 분포들은 각기 다른 데이터의 성질을 설명하는 데 사용됩니다. 대표적인 분포들을 정리해 보겠습니다.


(1) 정규 분포 (Gaussian Distribution)

  • 정의: 평균을 중심으로 종 모양(bell-shaped curve)을 가지며, 중심 극한 정리(Central Limit Theorem)에 의해 많은 자연 현상에서 나타나는 분포.

확률 밀도 함수

  • 특징:
    • 대칭적이며, 평균 μ\mu를 중심으로 분포됨.
    • 분산 σ2\sigma^2 가 작을수록 더 뾰족하고, 클수록 넓게 퍼짐.
    • 중심 극한 정리(CLT)에 의해 독립적인 랜덤 변수들의 합이 정규분포에 가까워짐.
    • 표준 정규 분포(Standard Normal Distribution)는 μ=0\mu = 0, σ2=1\sigma^2 = 1 인 특수한 경우.
  • 응용 예시:
    • 자연현상: 키, 몸무게, 시험 점수 등
    • 금융: 주가 변동 모델링
    • 통계 검정: 가설 검정 (t-test, ANOVA 등)
    • 머신러닝: 확률 모델링, 이상치 탐지

(2) 균등 분포 (Uniform Distribution)

  • 정의: 모든 값이 동일한 확률을 가짐.

균등 분포

  • 특징:
    • 모든 구간에서 같은 확률을 가지므로 "균등"하다.
    • 주사위나 난수 생성과 같은 랜덤 샘플링에서 많이 사용됨.
  • 응용 예시: 난수 생성, 샘플링, 무작위 이벤트 시뮬레이션.

(3) 지수 분포 (Exponential Distribution)

  • 정의: 어떤 사건이 어느 순간 발생할 확률을 나타냄 (포아송 과정과 관련 있음).

지수 분포

  • 특징:
    • 감쇠하는 확률 밀도 함수 (오른쪽으로 갈수록 확률이 낮아짐).
    • 기억 없음(Memoryless) 성질: 이전의 경과 시간과 관계없이 이후 발생 확률이 동일함.
  • 응용 예시:
    • 고객 대기 시간, 반감기(방사능 붕괴), 서버 요청 처리 시간 등.

(4) 감마 분포 (Gamma Distribution)

  • 정의: 지수 분포의 확장 형태로, 여러 개의 독립적인 지수 분포가 합쳐진 형태.

감마 분포

  • 특징:
    • 지수 분포를 일반화한 형태.
    • 다양한 확률 모델링에 적용 가능.
  • 응용 예시: 보험 리스크 분석, 고객 도착 시간 모델링.

(5) 포아송 분포 (Poisson Distribution)

  • 정의: 특정 시간 또는 공간에서 어떤 사건이 발생하는 횟수를 설명하는 분포.

포아송 분포

  • 특징:
    • 정수 값(0, 1, 2,...)만 가질 수 있음.
    • 랜덤 한 이벤트 발생 횟수를 모델링하는 데 적합.
  • 응용 예시:
    • 웹사이트 방문자 수 예측, 콜센터 전화 도착 건수 예측.

(6) 베타 분포 (Beta Distribution)

  • 정의: 0과 1 사이의 값만을 가지며, 사건의 확률 분포를 추정할 때 사용.

베타 분포

  • 특징:
    • 베이지안 통계에서 확률 추정에 많이 사용됨.
    • 사건이 일어날 확률을 모델링하는 데 적합.
  • 응용 예시:
    • A/B 테스트, 신뢰도 분석, 확률 모델링.

(7) 카이제곱 분포 (Chi-Square Distribution)

  • 정의: 정규 분포를 따르는 변수들의 제곱합으로 정의됨.

카이제곱 분포

  • 특징:
    • 검정 통계량에 자주 사용됨 (카이제곱 검정).
  • 응용 예시:
    • 분산 분석(ANOVA), 적합도 검정.

(8) 스튜던트 t-분포 (Student’s t-Distribution)

  • 정의: 정규분포의 변형으로, 표본 크기가 작은 경우 평균을 추정할 때 사용.

스튜던트 t-분포

  • 특징:
    • 정규분포보다 꼬리가 두꺼움.
    • 샘플 크기가 작을 때 정규분포보다 더 정확한 평균 추정을 제공.
  • 응용 예시:
    • 평균 차이 검정 (t-검정).

(9) 로그 정규 분포 (Log-Normal Distribution)

  • 정의: 변수가 정규분포를 따르는 로그 값으로 표현될 때 사용.

로그 정규 분포

  • 특징:
    • 지수적으로 증가하는 데이터에 적합.
    • 정규분포의 로그 변환된 형태.
  • 응용 예시:
    • 주식 가격 분포, 자연 데이터(나무 높이, 생물 크기) 분석.

2. 결론

✔️ 정규 분포는 자연에서 가장 흔히 나타나는 분포이며, 중심 극한 정리 덕분에 많은 데이터가 정규분포를 따름.
✔️ 확률 밀도 함수(PDF)는 평균과 분산을 조절하여 데이터를 모델링할 수 있음.
✔️ 가설 검정, 통계적 분석, 머신러닝에서 필수적으로 사용됨.

📌 다양한 확률 분포 비교

분포 유형 특징

정규 분포 자연현상, 중심 극한 정리, 대칭적
균등 분포 모든 값이 동일한 확률
지수 분포 사건 발생 대기 시간
감마 분포 여러 개의 지수 분포의 합
포아송 분포 사건 발생 횟수
베타 분포 확률 추정, 베이지안 통계
카이제곱 분포 통계 검정(적합도 검정)
t-분포 작은 샘플에서 평균 분석
로그 정규 분포 주가, 생물 크기 분석

 

 

https://ebook-product.kyobobook.co.kr/dig/epd/ebook/E000008827991

 

혁신적 사고의 비밀 | 박지온 | 작가와- 교보ebook

비전을 깨우는 메타인지 학습법인간은 누구나 자기중심적인 성향과 생존에 대한 본능적 욕구를 지니고 있습니다. 하지만 회사에서 프로젝트를 진행하거나 학업에 임할 때, 이러한 욕구에 휘둘

ebook-product.kyobobook.co.kr

 

+ Recent posts