본문으로 이동

정규분포: 두 판 사이의 차이

K-위키
편집 요약 없음
편집 요약 없음
21번째 줄: 21번째 줄:
Y~N(μ, σ^2)라고 하고 Z = (Y-μ)/σ로 정의하자. 즉 Z = Y/σ - μ/σ다. 이 식을 Y에 대해 정리하면 Y = σZ + μ (=(h^-1)(Z))가 나온다.
Y~N(μ, σ^2)라고 하고 Z = (Y-μ)/σ로 정의하자. 즉 Z = Y/σ - μ/σ다. 이 식을 Y에 대해 정리하면 Y = σZ + μ (=(h^-1)(Z))가 나온다.


f_Y(y)를 Y의 pdf라고 하자. 그러면 f_Y(y)=(1/(σsqrt(2pi)))exp(-((y-μ)^2)/(2σ^2))다 (-∞ < y < ∞).
f_Y(y)를 Y의 pdf, f_Z(z)를 Z의 pdf라고 하자. (h^-1)(z) = σz + μ는 증가함수이고 (∵ σ > 0) 모든 y (-∞ < y < ∞)에 대해 f_Y(y) > 0이므로 


이제 Z의 pdf(=f_Z(z))는 f_Y((h^-1)(z))|dh^-1/dz|이고 (-∞ < σz +μ < ∞ => -∞ < z < ∞),
f_Y(y)=(1/(σsqrt(2pi)))exp(-((y-μ)^2)/(2σ^2)) (-∞ < y < ∞) => f_Z(z) = f_Y((h^-1)(z))|dh^-1/dz| (-∞ < σz +μ < ∞ => -∞ < z < ∞)이다.


이는 f_Y(σz +μ)|σ| = σf_Y(σz +μ) (왜냐하면 σ > 0이므로)임을 알 수 있다.
즉 f_Z(z) = f_Y(σz +μ)|σ| (∵dh^-1/dz = d/dz [σz + μ] = σ) = σf_Y(σz +μ) (σ > 0)임을 알 수 있다.


그런데 f_Y(σz +μ) = (1/(σsqrt(2pi)))exp(-((σz +μ-μ)^2)/(2σ^2)) = (1/(σsqrt(2pi)))exp(-(σ^2)(z^2)/(2σ^2))  
그런데 f_Y(σz +μ) = (1/(σsqrt(2pi)))exp(-((σz +μ-μ)^2)/(2σ^2)) = (1/(σsqrt(2pi)))exp(-(σ^2)(z^2)/(2σ^2))  
32번째 줄: 32번째 줄:


결국 f_Z(z) = (1/sqrt(2pi))exp(-(z^2)/(2))이고, 이는 Z~N(μ=0, σ^2=1)임을 보인다. ▯
결국 f_Z(z) = (1/sqrt(2pi))exp(-(z^2)/(2))이고, 이는 Z~N(μ=0, σ^2=1)임을 보인다. ▯





2017년 7월 5일 (수) 11:20 판

이 문서는 이과가 작성했거나, 또는 이과에 대해 다룹니다.
무슨 생각으로 작성한 건지는 잘 모르겠습니다만 맞는말임은 틀림 없습니다.
이과는 아다를 못 떼 마법을 쓰니까 말이죠...

Normal Distribution

확통에서 존나 개꿀인 파트

수학

확률밀도함수(probability density function, pdf)중 하나다. 급식 수준의 통계학을 배울때부터 나온다는 점에서부터 이놈의 중요성은 설명하지 않아도 아리라 생각한다.

보통 그리면 종 모양(bell-shaped)으로 생겼는데 종 가운데의 지점을 평균(mean, μ)이라고 한다. 종의 모양은 표준편차값(standard deviation, σ)에 따라 달라진다. 이놈의 적분이 곧 그 확률변수 구간에서의 확률을 나타낸다.

근데 이놈은 초등함수 적분이 불가능한 대표적인 함수 중에 하나라서 급식 수준에서는 그냥 표준정규분포(standard normal distribution; μ=0, σ^2=1)로 근사한 후 표준정규분포표를 갖고 확률을 구할거다.


즉 확률변수(random variable) Y가 N(μ, σ^2)을 갖고 있을 때 (<==> Y~N(μ, σ^2)), Z=(Y-μ)/σ ~ N(μ=0, σ^2=1)가 성립한다.

증명:

Y~N(μ, σ^2)라고 하고 Z = (Y-μ)/σ로 정의하자. 즉 Z = Y/σ - μ/σ다. 이 식을 Y에 대해 정리하면 Y = σZ + μ (=(h^-1)(Z))가 나온다.

f_Y(y)를 Y의 pdf, f_Z(z)를 Z의 pdf라고 하자. (h^-1)(z) = σz + μ는 증가함수이고 (∵ σ > 0) 모든 y (-∞ < y < ∞)에 대해 f_Y(y) > 0이므로

f_Y(y)=(1/(σsqrt(2pi)))exp(-((y-μ)^2)/(2σ^2)) (-∞ < y < ∞) => f_Z(z) = f_Y((h^-1)(z))|dh^-1/dz| (-∞ < σz +μ < ∞ => -∞ < z < ∞)이다.

즉 f_Z(z) = f_Y(σz +μ)|σ| (∵dh^-1/dz = d/dz [σz + μ] = σ) = σf_Y(σz +μ) (∵ σ > 0)임을 알 수 있다.

그런데 f_Y(σz +μ) = (1/(σsqrt(2pi)))exp(-((σz +μ-μ)^2)/(2σ^2)) = (1/(σsqrt(2pi)))exp(-(σ^2)(z^2)/(2σ^2))

= (1/(σsqrt(2pi)))exp(-(z^2)/(2))이므로 σf_Y(σz +μ) = (1/sqrt(2pi))exp(-(z^2)/(2))다.

결국 f_Z(z) = (1/sqrt(2pi))exp(-(z^2)/(2))이고, 이는 Z~N(μ=0, σ^2=1)임을 보인다. ▯


다행히도 학식 이상에서는 이놈을 적분할 방법이 여러가지 나오므로 혹시 이걸 적분해보고 싶어 미치겠는 잉여라면 대학 미적분학을 열람하도록.

사실 가장 중요한 점은 바로 성급한 일반화의 오류충들을 아닥하게 만드는 함수라는 거다. 성급한 일반화의 오류충들에게 이걸 들이대고 그런 놈이 대부분이라는 것을 입증하면 전부 다 버로우한다. 즉, 팩트폭력의 재료 중 하나라는 것이다.