ML/확률론

정규분포 (Normal Distribution)

KAU 2020. 8. 26. 15:36

균등분포의 보편성 

F가 증가하는 CDF라고 할 때,

u가 0에서 1까지의 균등분포이면==UUnif(0,1)이면

 

X^-1(U) ~ F이다.

 

이론상으로는 0에서 1까지의 균등분포를 가지는 확률변수로

우리가 원하는 어떠한 형태의 분포를 가지는 확률변수를 만들 수 있는 겁니다.

시뮬레이션할 때 쓰인다고 합니다.

 

F의 분포를 가진 제비뽑기를 모의로 실행할 때 

다른 연속분포보다 만들기 쉬운 균등분포를 만든 후 

F^-1(u)를 계산하면 되는것 입니다.

하지만 F의 역함수를 찾는것이 쉽지는 않습니다.

 

이론상으론 균등분포에서 모든 형태의 분포로 전환할 수 있습니다.

 

반대로 

X를 알고 있을 때 

X ~ F이면 F(X) ~ Unif(0,1)이다.

X가 F의 분포를 가질 때 F(X)를 계산하면 

0~1까지의 균등분포가 나오는것 입니다.

위와 같이 사용하면 안된다.
F를 식으로 풀어 쓴 후 x를 X로 바꾸라는 겁니다.

F가 누적분포함수이니 0~1사이의 값만 가질 수 있는것 입니다.

 

시뮬레이션

X가 아주 복잡하거나 모르는 분포를 가질 때

그걸 간단한 균등분포로 바꿀 수 있다는 겁니다.

균등분포로 바꾸는 게 유용할 수 있습니다. 

여러가지를 해보고 균등분포가 아니라면 

모델이 틀렸다는걸 알 수 있는것이죠.

균등분포에서 다른 어떤한 분포로 전환이 가능하기에 시뮬레이션에 유용합니다.

 

F(x)의 분포를 모의로 실행하고 싶을 때 

X가 F의 분포를 가지는 시뮬레이션을 하고 싶은 거죠

우리가 해야될 것은 위의 결과에 따르면 F의 역함수를 찾는겁니다.

F(x)를 u라고 하면

x를 u에 대해 정리하면 됩니다.

F⁻¹(u) = -ln(1 - u)가

우리가 원했던 F의 분포를 가지게 됩니다

컴퓨터로 10번의 제비뽑기를 하면 10개의 독립적이고 똑같은 균등분포를 만들게 됩니다.

 

균등분포의 대칭성

U ~ Unif(0,1)일 때, 1-U ~ Unif(0,1) 이다.

 

왼쪽에서 재든 오른쪽에서 재든 균등분포에서 무작위로 잡은 점이기 때문에 상관없습니다.

균등분포의 선형전환

U ~ Unif(0,1)일 때, a+bU ~ Unif(a,a+b) 이다. 

 

(비선형적 '변환' 시 더 이상 균등분포를 따르지 않는다. ex) u를 제곱하면 균등분포를 따르지 않는다.)

 

확률변수의 독립

확률변수 X1,X2...,Xn가 모든 x1,x2,...,xn에 대하여

완전한 독립을 의미한다. 쌍으로 독립(pairwise independence)보다 '센' 개념 (쌍으로 독립은 완전한 독립은 아니다)

완전한 독립성은 어떠한 조합의 사건의 실행 여부를 알아도 나머지에 대해 아무 것도 모르는 겁니다.

 

정규분포 (Normal Distribution)

중심극한정리

독립적이고 동일한 많은 확률변수의 합은 정규분포에 근접한다

여러 개의 독립적이고 동일한 확률변수를 더했을 때 그합의 분포가 정규분포를 따라 갈 것 이라는것

독립적이고 똑같은 확률변수를 많이 더하면 정규분포를 가진다는것

연속이거나 이산이거나 간단하거나 복잡하거나 어떤 확률 변수이든 더하면 같은 정규분포를 가지게 된다는것

독립적이고 동일하지 않은경우에도 일반화가 가능합니다.

대칭이고 그래프의 총넓이가 1이다.

 

표준정규분포

N(0, 1)이라고 표기합니다

이 표기는 평균이 0이고 분산이 1이라는 뜻입니다

평균과 분산 총 두 개의 모수를 가집니다

확률밀도함수 f(z) c는 정규화 상수==>적분해서 1이 되게 하는 상수값

부정적분으로 찾지 말고 정적분으로 c를 찾아야 한다.

부정적분으로 c를 찾는것은 불가능에 가깝기 때문에

극좌표를 쓰면서 원이 나와서 파이가 나온것

 

표준정규분포의 평균 및 분산