ML/확률론

수학 스터디 [확률과 통계] [확률의 naive definition][표본추출][birthday problem] [포함배제 원리]

KAU 2020. 7. 24. 17:28

수학팀:김정민 박형준 최웅준 구예인

2020-07-24 hangout 을 이용한 온라인 스터디

확률의 naïve 한 정의

사건 (event): 표본공간의 부분집합/표본공간 (sample space): 시행에서 발생 가능한 모든 경우의 집합

각각이 일어날 가능성이 모두 같다고 한다면 특정 사건에 대한 확률을 구할 때 

단순히 몇 번 발생하는지 세서 전체로 나누면 되는것 ==>naive definition

 

만족 시켜야할 조건

- 모든 사건이 발생할 확률은 같다
- 유한한 표본공간

 

셈 원리(Counting Principle)

 곱의 법칙: 발생 가능한 경우의 수가 n1,n2,...,nr 가지인 1,2,...r 번의 시행에서 발생 가능한 모든 경우의 수는 

 n1 x n2 x...x nr 이다.

 

이항계수(Binomial Coefficient): 

크기 n의 집합에서 만들 수 있는 크기 k인 부분집합의 수(순서 관계 없이)

 

Non-naïve definition of probability

→ 두 가지 공리로부터 대부분의 식을 유도할 수 있음!

 

Birthday Problem

k가 몇 명 이상이어야 같은 생일을 가진 사람들이 있을 확률이 50%일까?

k명 중에 2명 이상이 같은 생일을 가질 확률 (일별 출생 확률은 동일하고 각각의 사건은 독립적으로 발생한다고 가정한다)

50명만 있어도 97 퍼센트에 달한다.

 

포함배제 원리(inclusive-exclusive principle)

P(A1A2...An)  

모든 사건의 확률을 더하고 교집합 부분을 빼주고 더 큰 교집합 부분을 더해주고... 반복하는 식이다.
왜 이런식으로 표현되었을까?
교집합 부분을 빼줘야 한다.
교집합 부분을 더해줘야 한다.
교집합 부분을 빼줘야한다.==>(-1)^(n-1)로 표현한 이유다.

다시 식으로 돌아와서

위와 같이 풀어 쓸 수 있는데 
이런식으로 소거되서
테일러 근사에 의해서 1-1/e로 간단하게 나타낼 수 있다.