드무아브르-라플라스 중심 극한 정리
드무아브르의 중심극한정리
(정리) 드무아브르, 1730년대
확률변수 X가 이항분포 B(n,1/2)를 따를 때, n이 충분히 크면 X의 분포는 근사적으로 정규분포 N(n/2,n/4)를 따른다
알기 쉬운 말로 표현하면, 동전을 여러번 던져서 앞면 혹은 뒷면이 나오는 경우를 셀 때, 동전을 많이 던질 경우 이것이 대체로 정규분포곡선을 따르게 된다는 것이다.
증명
월리스 곱\[\prod_{n=1}^{\infty} \frac{(2n)(2n)}{(2n-1)(2n+1)} = \frac{2}{1} \cdot \frac{2}{3} \cdot \frac{4}{3} \cdot \frac{4}{5} \cdot \frac{6}{5} \cdot \frac{6}{7} \cdot \frac{8}{7} \cdot \frac{8}{9} \cdot \cdot \cdot = \frac{\pi}{2}\] 을 이용하자.
다음은 http://bomber0.byus.net/index.php/2008/07/12/686 에서 가져옴.
지금 우리의 목표는 동전을 몇 번 던질때, 몇 번 나올 확률이 얼마인지에 대한 근사식을 찾아내는 것이다. 이렇게 일반적인 문제의 해결은 다음으로 미루고, 일단 다음과 같은 구체적인 문제를 먼저 해결하자.
(n이 충분히 클 때) 동전을 2n 번 던질때, 앞뒷면이 각각 n 번 나올 확률은 대략 \(\frac{1}{\sqrt{\pi n}}\) 로 주어진다.
동전을 2n 번 던질때, 앞뒷면이 각각 n 번 나올 확률은 수학적으로 다음과 같다.
\(\frac{1}{2^{2n}}{2n\choose n} = \frac{1}{2^{2n}}{{(2n)!} \over {n!n!}}\)
한편 월리스의 공식에서 일반항은 다음과 같은데,
\(<br/>p_n ={1\over{2n+1}}\prod_{k=1}^{n} \frac{(2k)^4 }{((2k)(2k-1))^2}={1\over{2n+1}}\cdot {{2^{4n}\,(n!)^4}\over {((2n)!)^2}}<br/>\)
따라서
\(<br/>p_n ={1\over{2n+1}}\cdot {{2^{4n}\,(n!)^4}\over {((2n)!)^2}} \approx {1\over{2n}}\cdot {{2^{4n}\,(n!)^4}\over {((2n)!)^2}}<br/>\)
이는 월리스의 공식을 다음과 같은 방식으로도 쓸 수 있다는 것을 말해준다.
\(<br/>\frac{\pi}{2} =\lim_{n \to \infty} {1\over{2n}}\cdot {{2^{4n}\,(n!)^4}\over {((2n)!)^2}}<br/>\)
그리고 이는 다음을 말해준다.
\(<br/>\frac{1}{2^{2n}}{{(2n)!} \over {n!n!}}= \frac{1}{2^{2n}}{2n\choose n} \approx \frac{1}{\sqrt{\pi n}}<br/>\)
동전을 2n번 던져서, 앞면이 n+k 번 나올 확률은 다음과 같이 주어진다.
\(<br/>{2n\choose n+k}{2n\choose n}^{-1}<br/>\)
앞서 구한 것을 이용하고자 비율을 구할 것이다.
\(<br/>{2n\choose n+k}{2n\choose n}^{-1} = \frac{n! n!}{(n+k)!(n-k)!} = \frac{n(n-1)\cdots(n-k+1)}{(n+k)(n+k-1)\cdots (n+1)}= \frac{1 (1-1/n)\cdots(1-(k-1)/n)}{(1+k/n)(1+(k-1)/n)\cdots (1+1/n)}<br/>\)
이제 우변의 근사값을 구하기 위해, 로그를 사용하는데, 이 과정에서 로그에 대해 알아야 할 것은 이전과 마찬가지로 두 가지. 하나는 로그는 곱셈을 덧셈으로 바꾼다. 그리고 또 하나는 x가 충분히 작을 때,
\(\ln (1+x) \approx x\)
라는 것이다.
우변에 로그를 취하게 되면,
\(\ln \frac{(1-1/n)\cdots(1-(k+1)/n}{(1+k/n)(1+(k-1)/n)\cdots (1+1/n)}\)\(= \ln { (1-1/n)\cdots(1-(k+1)/n})- \ln {(1+k/n)(1+(k-1)/n)\cdots (1+1/n)}\)
이 되고,
\( \ln {(1-1/n)\cdots(1-(k+1)/n)} \approx - (\frac{1}{n}+\frac{2}{n}+\cdots +\frac{k-1}{n}) = - \frac{k(k-1)}{2n}\)
\(\ln {(1+k/n)(1+(k-1)/n)\cdots (1+1/n)} \approx (\frac{k}{n}+\frac{k-1}{n}+\cdots +\frac{1}{n} = \frac{k(k+1)}{2n}\)
따라서, 다시 지수함수를 취해주게 되면 다음과 같은 식이 얻어지게 된다.
\( \frac{1 (1-1/n)\cdots(1-(k-1)/n)}{(1+k/n)(1+(k-1)/n)\cdots (1+1/n)} \approx \frac{\exp(-\frac{k(k-1)}{2n})}{\exp(\frac{k(k+1)}{2n})} = \exp(-\frac{k^2}{n})\)
지금까지 한 작업을 요약하자면,
\(<br/>{2n\choose n+k}{2n\choose n}^{-1} \approx \exp(-\frac{k^2}{n})<br/>\)
\(<br/>{2n\choose n+k} \approx {2n\choose n}\exp(-\frac{k^2}{n})<br/>\)
따라서 동전을 2n번 던져서 앞면이 n+k번 나올 확률이란,
\(\frac{1}{2^{2n}}{2n\choose n+k} \approx \frac{1}{\sqrt{\pi n}} \exp(-\frac{k^2}{n})\)
이 되는 것이다.
여기서 이제 n+k=x 로 두고, 2n번 던져서 x 번 나올 확률을 보게 되면 그 확률은 대략,
\( \frac{1}{\sqrt{\pi n}} \exp(-\frac{(x-n)^2}{n})\)
이 된다. 그리고 B(2n,1/2)의 평균과 표준편차
\(\mu=n, \sigma^2=\frac{n}{2}\)
를 이용하여, 중심극한정리가 예측했던 바를 써보면,
\(\frac{1}{\sigma \sqrt{2\pi} } \exp \left(-\frac{(x-\mu)^2}{2\sigma ^2} \right) = \frac{1}{\sqrt{\frac{n}{2}}\sqrt{2\pi} } \exp \left(-\frac{(x-n)^2}{2 \frac{n}{2}} \right) = \frac{1}{\sqrt{\pi n}} \exp(-\frac{(x-n)^2}{n})\)
메모
이를 가지고 수능시험에도 낼 수 있는 수준의 문제를 들자면,
동전을 100회 던질 때, 앞면이 45회 이상 55회 이하 나올 확률을 구하여라.
라고 물으면,
정규분포표를 보고 0.7286이라고 대답하면 된다.
관련논문
- From Pascal's Triangle to the Bell-shaped Curve
- Tony Phillips