정규 분포

수학노트
http://bomber0.myid.net/ (토론)님의 2009년 4월 23일 (목) 11:49 판
둘러보기로 가기 검색하러 가기
간단한 소개
  • 고딩과정의 통계에서는 정규분포의 기본적인 성질과 정규분포표 읽는 방법을 배움.
  • 정규분포의 확률밀도 함수는 다음과 같음이 알려져 있음.
    \(\frac{1}{\sigma \sqrt{2\pi} } \exp \left(-\frac{(x-\mu)^2}{2\sigma ^2} \right)\)
    • [/pages/1950958/attachments/1448292 Gauss-detail2.jpg]
  • 이 확률밀도함수가 어떻게 해서 얻어지는가 하는 것은 일반적인 고등학교 수준에서는 약간 어려움이 있지만, 호기심이 있는 학생들은 한번 도전해 보는 것도 괜찮아 보임.
  • 방법1. 이항분포에 대한 중심극한정리를 통한 방법
  • 방법2. 가우스의 '오차의 법칙' 을 통한 방법

 

 

정규분포

정규분포 \(N\(\mu, \sigma^2\)\)의 확률밀도함수는 다음과 같다.

 

\(\frac{1}{\sigma \sqrt{2\pi} } \exp \left(-\frac{(x-\mu)^2}{2\sigma ^2} \right)\)

 

 

 앞에 붙어 있는 상수\(\sqrt{2\pi}\)에 담긴 사연

 

 

사실 여기엔 드무아브르에게는 다소 섭섭할만한 역사가 담겨져 있다. 정규분포 이야기에서 잠시 벗어나 보이는 팩토리얼 얘기를 조금 한다. 위에 있는 숫자의 근원이 여기에 있기 때문이다. 소위 스털링의 공식이라고 알려져 있는 팩토리얼의 근사식은 다음과 같다.

 

\( n! \approx \sqrt{2\pi n}\, \left(\frac{n}{e}\right)^{n}\)

 

팩토리얼은 정의는 간단할지라도 n이 조금만 커지기 시작하면 계산하기가 그리 만만치 않은 녀석이다. 따라서 위의 식은 실용적인 측면에서도 매우 유용한 근사식이 된다. 드무아브르는 이 근사식을 유도한 바가 있다. 다만 \(\sqrt{2\pi}\)라는 상수를 구하지 않고 다음과 수준의 표현을 남긴다. 적당한 상수 B가 있어 다음과 같이 된다는 것을!

 

\( n! \approx B \sqrt{n} \left(\frac{n}{e}\right)^{n}\)

 

역사는 다음과 같은 이야기를 전한다.

 

In Miscellanea Analytica (1730) appears Stirling’s formula (wrongly attributed to Stirling) which de Moivre used in 1733 to derive the normal curve as an approximation to the binomial. In the second edition of the book in 1738 de Moivre gives credit to Stirling for an improvement to the formula. De Moivre wrote:-

I desisted in proceeding farther till my worthy and learned friend Mr James Stirling, who had applied after me to that inquiry, [discovered that c = √(2 π)].

 

크레딧을 스털링에게 돌린 드무아브르. 오늘날 팩토리얼의 근사식은 (드무아브르의 이름은 온데간데 없이)

 

 

중심극한정리의 역사
  • 중심극한정리는 여러 과정을 거쳐 발전
  • 이항분포의 중심극한 정리
    • 라플라스의 19세기 초기 버전

확률변수 X가 이항분포 B(n,p)를 따를 때, n이 충분히 크면 X의 분포는 근사적으로 정규분포 N(np,npq)를 따른다

 
    • 드무아브르가 18세기에 발견한 것은 이항분포에서 확률이 1/2인 경우

 

드무아브르의 중심극한정리

(정리) 드무아브르, 1730년대

확률변수 X가 이항분포 B(n,1/2)를 따를 때, n이 충분히 크면 X의 분포는 근사적으로 정규분포 N(n/2,n/4)를 따른다

 

알기 쉬운 말로 표현하면, 동전을 여러번 던져서 앞면 혹은 뒷면이 나오는 경우를 셀 때, 동전을 많이 던질 경우 이것이 대체로 정규분포곡선을 따르게 된다는 것이다.

 

 

증명

월리스 곱

\(<br/>\prod_{n=1}^{\infty} \frac{(2n)(2n)}{(2n-1)(2n+1)} = \frac{2}{1} \cdot \frac{2}{3} \cdot \frac{4}{3} \cdot \frac{4}{5} \cdot \frac{6}{5} \cdot \frac{6}{7} \cdot \frac{8}{7} \cdot \frac{8}{9} \cdot \cdot \cdot = \frac{\pi}{2}.<br/>\)

 

[1]

 

지금 우리의 목표는 동전을 몇 번 던질때, 몇 번 나올 확률이 얼마인지에 대한 근사식을 찾아내는 것이다. 이렇게 일반적인 문제의 해결은 다음으로 미루고, 일단 다음과 같은 구체적인 문제를 먼저 해결하자.

 

(n이 충분히 클 때) 동전을 2n 번 던질때, 앞뒷면이 각각 n 번 나올 확률은 대략 \(\frac{1}{\sqrt{\pi n}}\) 로 주어진다.

 

 

동전을 2n 번 던질때, 앞뒷면이 각각 n 번 나올 확률은 수학적으로 다음과 같다.

 

\(\frac{1}{2^{2n}}{2n\choose n} = \frac{1}{2^{2n}}{{(2n)!} \over {n!n!}}\)

 

한편 월리스의 공식에서 일반항은 다음과 같은데,

 

\(<br/>p_n ={1\over{2n+1}}\prod_{k=1}^{n} \frac{(2k)^4 }{((2k)(2k-1))^2}={1\over{2n+1}}\cdot {{2^{4n}\,(n!)^4}\over {((2n)!)^2}}<br/>\)

 

따라서

 

\(<br/>p_n ={1\over{2n+1}}\cdot {{2^{4n}\,(n!)^4}\over {((2n)!)^2}} \approx {1\over{2n}}\cdot {{2^{4n}\,(n!)^4}\over {((2n)!)^2}}<br/>\)

 

이는 월리스의 공식을 다음과 같은 방식으로도 쓸 수 있다는 것을 말해준다.

 

\(<br/>\frac{\pi}{2} =\lim_{n \to \infty} {1\over{2n}}\cdot {{2^{4n}\,(n!)^4}\over {((2n)!)^2}}<br/>\)

 

그리고 이는 다음을 말해준다.

 

\(<br/>\frac{1}{2^{2n}}{{(2n)!} \over {n!n!}}= \frac{1}{2^{2n}}{2n\choose n} \approx \frac{1}{\sqrt{\pi n}}<br/>\)

 

 

 

동전을 2n번 던져서, 앞면이 n+k 번 나올 확률은 다음과 같이 주어진다.

 

\(<br/>{2n\choose n+k}{2n\choose n}^{-1}<br/>\)

 

앞서 구한 것을 이용하고자 비율을 구할 것이다.

 

\(<br/>{2n\choose n+k}{2n\choose n}^{-1} = \frac{n! n!}{(n+k)!(n-k)!} = \frac{n(n-1)\cdots(n-k+1)}{(n+k)(n+k-1)\cdots (n+1)}= \frac{1 (1-1/n)\cdots(1-(k-1)/n)}{(1+k/n)(1+(k-1)/n)\cdots (1+1/n)}<br/>\)

 

이제 우변의 근사값을 구하기 위해, 로그를 사용하는데, 이 과정에서 로그에 대해 알아야 할 것은 이전과 마찬가지로 두 가지. 하나는 로그는 곱셈을 덧셈으로 바꾼다. 그리고 또 하나는 x가 충분히 작을 때,

 

\(\ln (1+x) \approx x\)

 

라는 것이다.

 

우변에 로그를 취하게 되면,

 

\(\ln \frac{(1-1/n)\cdots(1-(k+1)/n}{(1+k/n)(1+(k-1)/n)\cdots (1+1/n)}\)\(= \ln { (1-1/n)\cdots(1-(k+1)/n})- \ln {(1+k/n)(1+(k-1)/n)\cdots (1+1/n)}\)

 

이 되고,

 

\( \ln {(1-1/n)\cdots(1-(k+1)/n)} \approx - (\frac{1}{n}+\frac{2}{n}+\cdots +\frac{k-1}{n}) = - \frac{k(k-1)}{2n}\)

 

\(\ln {(1+k/n)(1+(k-1)/n)\cdots (1+1/n)} \approx (\frac{k}{n}+\frac{k-1}{n}+\cdots +\frac{1}{n} = \frac{k(k+1)}{2n}\)

 

따라서, 다시 지수함수를 취해주게 되면 다음과 같은 식이 얻어지게 된다.

 

\( \frac{1 (1-1/n)\cdots(1-(k-1)/n)}{(1+k/n)(1+(k-1)/n)\cdots (1+1/n)} \approx \frac{\exp(-\frac{k(k-1)}{2n})}{\exp(\frac{k(k+1)}{2n})} = \exp(-\frac{k^2}{n})\)

 

 

 지금까지 한 작업을 요약하자면,

 

\(<br/>{2n\choose n+k}{2n\choose n}^{-1} \approx \exp(-\frac{k^2}{n})<br/>\)

 

\(<br/>{2n\choose n+k} \approx {2n\choose n}\exp(-\frac{k^2}{n})<br/>\)

 

따라서 동전을 2n번 던져서 앞면이 n+k번 나올 확률이란,

 

\(\frac{1}{2^{2n}}{2n\choose n+k} \approx \frac{1}{\sqrt{\pi n}} \exp(-\frac{k^2}{n})\)

 

이 되는 것이다.


 

여기서 이제 n+k=x 로 두고, 2n번 던져서 x 번 나올 확률을 보게 되면 그 확률은 대략,

 

\( \frac{1}{\sqrt{\pi n}} \exp(-\frac{(x-n)^2}{n})\)

 

이 된다. 그리고 B(2n,1/2)의 평균과 표준편차

 

\(\mu=n, \sigma^2=\frac{n}{2}\)

 

를 이용하여, 중심극한정리가 예측했던 바를 써보면,

 

\(\frac{1}{\sigma \sqrt{2\pi} } \exp \left(-\frac{(x-\mu)^2}{2\sigma ^2} \right) = \frac{1}{\sqrt{\frac{n}{2}}\sqrt{2\pi} } \exp \left(-\frac{(x-n)^2}{2 \frac{n}{2}} \right) = \frac{1}{\sqrt{\pi n}} \exp(-\frac{(x-n)^2}{n})\)

 

 

 

메모

이를 가지고 수능시험에도 낼 수 있는 수준의 문제를 들자면,

 

동전을 100회 던질 때, 앞면이 45회 이상 55회 이하 나올 확률을 구하여라.

 

라고 물으면,

 

정규분포표를 보고 0.7286이라고 대답하면 된다.

 

 

하위주제들

 

 

 

하위페이지

 

 

재미있는 사실

 

관련된 단원

 

 

많이 나오는 질문

 

관련된 고교수학 또는 대학수학

 

 

관련된 다른 주제들

 

관련도서 및 추천도서

 

참고할만한 자료

 

관련기사

 

 

블로그

 

이미지 검색

 

동영상