"정규 분포"의 두 판 사이의 차이
Pythagoras0 (토론 | 기여) |
|||
1번째 줄: | 1번째 줄: | ||
− | + | ==개요== | |
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
* 고교 과정의 통계에서는 정규분포의 기본적인 성질과 정규분포표 읽는 방법을 배움. | * 고교 과정의 통계에서는 정규분포의 기본적인 성질과 정규분포표 읽는 방법을 배움. | ||
− | * | + | * 평균이 <math>\mu</math>, 표준편차가 <math>\sigma</math>인 정규분포의 <math>N(\mu,\sigma^2)</math>의 확률밀도함수, 즉 가우시안은 다음과 같음이 알려져 있음.<br><math>\frac{1}{\sigma\sqrt{2\pi}}\exp\left(-\frac{(x-\mu)^2}{2\sigma^2}\r ight)</math><br> |
− | * | + | * 아래에서는 이 확률밀도함수가 어떻게 해서 얻어지는가를 보임.(기본적으로는 가우스의 증명) |
− | * 가우시안의 | + | * 가우시안의 형태를 얻는 또다른 방법으로 [[드무아브르-라플라스 중심극한정리]] 를 참조. |
− | + | ||
− | + | ||
− | + | =='오차의 법칙'을 통한 가우시안의 유도== | |
* 오차 = 관측하려는 실제값 - 관측에서 얻어지는 값 | * 오차 = 관측하려는 실제값 - 관측에서 얻어지는 값 | ||
− | * 오차의 분포를 | + | * 오차의 분포를 기술하는 확률밀도함수 <math>\Phi</math>는 다음과 같은 성질을 만족시켜야 함.<br> 1) <math>\Phi(x)=\Phi(-x)</math><br> 2)작은 오차가 큰 오차보다 더 나타날 확률이 커야한다. 그리고 매우 큰 오차는 나타날 확률이 매우 작아야 한다.<br> 3) <math>\int_{-\infty}^{\infty} \Phi(x)\,dx=1</math><br> 4) 관측하려는 실제값이 <math>\mu</math> 이고, n 번의 관측을 통해 <math>x_ 1, x_ 2, \cdots, x_n</math> 을 얻을 확률 <math>\Phi(\mu-x_ 1)\Phi(\mu-x_ 2)\cdots\Phi(\mu-x_n)</math>의 최대값은 <math>\mu=\frac{x_ 1+x_ 2+ \cdots+ x_n}{n}</math>에서 얻어진다.<br> |
− | * 4번 조건을 가우스의 산술평균의 법칙이라 부르며, | + | * 4번 조건을 가우스의 산술평균의 법칙이라 부르며, 관측에 있어 실제값이 될 개연성이 가장 높은 값은 관측된 값들의 산술평균이라는 가정을 하는 것임. |
− | + | ||
(정리) 가우스 | (정리) 가우스 | ||
− | + | 이 조건들을 만족시키는 확률밀도함수는 <math>\Phi(x)=\frac{h}{\sqrt{\pi}}e^{-h^2x^2}</math> 형태로 주어진다. 여기서 <math>h</math>는 확률의 정확도와 관련된 값임. (실제로는 표준편차와 연관되는 값) | |
− | + | ||
(증명) | (증명) | ||
− | <math>n=3</math>인 | + | <math>n=3</math>인 경우에 4번 조건을 만족시키는 함수를 찾아보자. |
− | <math>\Phi(x- | + | <math>\Phi(x-x_ 1)\Phi(x-x_ 2)\Phi(x-x_ 3)</math>의 최대값은 <math>x=\frac{x_ 1+x_ 2+ x_ 3}{3}</math> 에서 얻어진다. |
− | + | 따라서 <math>\ln \Phi(x-x_ 1)\Phi(x-x_ 2)\Phi(x-x_ 3)</math> 의 최대값도 <math>x=\frac{x_ 1+x_ 2+ x_ 3}{3}</math> 에서 얻어진다. | |
− | 미분적분학의 결과에 의해, | + | 미분적분학의 결과에 의해, <math>x=\frac{x_ 1+x_ 2+ x_ 3}{3}</math> 이면, <math>\frac{\Phi'(x-x_ 1)}{\Phi(x-x_ 1)}+\frac{\Phi'(x-x_ 2)}{\Phi(x-x_ 2)}+\frac{\Phi'(x-x_ 3)}{\Phi(x-x_ 3)}=0</math> 이어야 한다. |
− | <math>F(x)=\frac{\Phi'(x)}{\Phi(x)}</math> | + | <math>F(x)=\frac{\Phi'(x)}{\Phi(x)}</math> 으로 두자. |
− | <math>x+y+z=0</math> | + | <math>x+y+z=0</math> 이면, <math>F(x)+F(y)+F(z)=0</math> 이어야 한다. |
− | 1번 조건에 의해, | + | 1번 조건에 의해, <math>F</math> 는 기함수이다. |
− | 따라서 | + | 따라서 모든 <math>x,y</math> 에 의해서, <math>F(x+y)=F(x)+F(y)</math> 가 성립한다. 그러므로 <math>F(x)=Ax</math> 형태로 쓸수 있다. |
− | 이제 적당한 | + | 이제 적당한 상수 <math>B, h</math> 에 의해 <math>\Phi(x)=Be^{-h^2x^2}</math> 꼴로 쓸 수 있다. |
− | 모든 <math>n</math>에 | + | 모든 <math>n</math>에 대하여 4번조건이 만족됨은 쉽게 확인할 수 있다. (증명끝) |
− | + | ||
− | + | ==역사== | |
* 중심극한정리는 여러 과정을 거쳐 발전 | * 중심극한정리는 여러 과정을 거쳐 발전 | ||
64번째 줄: | 56번째 줄: | ||
** 드무아브르가 18세기에 발견한 것은 이항분포에서 확률이 1/2인 경우 | ** 드무아브르가 18세기에 발견한 것은 이항분포에서 확률이 1/2인 경우 | ||
− | ** [[드무아브르-라플라스 중심극한정리]] | + | ** [[드무아브르-라플라스 중심극한정리]] 의 유도는 해당 항목을 참조. |
* [[수학사연표 (역사)|수학사연표]] | * [[수학사연표 (역사)|수학사연표]] | ||
− | + | ||
− | + | ||
− | < | + | ==메모== |
− | + | * 네이버 지식인<br> | |
− | + | ** [http://kin.search.naver.com/search.naver?where=kin_qna&query=%EC%A0%95%EA%B7%9C%EB%B6%84%ED%8F%AC http://kin.search.naver.com/search.naver?where=kin_qna&query=정규분포] | |
+ | ** [http://kin.search.naver.com/search.naver?where=kin_qna&query=%EC%98%A4%EC%B0%A8%EC%9D%98%EB%B2%95%EC%B9%99 http://kin.search.naver.com/search.naver?where=kin_qna&query=오차의법칙] | ||
+ | |||
− | + | ||
− | + | ==재미있는 사실== | |
− | * 정규분포와 중심극한정리에 대한 | + | * 정규분포와 중심극한정리에 대한 이해는 교양인이 알아야 할 수학 주제의 하나나 |
* Galton's quincunx<br> | * Galton's quincunx<br> | ||
− | ** 정규분포의 밀도함수 | + | ** 정규분포의 밀도함수 형태를 물리적으로 얻을 수 있는 장치. |
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | + | [[Media:|Media:]] | |
− | < | + | * 예전 독일 마르크화에는 가우스의 발견을 기려 정규분포곡선이 새겨짐<br>[/pages/1950958/attachments/1448292 Gauss-detail2.jpg]<br> |
− | + | ||
− | |||
<h5>관련된 다른 주제들</h5> | <h5>관련된 다른 주제들</h5> |
2012년 9월 24일 (월) 03:59 판
개요
- 고교 과정의 통계에서는 정규분포의 기본적인 성질과 정규분포표 읽는 방법을 배움.
- 평균이 \(\mu\), 표준편차가 \(\sigma\)인 정규분포의 \(N(\mu,\sigma^2)\)의 확률밀도함수, 즉 가우시안은 다음과 같음이 알려져 있음.
\(\frac{1}{\sigma\sqrt{2\pi}}\exp\left(-\frac{(x-\mu)^2}{2\sigma^2}\r ight)\) - 아래에서는 이 확률밀도함수가 어떻게 해서 얻어지는가를 보임.(기본적으로는 가우스의 증명)
- 가우시안의 형태를 얻는 또다른 방법으로 드무아브르-라플라스 중심극한정리 를 참조.
'오차의 법칙'을 통한 가우시안의 유도
- 오차 = 관측하려는 실제값 - 관측에서 얻어지는 값
- 오차의 분포를 기술하는 확률밀도함수 \(\Phi\)는 다음과 같은 성질을 만족시켜야 함.
1) \(\Phi(x)=\Phi(-x)\)
2)작은 오차가 큰 오차보다 더 나타날 확률이 커야한다. 그리고 매우 큰 오차는 나타날 확률이 매우 작아야 한다.
3) \(\int_{-\infty}^{\infty} \Phi(x)\,dx=1\)
4) 관측하려는 실제값이 \(\mu\) 이고, n 번의 관측을 통해 \(x_ 1, x_ 2, \cdots, x_n\) 을 얻을 확률 \(\Phi(\mu-x_ 1)\Phi(\mu-x_ 2)\cdots\Phi(\mu-x_n)\)의 최대값은 \(\mu=\frac{x_ 1+x_ 2+ \cdots+ x_n}{n}\)에서 얻어진다. - 4번 조건을 가우스의 산술평균의 법칙이라 부르며, 관측에 있어 실제값이 될 개연성이 가장 높은 값은 관측된 값들의 산술평균이라는 가정을 하는 것임.
(정리) 가우스
이 조건들을 만족시키는 확률밀도함수는 \(\Phi(x)=\frac{h}{\sqrt{\pi}}e^{-h^2x^2}\) 형태로 주어진다. 여기서 \(h\)는 확률의 정확도와 관련된 값임. (실제로는 표준편차와 연관되는 값)
(증명)
\(n=3\)인 경우에 4번 조건을 만족시키는 함수를 찾아보자.
\(\Phi(x-x_ 1)\Phi(x-x_ 2)\Phi(x-x_ 3)\)의 최대값은 \(x=\frac{x_ 1+x_ 2+ x_ 3}{3}\) 에서 얻어진다.
따라서 \(\ln \Phi(x-x_ 1)\Phi(x-x_ 2)\Phi(x-x_ 3)\) 의 최대값도 \(x=\frac{x_ 1+x_ 2+ x_ 3}{3}\) 에서 얻어진다.
미분적분학의 결과에 의해, \(x=\frac{x_ 1+x_ 2+ x_ 3}{3}\) 이면, \(\frac{\Phi'(x-x_ 1)}{\Phi(x-x_ 1)}+\frac{\Phi'(x-x_ 2)}{\Phi(x-x_ 2)}+\frac{\Phi'(x-x_ 3)}{\Phi(x-x_ 3)}=0\) 이어야 한다.
\(F(x)=\frac{\Phi'(x)}{\Phi(x)}\) 으로 두자.
\(x+y+z=0\) 이면, \(F(x)+F(y)+F(z)=0\) 이어야 한다.
1번 조건에 의해, \(F\) 는 기함수이다.
따라서 모든 \(x,y\) 에 의해서, \(F(x+y)=F(x)+F(y)\) 가 성립한다. 그러므로 \(F(x)=Ax\) 형태로 쓸수 있다.
이제 적당한 상수 \(B, h\) 에 의해 \(\Phi(x)=Be^{-h^2x^2}\) 꼴로 쓸 수 있다.
모든 \(n\)에 대하여 4번조건이 만족됨은 쉽게 확인할 수 있다. (증명끝)
역사
- 중심극한정리는 여러 과정을 거쳐 발전
- 이항분포의 중심극한 정리
- 라플라스의 19세기 초기 버전
- 라플라스의 19세기 초기 버전
확률변수 X가 이항분포 B(n,p)를 따를 때, n이 충분히 크면 X의 분포는 근사적으로 정규분포 N(np,npq)를 따른다
- 드무아브르가 18세기에 발견한 것은 이항분포에서 확률이 1/2인 경우
- 드무아브르-라플라스 중심극한정리 의 유도는 해당 항목을 참조.
- 수학사연표
메모
- 네이버 지식인
재미있는 사실
- 정규분포와 중심극한정리에 대한 이해는 교양인이 알아야 할 수학 주제의 하나나
- Galton's quincunx
- 정규분포의 밀도함수 형태를 물리적으로 얻을 수 있는 장치.
[[Media:|Media:]]
- 예전 독일 마르크화에는 가우스의 발견을 기려 정규분포곡선이 새겨짐
[/pages/1950958/attachments/1448292 Gauss-detail2.jpg]
관련된 다른 주제들
관련도서 및 추천도서
- History of the Central Limit Theorem : From Laplace to Donsker
- Fischer, Hans
- The History of Statistics: The Measurement of Uncertainty before 1900
- Excursions in calculus
- 206~216p, The law of errors (pdf)
- 도서내검색
- 도서검색
사전형태의 자료
- 동전던지기 시뮬레이션
- 자바애플릿
- [Historical Note on the Origin of the Normal Carve of Errors BY KARL PEARSON]
- http://ko.wikipedia.org/wiki/중심극한정리
- http://ko.wikipedia.org/wiki/정규분포
- http://en.wikipedia.org/wiki/normal_distribution
- http://en.wikipedia.org/wiki/Central_limit_theorem
- http://viswiki.com/en/central_limit_theorem
- 다음백과사전 http://enc.daum.net/dic100/search.do?q=오차의법칙
- 대한수학회 수학 학술 용어집
관련기사
- 과학자들의 진실게임 - 그 법칙은 내꺼야!
- 과학에서 최초의 발견자와 크레딧 논쟁 사례
- 한겨레, 2008-10-10
- 과학에서 최초의 발견자와 크레딧 논쟁 사례
- [재미있는 과학이야기 통계의 기본원리 ② 가우스 분포]
- 주간한국, 2008-01-07
- 네이버 뉴스 검색 (키워드 수정)
- http://news.search.naver.com/search.naver?where=news&x=0&y=0&sm=tab_hty&query=정규분포
- http://news.search.naver.com/search.naver?where=news&x=0&y=0&sm=tab_hty&query=
- http://news.search.naver.com/search.naver?where=news&x=0&y=0&sm=tab_hty&query=
- http://news.search.naver.com/search.naver?where=news&x=0&y=0&sm=tab_hty&query=
- http://news.search.naver.com/search.naver?where=news&x=0&y=0&sm=tab_hty&query=
블로그
- 피타고라스의 창
- 구글 블로그 검색 http://blogsearch.google.com/blogsearch?q=
- 트렌비 블로그 검색 http://www.trenb.com/search.qst?q=
이미지 검색
- http://commons.wikimedia.org/w/index.php?title=Special%3ASearch&search=galton_quincunx
- http://images.google.com/images?q=galton+quincunx