출처: http://www.aistudy.co.kr/math/likelihood.htm
Likelihood
Ronald Aylmer Fisher 가 주장하는 어떤 가설 (hypothesis) H 에 대한 우도 (尤度, likelihood) 란, 어떤 시행의 결과 (Evidence) E 가 주어졌다 할 때, 만일 주어진 가설 H 가 참이라면, 그러한 결과 E 가 나올 정도는 얼마나 되겠느냐 하는 것이다. 즉 결과 E 가 나온 경우, 그러한 결과가 나올 수 있는 여러 가능한 가설들을 평가할 수 있는 측도가 곧 우도인 셈이다.
예컨대 어떤 의학 전문가시스템 (Expert System) 은 신체 증상을 입력으로 하여 그에 해당하는 병명과 치료법을 출력으로 한다. 그러나 의학의 끊임없는 발전으로 의학 전문지식들은 늘 새로운 추가적 정보에 의해 새로이 평가되어야 하며, 어떤 결론 역시 하나의 가설로 봄이 적절하다. 즉 주어진 증상에 대해 제시된 병명은 하나의 가설로 볼 수 있다. 새로운 지식이나 증상이 발견되면 새로운 병명 (가설) 이 나와야 할 것이다. 전문가시스템의 불확실성 (Uncertainty) 을 평가하기 위해 흔히 사용하는 베이즈 정리 (Bayes' Theorem) 에서는 사전확률에 새로운 증거를 대입하여 사후확률을 얻게 되는데, 사전확률을 부여함에 있어 자의성을 배제하기 어렵지만, 우도를 사용하여 그 자의성을 벗어나 훨씬 용이하게 사전확률을 계산해 내는 것이 가능하다 (전영삼 1993).
만일 어떤 가설에 대한 우도를 주어진 데이터가 그 가설을지지하는 정도로 해석을 한다 하면, 여러 가설 중 그 우도가 최대가 되는 가설을 선호함은 자연스러운 일이다. 즉 만일 그 가설이 어떤 모집단의 모수 (population parameter) 에 관한 가설이라고 하면, 바로 그 추정치를 해당 모집단에 관한 가장 적절한 추정치로서 선호할 수 있다는 것이다. 피셔에 있어 이와같은 원리를 이른 바 "최대우도의 원리 (Principle of Maximum Likelihood)" 라 부르며, 이와같은 원리에 따라 어떤 모수에 관한 가장 적절한 추정치 (Estimate) 를 구하는 방법을 이른 바 "최대우도의 방법 (Method of Maximum Likelihood) 이라 부른다 (전영삼 1990).
단지 두 개의 class 와 의 likelihood ratio 는 다음과 같다.
이 1 보다 크면 sample 가 속하는 class 로 class 를 선택하고 1 보다 작으면 를 선택한다 .......
어떤 환자가 HIV virus 가 걸린 것으로 의심되면 혈액의 항체를 검사하는 ELISA test를 하게된다. 를 HIV virus를 가진 사건으로, 를 가지지 않은 사건으로, Pos 를 test에서 양성으로 나온 사건, Neg 는 음성으로 나온 사건으로 둔다. test에서 양성으로 나온 경우 환자가 HIV virus를 가질 확률 즉 을 구하여 보자. 이 경우 임상에서 다음과 같은 확률을 가정한다.
Bayes' 정리를 사용하여 다음과 같은 답을 구할 수 있다.
구해진 확률값이 0.5 보다 크기 때문에 해당 환자는 HIV virus일 확률이 높다고 결론짓는다.
다음과 같은 likelihood ratio를 사용해서도 같은 결과를 얻을 수 있다.
ratio 값이 1 보다 크기 때문에 HIV virus일 확률이 높다고 결론짓는다. 여기서 얻어진 로부터 다음과 같이 을 계산하여 Bayes' 정리로 얻어진 것과 같은 결과를 얻는다 (Earl Gose 1996).
Wikipedia : Maximum likelihood : 통계학에서 최대우도 (maximum likelihood) 는 유전학자 겸 통계학자인 Ronald A. Fisher 가 개척한 분야로서 점 추정 (point estimation) 의 한 방법이다. 즉 알지 못하는 모집단의 모수 (unobservable population parameter) 의 추정치 으로서 우도함수 (likelihood function) 을 최대로 하는 모수공간의 멤버 (member of the parameter space) 를 사용한다.
Bayes' Theorem : Earl Gose 외
피셔의 우도와 카르납의 확증도 (Fisher's Likelihood and Carnap's Degree of Confirmation) : 전영삼, 고려대철학연구소 철학연구 14권, 1990
전문가시스템을 위한 우도의 활용 (The Application of Likelihood to Expert Systems) : 전영삼, 고려대 철학연구 16권, 1993
ARMA 모형의 상태공간에 의한 최대우도 적합에 관한 연구 (Maximum Likelihood Fitting of ARMA Models With State - Space Approach) : 박종구, 오대호, 신호중, 원광대 공업기술개발연구지 15권, 1995
일반화 최대우도 함수에 의해 추정된 평활모수에 대한 진단 (Diagnostics for Estimated Smoothing Parameter by Generalized Naximum Likelihood Function) : 정원태, 이인석, 정혜정, 한국데이터정보과학회지 7권 2호, 1996
토지 피복 분류에 있어 신경망과 최대우도 분류기의 비교 (A comparison of neural networks and maximum likelihood classifier for the classification of land-cover) : 조기성, 전형섭, 한국지형공간정보학회 지형공간정보 8권 2호, 2000
다변량 구조 모형에서 최대우도 추정 (Maximum Likelihood Estimation in Multivariate Structural Model) : 김기영, 한국통계학회 응용통계연구 1권 1호, 1987
사후확률 결합에 의한 분류정확도 향상에 관한 연구 (A study on classification accuracy improvements using orthogonal summation of posterior probabilities) : 정재준, 한국GIS학회, 2004
A Density-based Clustering Method : 안성만. 백성욱, 한국통계학회, 2002
불완전한 사용현장 보증 데이터를 이용한 제품 신뢰도 추정 (Estimation of Product Reliability with Incomplete Field Warranty Data) : 임태진, 대한산업공학회, 2002
'Statistics' 카테고리의 다른 글
정규분포 (펌) (0) | 2015.05.17 |
---|---|
확률을 대하는 두 가지 관점 (펌) (0) | 2015.05.17 |
MOOC 소개 (펌)_zeronova.kr (0) | 2015.05.06 |
MOOC 데이터 사이언스 코스 리뷰 (펌) (1) | 2015.05.06 |
베이지언 확률(Bayesian Probability) (펌)_다크 프로그래머 (0) | 2015.04.21 |