출처: http://www.aistudy.co.kr/math/likelihood.htm


Likelihood

 

통계 (Statistics)

Ronald Aylmer Fisher 가 주장하는 어떤 가설 (hypothesis) H 에 대한 우도 (尤度, likelihood) 란, 어떤 시행의 결과 (Evidence) E 가 주어졌다 할 때, 만일 주어진 가설 H 가 참이라면, 그러한 결과 E 가 나올 정도는 얼마나 되겠느냐 하는 것이다. 즉  결과 E 가 나온 경우, 그러한 결과가 나올 수 있는 여러 가능한 가설들을 평가할 수 있는 측도가 곧 우도인 셈이다.

예컨대 어떤 의학 전문가시스템 (Expert System) 은 신체 증상을 입력으로 하여 그에 해당하는 병명과 치료법을 출력으로 한다. 그러나 의학의 끊임없는 발전으로 의학 전문지식들은 늘 새로운 추가적 정보에 의해 새로이 평가되어야 하며, 어떤 결론 역시 하나의 가설로 봄이 적절하다. 즉 주어진 증상에 대해 제시된 병명은 하나의 가설로 볼 수 있다. 새로운 지식이나 증상이 발견되면 새로운 병명 (가설) 이 나와야 할 것이다. 전문가시스템의 불확실성 (Uncertainty) 을 평가하기 위해 흔히 사용하는 베이즈 정리 (Bayes' Theorem) 에서는 사전확률에 새로운 증거를 대입하여 사후확률을 얻게 되는데, 사전확률을 부여함에 있어 자의성을 배제하기 어렵지만, 우도를 사용하여 그 자의성을 벗어나 훨씬 용이하게 사전확률을 계산해 내는 것이 가능하다 (전영삼 1993).

만일 어떤 가설에 대한 우도를 주어진 데이터가 그 가설을지지하는 정도로 해석을 한다 하면, 여러 가설 중 그 우도가 최대가 되는 가설을 선호함은 자연스러운 일이다. 즉 만일 그 가설이 어떤 모집단의 모수 (population parameter) 에 관한 가설이라고 하면, 바로 그 추정치를 해당 모집단에 관한 가장 적절한 추정치로서 선호할 수 있다는 것이다. 피셔에 있어 이와같은 원리를 이른 바 "최대우도의 원리 (Principle of Maximum Likelihood)" 라 부르며, 이와같은 원리에 따라 어떤 모수에 관한 가장 적절한 추정치 (Estimate) 를 구하는 방법을 이른 바 "최대우도의 방법 (Method of Maximum Likelihood) 이라 부른다 (전영삼 1990).

단지 두 개의 class    의 likelihood ratio 는 다음과 같다.

    

 이 1 보다 크면 sample  가 속하는 class 로 class  를 선택하고 1 보다 작으면  를 선택한다 .......

어떤 환자가 HIV virus 가 걸린 것으로 의심되면 혈액의 항체를 검사하는 ELISA test를 하게된다.  를 HIV virus를 가진 사건으로,  를 가지지 않은 사건으로, Pos 를 test에서 양성으로 나온 사건, Neg 는 음성으로 나온 사건으로 둔다. test에서 양성으로 나온 경우 환자가 HIV virus를 가질 확률 즉  을 구하여 보자. 이 경우 임상에서 다음과 같은 확률을 가정한다.

Bayes' 정리를 사용하여 다음과 같은 답을 구할 수 있다.

    

구해진 확률값이 0.5 보다 크기 때문에 해당 환자는 HIV virus일 확률이 높다고 결론짓는다.

다음과 같은 likelihood ratio를 사용해서도 같은 결과를 얻을 수 있다.

ratio 값이 1 보다 크기 때문에 HIV virus일 확률이 높다고 결론짓는다. 여기서 얻어진  로부터 다음과 같이  을 계산하여 Bayes' 정리로 얻어진 것과 같은 결과를 얻는다 (Earl Gose 1996).

Wikipedia : Likelihood    

Wikipedia : Maximum likelihood : 통계학에서 최대우도 (maximum likelihood) 는 유전학자 겸 통계학자인 Ronald A. Fisher 가 개척한 분야로서 점 추정 (point estimation) 의 한 방법이다. 즉  알지 못하는 모집단의 모수 (unobservable population parameter) 의 추정치 으로서 우도함수 (likelihood function) 을 최대로 하는 모수공간의 멤버 (member of the parameter space) 를 사용한다.

Bayes' Theorem : Earl Gose 외

피셔의 우도와 카르납의 확증도 (Fisher's Likelihood and Carnap's Degree of Confirmation) : 전영삼, 고려대철학연구소 철학연구 14권, 1990

전문가시스템을 위한 우도의 활용 (The Application of Likelihood to Expert Systems) : 전영삼, 고려대 철학연구 16권, 1993

ARMA 모형의 상태공간에 의한 최대우도 적합에 관한 연구 (Maximum Likelihood Fitting of ARMA Models With State - Space Approach) : 박종구, 오대호, 신호중, 원광대 공업기술개발연구지 15권, 1995

일반화 최대우도 함수에 의해 추정된 평활모수에 대한 진단 (Diagnostics for Estimated Smoothing Parameter by Generalized Naximum Likelihood Function) : 정원태, 이인석, 정혜정, 한국데이터정보과학회지 7권 2호, 1996

토지 피복 분류에 있어 신경망과 최대우도 분류기의 비교 (A comparison of neural networks and maximum likelihood classifier for the classification of land-cover) : 조기성, 전형섭, 한국지형공간정보학회 지형공간정보 8권 2호, 2000

다변량 구조 모형에서 최대우도 추정 (Maximum Likelihood Estimation in Multivariate Structural Model) : 김기영, 한국통계학회 응용통계연구 1권 1호, 1987

사후확률 결합에 의한 분류정확도 향상에 관한 연구 (A study on classification accuracy improvements using orthogonal summation of posterior probabilities) : 정재준, 한국GIS학회, 2004

A Density-based Clustering Method : 안성만. 백성욱, 한국통계학회, 2002

불완전한 사용현장 보증 데이터를 이용한 제품 신뢰도 추정 (Estimation of Product Reliability with Incomplete Field Warranty Data) : 임태진, 대한산업공학회, 2002



Posted by Name_null