관리 메뉴

너와 나의 스토리

GP(Gaussian Process regression) 본문

Data Analysis/Machine learning

GP(Gaussian Process regression)

노는게제일좋아! 2019. 7. 17. 15:33
반응형

출처: https://en.wikipedia.org/wiki/Gaussian_process

 

Gaussian process는 많은 무작위 변수의 공동 분포이며, 이와 같이 시간이나 공간과 같은 연속적인 도메인을 가진 기능에 대한 분포다. (시간 연속적인 확률 과정)

 

Gaussian process를 사용하는 머신 러닝 알고리즘은 lazy learning과 포인트 간의 유사성 측정(kernel function)을 사용하여 학습 데이터로부터보이지 않는 지점의 값을 예측한다. 예측은 그 점에 대한 추정일 뿐 아니라 불확실성 정보도 포함한다. 이는 1차원 가우스 분포이다.

 

일부 커널 함수의 경우 행렬 대수를 사용하여 kriging 기술을 사용하여 예측을 계산할 수 있다. 

 

Gaussian process의 개념은 가우스 분포(normal distribution)의 개념에 기초한다.

Gaussian process는 다변량 정규 분포(multivariate noraml distributions)의 무한 차원 일반화로 볼 수 있다.

 

Gaussian process는 통계적 모델링에 유용하며, 정규 분포(normal distribution)에서 상속된 속성에서 이익을 얻는다.

예를 들어, random process를 gaussian process로 모델링한 경우, 다양한 파생 수량의 분포를 명시적으로 얻을 수 있다.

그러한 수량에는 다양한 시간에 걸친 프로세스의 평균값과 작은 세트의 샘플 값을 사용하여 평균을 추정하는 오차가 포함된다.

 

 

GP는 supervised learning의 일종이다.

입력으로 들어오는 (x,y)에 대한 관계가 non-linear할 때, GP를 사용할 수 있다.

반응형
Comments