관리 메뉴

너와 나의 스토리

[ML] 푸아송 분포(Poisson distribution) 본문

Data Analysis/Machine learning

[ML] 푸아송 분포(Poisson distribution)

노는게제일좋아! 2019. 8. 27. 10:03
반응형

푸아송 분포

  • 확률론에서 단위 시간 안에 어떤 사건이 몇 번 발생할 것인지를 표현하는 이산 확률 분포

 

이산 확률 분포

 

연속 확률 분포

 

이항 분포

  • 연속된 n번의 독립적 시행에서 각 시행이 확률 p를 가질 때의 이산 확률 분포이다.
  • 이러한 시행은 베르누이 시행이라고 불리기다 한다. 
  • n=1일 때, 이항 분포는 베르누이 분포이다.
  • 이항 분포는 bimodal distribution(양봉 분포)와는 다른 것

 

 

푸아송 분포

정의:

정해진 시간 안에 어떤 사건이 일어날 횟수에 대한 기댓값을 $\lambda$라고 했을 때, 그 사건이 n회 일어날 확률은 다음과 같다.

n~Pois($\lambda$)   -> 단위 시간 당 평균 $\lambda$번 사건이 일어남

(e: 자연상수이다)    -> 이 사건이 일어날 확률의 분포

 

 

$\lambda$=1일 때, y축이 나타내는 의미

n번 중에 어떤 사건이 1(=$\lambda$)번 일어날 것이라고 기대했을 때, k번 사건이 발생할 확률

 

 

 

 

 

 

[사진 출처 - 위키백과]

 

 

 

 

이항 분포와의 관계:

푸아송 분포는 이항 분포의 특수한 형태로 볼 수 있다.

X~B(n,p)

이항 분포를 따르는 위와 같은 확률변수 X에서, n이 대단히 크고 p가 대단히 작을 경우, 이 확률변수 X는 $\lambda=np$인 푸아송 분포를 이용하여 근사값을 구할 수 있다.

예를 들어 DNA에 방사선을 쬐었을 때, 각 염기쌍이 돌연변이를 일으킬 확률은 각각 매우 작고 서로 독립적이다. 또한 하나의 DNA에는 많은 염기쌍이 있다. 따라서 DNA에 방사선을 쬐었을 때 발생하는 돌연변이의 개수는 푸아송 분포로 나타낼 수 있다.

X~Pois(np)

 

 

 

 

출처:

- 위키백과

 

 

 

반응형
Comments