This is an old revision of the document!
Poisson distribution
Poisson (포아송) distribution: 일정한 단위의 시간이나 단위 공간에서 한 사건이 발생하는 확률(probability)을 구하는데 사용하는 이산형 확률분포.
- 한 시간 동안 방문하는 고객불만 전화의 수
- 한 달 동안 1번 고속도로에서 발생하는 교통사고의 수
- 1년 동안 엘리베이터가 고장하는 수
- 신문 기사 당 나타나는 오타의 수
단 해당 사건전체에 대한 parameter를 (모수, 전체(population)의 특징을) 알고 있어야 하는 전제가 필요하다. 이를 람다(lambda)라고 부르며 위의 설명과 연결하여 표현하면 일정 시간이나 장소에서 발생하는 사건의 평균횟수를 말한다. 포아송 분포는 아래와 같이 표현한다.
$$P(X = x) \sim Po(\lambda) $$
Lambda를 알고 있을 때, 사건이 x만큼 발생할 확률은 어떨까에 대한 답은 아래와 같이 구한다. 여기서 e는 2.718282 의 상수이다.
\begin{eqnarray*} P(X = x) & = & \frac {\lambda^{x} e^{-\lambda}}{x!}, \;\; \text{for } x = 0, 1, 2, 3, . . . \\ \end{eqnarray*}
R에서는 dpois(x, lambda)
의 명령어를 사용하여 확률을 구한다. 예를 들면 신한은행 마포 지점의 시간 당 평균 손님방문이 30명이라고 한다면, 즉 lambda = 30일 때, 시간 당 25명이 방문할 확률은 아래와 같다 (0.05111534).
> dpois(x = 25, lambda =30) [1] 0.05111534
\begin{eqnarray*} P(X = 25) & = & \frac {30^{25} e^{-30}}{25!}, \\ & = & 0.05111534 \end{eqnarray*}
> lambda <- 30 > x <- 25 > u <- (lambda^x)*e^(-lambda) > d <- factorial(x) > u [1] 7.928607e+23 > d [1] 1.551121e+25 > u/d [1] 0.05111534 >
e <- exp(1) e
> e <- exp(1) > e [1] 2.718282
\begin{eqnarray*} E(X) & = & \lambda \\ Var(X) & = & \lambda \end{eqnarray*}