Poisson distribution
Poisson (포아송) distribution: 일정한 단위의 시간이나 단위 공간에서 한 사건이 발생하는 확률(probability)을 구하는데 사용하는 이산형 확률분포.
- 한 시간 동안 방문하는 고객불만 전화의 수
- 한 달 동안 1번 고속도로에서 발생하는 교통사고의 수
- 1년 동안 엘리베이터가 고장하는 수
- 신문 기사 당 나타나는 오타의 수
단 해당 사건전체에 대한 parameter를 (모수, 전체(population)의 특징을) 알고 있어야 하는 전제가 필요하다. 이를 람다(lambda)라고 부르며 위의 설명과 연결하여 표현하면 일정 시간이나 장소에서 발생하는 사건의 평균횟수를 말한다. 포아송 분포는 아래와 같이 표현한다.
$$P(X = x) \sim Po(\lambda) $$
Lambda를 알고 있을 때, 사건이 x만큼 발생할 확률은 어떨까에 대한 답은 아래와 같이 구한다. 여기서 e는 2.718282 의 상수이다.
e <- exp(1) e
> e <- exp(1) > e [1] 2.718282
\begin{eqnarray*} P(X = x) & = & \frac {\lambda^{x} e^{-\lambda}}{x!}, \;\; \text{for } x = 0, 1, 2, 3, . . . \\ \end{eqnarray*}
R에서는 dpois(x, lambda)
의 명령어를 사용하여 확률을 구한다. 예를 들면 신한은행 마포 지점의 시간 당 평균 손님방문이 30명이라고 한다면, 즉 lambda = 30일 때, 시간 당 25명이 방문할 확률은 아래와 같다 (0.05111534).
> dpois(x = 25, lambda =30) [1] 0.05111534
\begin{eqnarray*} P(X = 25) & = & \frac {30^{25} e^{-30}}{25!}, \\ & = & 0.05111534 \end{eqnarray*}
> lambda <- 30 > x <- 25 > u <- (lambda^x)*e^(-lambda) > d <- factorial(x) > u [1] 7.928607e+23 > d [1] 1.551121e+25 > u/d [1] 0.05111534 >
한달 평균 경부고속도로에서 자동차 사고가 날 수는 30이라고 한다. 그렇다면 이번 달 사고가 28번 이하일 확률은?
> ppois(q=28, lambda=30, lower.tail=TRUE) [1] 0.4030825
그렇다면 30번 날 확률은?
> x <- c(1:60) > dpois(x=x, lambda=30) [1] 2.807287e-12 4.210930e-11 4.210930e-10 3.158198e-09 [5] 1.894919e-08 9.474593e-08 4.060540e-07 1.522702e-06 [9] 5.075675e-06 1.522702e-05 4.152825e-05 1.038206e-04 [13] 2.395861e-04 5.133987e-04 1.026797e-03 1.925245e-03 [17] 3.397491e-03 5.662486e-03 8.940767e-03 1.341115e-02 [21] 1.915879e-02 2.612562e-02 3.407689e-02 4.259611e-02 [25] 5.111534e-02 5.897924e-02 6.553248e-02 7.021338e-02 [29] 7.263453e-02 7.263453e-02 7.029148e-02 6.589826e-02 [33] 5.990751e-02 5.285957e-02 4.530820e-02 3.775683e-02 [37] 3.061365e-02 2.416867e-02 1.859128e-02 1.394346e-02 [41] 1.020253e-02 7.287524e-03 5.084319e-03 3.466581e-03 [45] 2.311054e-03 1.507209e-03 9.620485e-04 6.012803e-04 [49] 3.681308e-04 2.208785e-04 1.299285e-04 7.495876e-05 [53] 4.242949e-05 2.357194e-05 1.285742e-05 6.887904e-06 [57] 3.625212e-06 1.875110e-06 9.534457e-07 4.767229e-07 > plot(dpois(x=x, lambda=30), type = "l") # 아래 그림 참조 > dpois(x=30, lambda=30) [1] 0.07263453 >
\begin{eqnarray*} E(X) & = & \lambda \\ Var(X) & = & \lambda \end{eqnarray*}