b:head_first_statistics:geometric_binomial_and_poisson_distributions
Differences
This shows you the differences between two versions of the page.
Both sides previous revisionPrevious revisionNext revision | Previous revision | ||
b:head_first_statistics:geometric_binomial_and_poisson_distributions [2024/10/09 07:53] – [Geometric Distributions] hkimscil | b:head_first_statistics:geometric_binomial_and_poisson_distributions [2024/10/28 08:37] (current) – [Broken Cookies case] hkimscil | ||
---|---|---|---|
Line 646: | Line 646: | ||
- n번의 (독립적인) 시행에서 사건 A가 발생할 때의 확률 분포를 | - n번의 (독립적인) 시행에서 사건 A가 발생할 때의 확률 분포를 | ||
- **이항확률분포**라고 한다. | - **이항확률분포**라고 한다. | ||
+ | 아래를 보면 | ||
+ | * 각 한문제를 맞힐 확률은 1/4, 틀릴 확률은 3/4 | ||
+ | * 3문제를 풀면서 (3번의 시행) 각 문제를 맞힐 확률 분포를 말한다. | ||
{{: | {{: | ||
Line 676: | Line 679: | ||
$$P(X = r) = _{n}C_{r} \cdot p^{r} \cdot q^{n-r}$$ | $$P(X = r) = _{n}C_{r} \cdot p^{r} \cdot q^{n-r}$$ | ||
- | - You’re running a series of independent trials. | + | - You’re running a series of independent trials. |
- | - There can be either a success or failure for each trial, and the probability of success is the same for each trial. | + | - There can be either a success or failure for each trial, and the probability of success is the same for each trial. |
- | - There are a finite number of trials. | + | - There are a finite number of trials. |
X가 n번의 시행에서 성공적인 결과를 얻는 수를 나타낸다고 할 때, r번의 성공이 있을 확률을 구하려면 아래 공식을 이용한다. | X가 n번의 시행에서 성공적인 결과를 얻는 수를 나타낸다고 할 때, r번의 성공이 있을 확률을 구하려면 아래 공식을 이용한다. | ||
Line 700: | Line 703: | ||
\begin{eqnarray*} | \begin{eqnarray*} | ||
- | E(X) & = & \sum{n*p(x)} \\ | + | E(X) & = & \sum{x * p(x)} \\ |
- | & = & (1*p)+(0*q) \\ | + | & = & (0*q) + (1*p) \\ |
& = & p | & = & p | ||
\end{eqnarray*} | \end{eqnarray*} | ||
Line 752: | Line 755: | ||
n <-5 | n <-5 | ||
# combinations of 5,2 | # combinations of 5,2 | ||
- | c <- choose(5,2) | + | c <- choose(n,r) |
ans1 <- c*(p^r)*(q^(n-r)) | ans1 <- c*(p^r)*(q^(n-r)) | ||
ans1 | ans1 | ||
Line 762: | Line 765: | ||
> n <-5 | > n <-5 | ||
> # combinations of 5,2 | > # combinations of 5,2 | ||
- | > c <- choose(5,2) | + | > c <- choose(n,r) |
> ans <- c*(p^r)*(q^(n-r)) | > ans <- c*(p^r)*(q^(n-r)) | ||
> ans | > ans | ||
Line 777: | Line 780: | ||
n <-5 | n <-5 | ||
# combinations of 5,3 | # combinations of 5,3 | ||
- | c <- choose(5,3) | + | c <- choose(n,r) |
ans2 <- c*(p^r)*(q^(n-r)) | ans2 <- c*(p^r)*(q^(n-r)) | ||
ans2 | ans2 | ||
Line 787: | Line 790: | ||
> n <-5 | > n <-5 | ||
> # combinations of 5,3 | > # combinations of 5,3 | ||
- | > c <- choose(5,3) | + | > c <- choose(n,r) |
> ans2 <- c*(p^r)*(q^(n-r)) | > ans2 <- c*(p^r)*(q^(n-r)) | ||
> ans2 | > ans2 | ||
Line 973: | Line 976: | ||
\end{eqnarray*} | \end{eqnarray*} | ||
- | 왜 $e^{\lambda} = \left(1 + \lambda + \dfrac{\lambda^{2}}{2!} + \dfrac{\lambda^{3}}{3!} + . . . \right)$ 인지는 [[:Taylor series]] 문서를 참조. | + | 왜 $e^{\lambda} = \left(1 + \lambda + \dfrac{\lambda^{2}}{2!} + \dfrac{\lambda^{3}}{3!} + . . . \right)$ 인지는 [[:Taylor series]] 문서를 참조. |
+ | 이것이 의미하는 것은 r이 0에서 무한대로 갈 때의 확률값의 분포를 말하므로 전체 분포가 1이 됨을 의미한다. 아래 "What does the Poisson distribution look like?" 참조 | ||
< | < | ||
Line 984: | Line 988: | ||
위의 그림은 lambda는 2, 즉 한달에 아주대학교 앞의 건널목 주변 찻길에서 교통사고가 날 횟수가 2회라고 할 때, X=3 이므로 3번 교통사고가 일어날 확률을 (P(X=3)) 묻는 문제이다. | 위의 그림은 lambda는 2, 즉 한달에 아주대학교 앞의 건널목 주변 찻길에서 교통사고가 날 횟수가 2회라고 할 때, X=3 이므로 3번 교통사고가 일어날 확률을 (P(X=3)) 묻는 문제이다. | ||
\begin{eqnarray*} | \begin{eqnarray*} | ||
- | P(X = 3) & = & \frac {e^{-2} * 2^{3}}{3!} \\ | + | P(X = 3) & = & e^{-2} * \frac {2^{3}}{3!} \\ |
& = & 0.180 | & = & 0.180 | ||
\end{eqnarray*} | \end{eqnarray*} | ||
Line 1028: | Line 1032: | ||
[{{: | [{{: | ||
- | lambda가 클 수록 좌우대칭의 종형분포를 이루고 ((Figure 1)), 작을 수로 오른 쪽으로 편향된 (skewed to the right) 혹은 양의방향으로 편향된(positively skewed) 분포를 ((Figure 2)) 이룬다. | + | lambda가 클 수록 좌우대칭의 종형분포를 이루고 ((Figure 1)), 작을 수록 오른 쪽으로 편향된 (skewed to the right) 혹은 양의방향으로 편향된(positively skewed) 분포를 ((Figure 2)) 이룬다. |
< | < | ||
Line 1066: | Line 1070: | ||
\begin{eqnarray*} | \begin{eqnarray*} | ||
- | P(X=0) & = & \frac{e^{-3.4}*3.4^{0}} {0!} \\ | + | P(X=0) & = & e^{-3.4} * \frac{3.4^{0}} {0!} \\ |
& = & e^{-3.4} \\ | & = & e^{-3.4} \\ | ||
& = & 0.03337327 | & = & 0.03337327 | ||
Line 1072: | Line 1076: | ||
< | < | ||
+ | # R 에서 계산 | ||
> e^(-3.4) | > e^(-3.4) | ||
+ | [1] 0.03337327 | ||
+ | > | ||
+ | # 혹은 | ||
+ | > dpois(0, 3.4) | ||
[1] 0.03337327 | [1] 0.03337327 | ||
> | > | ||
</ | </ | ||
+ | |||
+ | 포아송 분포를 따르는 확률에서 아무것도 일어나지 않을 때의 확률은 e< | ||
+ | \begin{eqnarray*} | ||
+ | P(X=0) & = & e^{-5} * \frac{5^{0}} {0!} \\ | ||
+ | & = & e^{-5} \\ | ||
+ | & = & 0.006737947 | ||
+ | \end{eqnarray*} | ||
+ | < | ||
+ | > lamba <- 5 | ||
+ | > e <- exp(1) | ||
+ | > px.0 <- e^(-lamba) | ||
+ | > | ||
+ | > px.0 | ||
+ | [1] 0.006737947 | ||
+ | > | ||
+ | # or | ||
+ | > dpois(0,5) | ||
+ | [1] 0.006737947 | ||
+ | </ | ||
+ | |||
+ | |||
__2. What’s the probability of the machine malfunctioning three times next week?__ | __2. What’s the probability of the machine malfunctioning three times next week?__ | ||
Line 1160: | Line 1190: | ||
**How did Kate find the probability so quickly, and avoid the error on her calculator? | **How did Kate find the probability so quickly, and avoid the error on her calculator? | ||
</ | </ | ||
+ | 우선 위의 문제를 binomial distribution 문제로 생각하면 답은 | ||
+ | \begin{eqnarray*} | ||
+ | P(r=15) & = & _{100}C_{15} * 0.1^{15} * 0.99^{85}\\ | ||
+ | \end{eqnarray*} | ||
+ | 라고 볼 수 있다. | ||
\begin{eqnarray} | \begin{eqnarray} | ||
Line 1197: | Line 1232: | ||
b(100, 0.1)이므로 | b(100, 0.1)이므로 | ||
n*p = 10 = lambda | n*p = 10 = lambda | ||
- | 따라서 | + | 따라서 |
+ | lambda = 10 일때 P(r=15)값을 구하는 문제로 | ||
+ | |||
+ | \begin{eqnarray*} | ||
+ | P(r = 15) & = & e^{-10} * \frac {10^{15}}{15!} \\ | ||
+ | & = & 0.0347180 | ||
+ | \end{eqnarray*} | ||
< | < | ||
> dpois(x=15, lambda=10) | > dpois(x=15, lambda=10) | ||
Line 1317: | Line 1358: | ||
<WRAP box> | <WRAP box> | ||
- | 2. On average, 1 bus stops at a certain point every 15 minutes. What’s the probability that no buses will turn up in a single 15 minute interval? | + | 2. On average, 1 bus stops at a certain point every 15 minutes. What’s the probability that __<fc #ff0000>no buses</ |
위는 Poisson distribution 문제이므로 기대값과 분산값은 각각 lambda 값인 1 (15분마다 1대씩 버스가 온다고 한다) | 위는 Poisson distribution 문제이므로 기대값과 분산값은 각각 lambda 값인 1 (15분마다 1대씩 버스가 온다고 한다) |
b/head_first_statistics/geometric_binomial_and_poisson_distributions.1728427994.txt.gz · Last modified: 2024/10/09 07:53 by hkimscil