본문 바로가기

Computer Science/Probability in Computer Science

Chebyshev inequality에 대하여

(Lecture 4 후반부)

 

우리가 어떤 확률 변수의 기댓값과 분산을 안다고 할 때, 체비셰프 부등식을 사용해 보다 정확한 예측을 할 수 있습니다. 어떠한 양의 실수 t에 대해 정의는 다음과 같습니다.

 

간단한 증명 방법이 있는데, 이는 마르코프 부등식에서 출발합니다.

 

이전 게시글에 서술되어 있습니다.

여기에서 X를 (X-E(X))²로 바꾸고(음이 아닌 확률변수 조건을 만족), a를 t²으로 바꿉니다. 

E((X-E(X))²) = V(X)이고, (X-E(X))²≥t² 는 부등식의 변수 모두 음이 아니므로 |X-E(X)|≥t와 같은 표현이 됩니다.

 

 

간단한 예제를 풀어보겠습니다.

 

Example(Coin flipping revisited) Bound the probability of obtaining more than ¾n heads in a sequence of n fair coin flips.

 

마르코프 부등식에서 풀었던 예제 2번과 동일한 문제입니다.

동일하게 X1, X2, ..... , Xn 까지의 확률 변수를 정의합니다.

Xi는 i번째 동전이 head일 때 1이고, tail일 때 0으로 정의합니다.

또한 확률변수 Yn도 정의하는데, Yn = X1+X2+X3+ ... + Xn입니다.

 

E(Xi)=1/2, 확률변수 X들은 1과 0의 값만을 가지므로 E(Xi²)=1/2 입니다.

따라서 V(Xi) = ½-¼ = ¼

V(Yn) = V( X1+X2+X3+ ... + Xn) = nV(X) = n/4    = Xi들은 서로 독립이기 때문입니다.

 

이를 체르셰프 부등식에 대입하면,

P(Yn≥¾n) ≤ P(|Yn-E(Yn)|¼n)  

              ≤ V(Yn) / (n/4)²

              = 4/n

 

마르코프 부등식보다 정확한 예측을 제공합니다.