본문 바로가기

Computer Science/Probability in Computer Science

Expectation에 대하여

(Lecture 3 전반부)

확률을 표현하는 데 있어서 확률 질량 함수나 누적 분포 함수 보다도 더 짧은 표현이 필요할 때가 있습니다. 확률 변수를 표현하는 데 있어서 그런 용도로 사용하는 숫자가 바로 Expectation(기댓값), mean value입니다.

 

기댓값의 정의

 


 

전 게시글 Random Variables에 대하여 에서 언급한 확률 분포들의 기댓값에 대해 알아보겠습니다.

273k.tistory.com/17

 

Random Variables에 대하여

Random Variable 왜 정의하는가 많은 상황에서 임의의 실험의 결과는 숫자입니다. 그러나 여기에 또 다른 숫자를 각각의 결과에 할당해야하는 경우가 생깁니다. 따라서 확률 변수에 대해 정의하고,

273k.tistory.com

 

1. Discrete Uniform Probability Distribution(이산 균등 분포)

 

확률함수가 정의된 모든 곳에서 그 값이 일정한 분포입니다. 다만 유한한 상에서 정의되어야 하고, n개의 값을 가진다면 각각의 확률은 1/n으로 정의됩니다. 가장 대표적인 예는 주사위 던지기입니다.

Probability mass function

기댓값은 다음과 같이 주어집니다.

Expectation of X

 

2. Indicator Random Variable(지시 확률 변수)

지시함수란 특정 집합에 특정 값이 속하는 지를 표시하는 함수로, 특정 값이 속한다면 1 속하지 않는다면 0으로 정의하는 함수입니다. 기호로는 1이나 I를 쓰고, 아래첨자로는 1의 값을 갖게하는 특정 집합을 표기합니다.

Probability distribution
Distribution function

이는 베르누이 분포와 같으므로, 기댓값은 결국 P(A)와 같게 됩니다. (3번 참고)

Expectation of X

 

3. Bernoulli Probability Distribution(베르누이 확률 분포)

어떤 시행의 결과가 성공, 실패인 시행을 베르누이 시행이라고 합니다. 이때 시행이 성공이면 X=1, 실패하면 X=0입니다. 따라서 Bernoulli trial이나 biased coin toss 등과 같은 시행에서 갖는 확률 분포가 베르누이 확률 분포힙니다. 그 분포는 아래의 식으로 표현합니다.

기댓값은 다음과 같이 주어집니다.

Expectation of X

4. Constant Random Variable * 이전 게시글에는 없던 분포

어떤 실수 c에 대해 sample point가 sample space의 원소일 경우, X(s)=c로 정의되는 확률변수입니다.

확률 분포는 아래와 같이 정의되고,

기댓값은 다음과 같이 주어집니다.

Expectation of X

5. Geometric Probability Distribution(기하 확률 분포)

이산 확률 분포의 하나로, 다음 두가지 조건을 정의로 가집니다.

- 베르누이 시행에서 처음 성공까지 시도한 횟수 X의 분포. S={1,2,3 ... }

- 베르누이 시행에서 처음 성공까지 실패한 횟수 Y=X-1의 분포. S={0,1,2 ... }

그 확률은 아래의 식으로 계산합니다.

누적 분포함수는 아래와 같이 주어지고

* ⌊x⌋ 이 기호가 뭔지 궁금해서 검색해봤는데요,

출처 : 위키피디아 Floor_and_ceiling_functions

기댓값은 다음과 같이 주어집니다.

증명

6. Binomial Probability Distribution(이항 확률 분포)

어떤 독립시행들의 연속을 베르누이 시행이라고 하는데요. 이런 독립 시행을 n회 반복하였을 때 어떤 사건이 X회 일어날 확률에 대한 분포입니다. 즉 count n 과 probability p 두가지 parameter를 사용하여 B(n,p)로 표현합니다. 

따라서 기댓값은 아래와 같이 구할 수 있습니다.

증명