LOTUS

Tags:

LOTUS (Law of the unconscious statistician)


  • 확률변수 X의 PDF(또는 PMF)가 p(x)일 때, E[X]E[X]xp(x)dx\int xp(x)dx 또는 xp(x)\sum xp(x)로 구할 수 있을 것이다.

  • X의 PDF(또는 PMF)인 p(x)를 알고 있다면, X의 기댓값인 E[X]E[X]뿐만 아니라 X에 대한 함수 g(X)의 기댓값 E[g(X)]E[g(X)] 아래와 같이 계산할 수 있다는 것이 LOTUS이다.
    E[g(X)]=g(x)p(x)dxE[g(X)] = \int g(x)p(x)dx (X가 연속확률변수일 경우)

  • 식만 보면 당연히 대충 그럴 것 같은데(라고 2학년 1학기 확통 시간에 생각하고 넘겼다..), 대표적인 예시로 Var[X]=E[X2]{E[X]}2Var[X]=E[X^{2}]-\left\{ E[X] \right\} ^ {2} 를 구할 때 계산하는 E[X2]E[X^{2}]가 있다. (위 식에서 g(X)=X2g(X)=X^{2}인 상황)

    • r.v. X의 PDF가 p(x)p(x)라고 분포에 대해 알고있는 상황이라고 해도, E[X2]E[X^{2}]와 같은 X2X^{2}에 대한 정보를 알고자 하면 X2X^{2}의 분포를 알아야 한다. XXX2X^{2}는 다른 확률변수니까.
    • 그런데 XX의 분포에 대해서는 알고 있고, 추가로 알고자 하는 것이 그 XX 에 대한 함수의 기댓값에 대한 정보라면 그건 XX 의 분포 p(x)p(x)만 알고 있어도 구할 수 있다는 것이다.
    • E[X]=xp(x)dxE[X] = \int xp(x)dx임을 이용해 E[X2]=x2p(x)dxE[X^{2}] = \int x^{2}p(x)dx 라고 구할 수 있는 것은 LOTUS가 있기 때문.
    • 고등학교 확률과 통계를 공부할 때에도 아래와 같은 형식으로 이산확률변수에 대한 정보가 주어지면 직접 손으로 Var[X]=E[X2]{E[X]}2Var[X]=E[X^{2}]-\left\{ E[X] \right\} ^ {2}를 계산해 분산값을 구할 때도 있었는데.. (심지어 2학년 1학기 확률과 통계 시험에서도) 그 때는 배우지 않았지만 이 역시LOTUS.
    x1234P(X=x)18181412\begin{array}{|c|c|c|} \hline x & 1 & 2 & 3 & 4 \\ \hline P(X=x) & \frac{1}{8} & \frac{1}{8} & \frac{1}{4} & \frac{1}{2}\\ \hline \end{array}