https://www.math.uchicago.edu/~lawler/inprogress
1.1 Conditional expectation
2023.10.15, 2024.02.03
Conditional Expectation은 이 책 전체를 Permeate하는 개념.
-
r.v. X의 expectation E[X] trial의 결과에 대한 정보가 없을 때 X에 대한 best guess라고 볼 수 있음
-
X,Y가 joint density f(x,y)를 가지고 marginal density f(x)=∫−∞∞f(x,y)dy일 때
Conditional density는 f(y∣x)=f(x)f(x,y)이다.
-
이를 이용해 Conditional Expectation은 E[Y∣X]=∫−∞∞y f(y∣X)dy=f(X)∫−∞∞y f(X,y)dy 인데 (5p)
E[Y∣X]도 X에 대한 확률변수이므로 X에 대한 기댓값을 구하면
E(E[Y∣X])=∫−∞∞E[Y∣X=x]f(x)dx=∫−∞∞[∫−∞∞y f(y∣x)dy]f(x)dx=∫−∞∞∫−∞∞y f(x,y)dydx=E[Y]
2학년 1학기 확률통계론에서 E[Y]=E[E[Y∣X]]라고 배웠던 그 내용.
책에서는 일반적인 expectation은 E로, conditional expectation은 E로 표기
즉 데이터 X1,X2,...,Xn 을 관찰하면 best prediction E[Y∣X1,X2,...,Xn]을 구할 수 있고,
그 best prediction을 all possible values X_1, X_2, ... , X_n에 대해 average하면 best prediction of Y를 구할 수 있다. (X1,X2,...,Xn 은 r.v.) 즉 E[Y]=E[E[Y∣Fn]]
-
이 책에서는 Conditional Expectation E[Y∣Fn] 을 다음을 만족하는 r.v. 라고 정의한다.
- E[Y∣Fn] is Fn-measurable
- For every Fn-measurable event A, E[E[Y∣ Fn]1A]=E[Y1A]
-
이는 다음과 같은 property들을 가진다.
- measurable이면 상수처럼 작용
- If Y is Fn-measurable , then E[Y∣Fn]=Y
- 반대로 E[Y∣F0]=E[Y]∵F0 means no information
- If Z is Fn-measurable r.v., then E[YZ∣Fn]=Z⋅E[Y∣Fn]
- Independence, Linearity, Tower Property (7p)
-
Example 1.1.1 ~ 1.1.3
-
Filtration Fn 의 정의에서 비현실적일 수 있는 부분은 시간이 지나도 정보를 잃지(lost) 않는다고 보는 점 (9p)
1.2 Martingales
2024.02.03
A model of a fair game.
여기서 말하는 'fair'는 흡사 미시경제 choice under uncertainty에서 배우는 '공정'한 보험, '공정'한 도박처럼 기댓값이 0인 경우를 의미하는 것으로 보임.
-
A sequence of r.v. M0,M1,... 은 다음 조건을 만족할 때 martingale w.r.t. the Fn 라고 한다.
- n에 대해 Mn 은 Fn-measurable r.v.이고 E[∣Mn∣]<∞ 이다.
- If m<n, then E[Mn∣Fm]=Mm. 또는 E[Mn−Mm∣Fm]=0
- ∀n,E[Mn+1∣Fn]=Mn 에 conditional expectation의 tower property를 적용하면 m<n 에 대해서도 모두 적용 가능. E[Mn+2∣Fn]=Mn 처럼 (10p)
Example 1.2.1.
위 example에서 이어짐. independent한 X1,X2,... 에 대해 E[Xj]=0이고 Sn=X1+...+Xn 이면 E[Sn∣Fm]=Sm 이 성립. 이는 Sn 이 martingale w.r.t. Fn 이라는 뜻
Example 1.2.3. Discrete stochastic integral
Mj는 대상 자산의 가격, Bj는 베팅금(음수는 숏), Wn이 winnigs라 하고 Wn=∑j=1nBj[Mj−Mj−1]=∑j=1nBjΔMj 라 하면 Wn 은 martingale w.r.t. Fn 이다.
Example 1.2.4. Martingale betting strategy
유명한 베팅금을 두 배씩 올리는 전략을 모델링함.
B1=1,Bj=2j−1 이라 하면 Wn=∑j=1nBjΔMj=∑j=1nBjXj
n 번의 게임을 다 질 확률이 2n1 인데, 무한히 시도해서 이길 확률을 1로 만들면 W∞=limn→∞Wn=1 이 되고
1=E[W∞]>E[W0]=0 이 된다.
-
Example 1.2.3과 1.2.4의 차이가 말하는 것은, finite time 내에는 martingale을 이길 수(beat) 없다는 것이다.
-
위와 같이 E[Mn∣Fm]≥Mm 이면 Submartingale. (14p)
sub, super라는 네이밍은 harmonic function과 맞춘 것
1.3 Optional sampling theorem
2024.02.03
Optional sampling theorem 또는 Optional stopping theorem은 Discrete stochastic integral의 special case로
특정 stopping time에서의 martingale의 기댓값은 initial expected value와 같음을 의미.^fn1
다시 한 번, 유한한 시간 내에서는 martingale을 이길 수 없다는 의미
Theorem 1.3.1. Optional Sampling Theorem I
- stoppin time T 와 martingale w.r.t. Fn 인 Mn 에 대해
for each n,E[Mn∧T]=E[M0] where n∧T=min{n,T}
skip
1.4 Martingale convergence theorem
2024.02.03
Theorem 1.4.1. Martingale Convergence Theorem
- martingale w.r.t. Fn 인 Mn 에 대해 E[∣Mn∣]≤C∀n 인 C<∞ 이 존재하면, limn→∞Mn=M∞ 인 r.v. M∞이 존재한다.
- example 1.2.4에서 1=E[W∞]>E[W0]=0 이었던 것럼, E[M∞]=E[M0] 를 따르지 않는다.
- 증명 생략 (19~21p)
Polya's urn
- time n=0 에는 빨간 공과 초록 공이 1개씩 있고, 매번 하나를 꺼내서 색을 본 후 같은 색의 공 2개를 다시 넣음. 각 색의 공의 개수는 Rn,Gn 이라 하면 Rn+Gn=n+2 성립
- 어느 순서에서 어느 색의 공을 뽑았는지와 관련이 없으니 Markov Property도 있음
- Mn=Rn+GnRn 이라 하면 Mn 은 martingale w.r.t. Fn 이면서 martingale convergence theorem도 만족함.
- 이와 유사한 Bayesian statistics 예시: Bern(θ) 를 따르는 시행의 결과만 보고 θ 값을 근사하기 (θ 의 확률로 성공)
- θ 를 어떤 prior distribution을 따르는 r.v.로 가정. 처음에는 prior distributino이 Uniform(0,1)이라 가정
- 관찰을 통해 어떤 posterior distribution를 업데이트 해나감.
- n 번의 시도 후 총 성공 횟수를 Sn=k 라 하면, posterior의 conditional expectation E[θ∣Sn=k]=n+2Sn+1 로 polya's urn에서의 martingale과 같은 형태가 됨. (Sn+1이 빨간 공의 개수라고 본다면)
- 그렇다면 martingale convergence theorem을 이용해 law of large number를 통해 θ 를 근사하는 것으로 볼 수 있음.
1.5 Square integrable martingales
2024.02.03
E[Mn2]<∞ for each n 이면 martingale Mn 은 square integrable이라 한다.
- r.v. X,Y 가 E[XY]=E[X]E[Y] 이면 orthogonal하다고 함. (1)
- r.v.들이 independent이면 orthogonal이지만, orthogonal이라고 항상 independent하지는 않음.
- 또한 r.v. X1,...,Xn 이 모두 mean zero이며 pairwise orthgonal하면, E[XjXk]=0forj=k 이고 E[(X1,...,Xn)2]=∑j=1nE[Xj]2 이 성립한다. (2)
Proposition 1.5.1
Martingale의 increment가 항상 independent하지는 않지만, sqaure integrable mantingale의 increment는 항상 orthogonal하다. (25p)
- Square integrable martingale Mn w.r.t. the Fn 에 대해, for m<n,E[(Mn+1−Mn)(Mm+1−Mm)]=0
위의 (1)에 따라 martingale의 increments는 orthogonal함
- ∀n,E[Mn2]=E[M02]+∑j=1nE[(Mj−Mj−1)2]
위의 (2)
증명 생략
1.6 Integrable with respect to random walk
2024.02.03
mean zero, variance σ2 의 i.i.d.인 r.v. X1,X2,... 에 대해 Sn=X1+...+Xn,Fn=filtration generated by X1,...,Xn 이라 하자.
Fn−1-measurable 인 Jn 에 대해 integral of Jn w.r.t. Sn 은 다음과 같이 정의된다.
Zn=∑j=1nJjXj=∑j=1nJjΔSj
그리고 이 integral 만족하는 다음의 세 가지 중요한 property들은:
- Martingale Property: Zn 은 martingale w.r.t. Fn 이다. (Section 1.2 참고)
- Linearity: ∑j=1(aJj+bKj)ΔSj=a∑j=1JjΔSj+b∑j=1KjΔSj
- Variance rule: Var[∑j=1nJjΔSj]=E[(∑j=1nJjΔSj)2]=σ2∑j=1nJj2
1.7 A maximal inequality
2024.02.03
Theorem 1.7.1.
Yn 이 nonnegative submartingale w.r.t. Fn 이고 Y=max{Y0,Y1,...,Yn} 이면 다음이 성립한다.
∀a>0, P{Yn≥a}≤a−1E[Yn]
형태는 Markov Inequality와 유사한 모습. P(X≥a)≤a−1E[X]
증명 생략
Corollary 1.7.2.
Mn 이 square integrable martingale w.r.t. Fn 이고 M=max{∣Y0∣,∣Y1∣,...,∣Yn∣} 이면 다음이 성립한다.
∀a>0, P{Mn≥a}≤a−2E[Mn2]
E[Mn2]<∞ for each n 이면 martingale Mn 은 square integrable이라 한다.
1.8 Exercises
(Skip)
References