กฎแห่งจำนวนมาก (2)
เมื่อเรามีอสมการของเชบิเชฟแล้ว เราสามารถพิสูจน์ กฎแห่งจำนวนมาก ได้ไม่ยากนัก
ก่อนอื่นเราต้องการหาค่าความแปรปรวนของผลรวมของตัวแปรสุ่มก่อน พิจารณาตัวแปรสุ่ม $X$ และ $Y$ เราจะใช้ความจริง (ที่อาจจะไปพิสูจน์กันในวันหลัง)
ความจริง 1 (Linearity of Expectation): $E[X+Y] = E[X] + E[Y]$
ความจริง 2 (ผลคูณของตัวแปรสุ่มที่ไม่ขึ้นต่อกัน): ถ้า $X$ และ $Y$ ไม่ขึ้นต่อกัน เราจะได้ว่า $E[X\cdot Y] = E[X]\cdot E[Y]$
สำหรับตัวแปรสุ่ม $X$ ใด ๆ ค่าความแปรปรวนมีนิยามเป็น $Var[X]=E[X^2]-E[X]^2$ ดังนั้น
$Var[X+Y]=E[(X+Y)^2] - E[X+Y]^2 $
$= E[X^2 + 2X\cdot Y+Y^2]-(E[X]+E[Y])^2$
$= E[X^2] + E[2X\cdot Y]+ E[Y^2]-E[X]^2-2E[X]E[Y] - E[Y]^2$ (ใช้ความจริง 1 ในการกระจาย)
จากความจริง 2: เราจะได้ว่า E[2X\cdot Y] = 2E[X\cdot Y] = 2E[X]E[Y] นั่นคือ
$Var[X+Y]=E[X^2] + E[Y^2] - E[X]^2 - E[Y]^2$
$= (E[X^2] - E[X]^2) + (E[Y^2] - E[Y]^2)$
$= Var[X] + Var[Y]$
นั่นคือ:
ความจริง 3: ถ้าตัวแปรสุ่ม $X$ และ $Y$ ไม่ขึ้่นต่อกัน $Var[X+Y] = Var[X] + Var[Y]$
ดังนั้น, ถ้า $X$ เป็นผลรวมของตัวแปรสุ่ม $X_1,X_2,\ldots,X_n$ ที่ไม่ขึ้นต่อกัน แต่ละตัวมีค่าคาดหวัง $\mu$ และมีความแปรปรวน $\sigma^2$ เราจะได้ว่า
$Var[X]=Var[\sum_{i=1}^n X_i] = n\sigma^2$
เรายังต้องการความจริงอีกข้อหนึ่ง
ความจริง 4: สำหรับค่าคงที่ $c$ ใดๆ $Var[cX] = c^2 Var[X]$
หมายเหตุ: อาจจะสงสัยว่า $Var[2X] = Var[X+X]$ น่าจะเท่ากับ $2Var[X]$ ตามความจริง 3 แต่จากข้างบนเราจะได้ว่า $Var[X+X] = Var[2X] = 4Var[X]$ นั่นเป็นเพราะ $X$ กับ $X$ นั้นไม่ใช่ตัวแปรสุ่มที่ไม่ขึ้นต่อกัน
บทพิสูจน์ (กฎแห่งจำนวนมากแบบอ่อน):
พิจารณา $X_n=(X_1+X_2+\cdots+X_n)//n$ จากความจริงข้างต้น เราทราบว่า $E[X_n] = (E[X_1]+E[X_2]+\cdots+E[X_n])//n = \mu$ และ $Var[X_n] = \frac{1}{n^2}Var[X_1+X_2+\cdots+X_n] = \frac{n}{n^2}\sigma^2 = \sigma^2/n$
เราต้องการหา
$Pr[|X_n-\mu|<\epsilon] =1-Pr[|X_n-\mu|\geq\epsilon]$ พิจารณา $Pr[|X_n-\mu|\geq\epsilon]$ ตามอสมการเชบิเชพ เราจะได้ว่า $Pr[|X_n-\mu|\geq\epsilon]\leq (\sigma^2//n)/epsilon^2 = \sigma^2/(n\cdot\epsilon^2)$ นั่นคือ $\lim_{n\rightarrow\infty}\Pr[|\bar{X}_n-\mu|<\epsilon] \geq 1-\sigma^2/(n\cdot\epsilon^2)=1$ ตามต้องการ
ก่อนอื่นเราต้องการหาค่าความแปรปรวนของผลรวมของตัวแปรสุ่มก่อน พิจารณาตัวแปรสุ่ม $X$ และ $Y$ เราจะใช้ความจริง (ที่อาจจะไปพิสูจน์กันในวันหลัง)
ความจริง 1 (Linearity of Expectation): $E[X+Y] = E[X] + E[Y]$
ความจริง 2 (ผลคูณของตัวแปรสุ่มที่ไม่ขึ้นต่อกัน): ถ้า $X$ และ $Y$ ไม่ขึ้นต่อกัน เราจะได้ว่า $E[X\cdot Y] = E[X]\cdot E[Y]$
สำหรับตัวแปรสุ่ม $X$ ใด ๆ ค่าความแปรปรวนมีนิยามเป็น $Var[X]=E[X^2]-E[X]^2$ ดังนั้น
$Var[X+Y]=E[(X+Y)^2] - E[X+Y]^2 $
$= E[X^2 + 2X\cdot Y+Y^2]-(E[X]+E[Y])^2$
$= E[X^2] + E[2X\cdot Y]+ E[Y^2]-E[X]^2-2E[X]E[Y] - E[Y]^2$ (ใช้ความจริง 1 ในการกระจาย)
จากความจริง 2: เราจะได้ว่า E[2X\cdot Y] = 2E[X\cdot Y] = 2E[X]E[Y] นั่นคือ
$Var[X+Y]=E[X^2] + E[Y^2] - E[X]^2 - E[Y]^2$
$= (E[X^2] - E[X]^2) + (E[Y^2] - E[Y]^2)$
$= Var[X] + Var[Y]$
นั่นคือ:
ความจริง 3: ถ้าตัวแปรสุ่ม $X$ และ $Y$ ไม่ขึ้่นต่อกัน $Var[X+Y] = Var[X] + Var[Y]$
ดังนั้น, ถ้า $X$ เป็นผลรวมของตัวแปรสุ่ม $X_1,X_2,\ldots,X_n$ ที่ไม่ขึ้นต่อกัน แต่ละตัวมีค่าคาดหวัง $\mu$ และมีความแปรปรวน $\sigma^2$ เราจะได้ว่า
$Var[X]=Var[\sum_{i=1}^n X_i] = n\sigma^2$
เรายังต้องการความจริงอีกข้อหนึ่ง
ความจริง 4: สำหรับค่าคงที่ $c$ ใดๆ $Var[cX] = c^2 Var[X]$
หมายเหตุ: อาจจะสงสัยว่า $Var[2X] = Var[X+X]$ น่าจะเท่ากับ $2Var[X]$ ตามความจริง 3 แต่จากข้างบนเราจะได้ว่า $Var[X+X] = Var[2X] = 4Var[X]$ นั่นเป็นเพราะ $X$ กับ $X$ นั้นไม่ใช่ตัวแปรสุ่มที่ไม่ขึ้นต่อกัน
บทพิสูจน์ (กฎแห่งจำนวนมากแบบอ่อน):
พิจารณา $X_n=(X_1+X_2+\cdots+X_n)//n$ จากความจริงข้างต้น เราทราบว่า $E[X_n] = (E[X_1]+E[X_2]+\cdots+E[X_n])//n = \mu$ และ $Var[X_n] = \frac{1}{n^2}Var[X_1+X_2+\cdots+X_n] = \frac{n}{n^2}\sigma^2 = \sigma^2/n$
เราต้องการหา
$Pr[|X_n-\mu|<\epsilon] =1-Pr[|X_n-\mu|\geq\epsilon]$ พิจารณา $Pr[|X_n-\mu|\geq\epsilon]$ ตามอสมการเชบิเชพ เราจะได้ว่า $Pr[|X_n-\mu|\geq\epsilon]\leq (\sigma^2//n)/epsilon^2 = \sigma^2/(n\cdot\epsilon^2)$ นั่นคือ $\lim_{n\rightarrow\infty}\Pr[|\bar{X}_n-\mu|<\epsilon] \geq 1-\sigma^2/(n\cdot\epsilon^2)=1$ ตามต้องการ
[X]
Comments