कुल विचरण का नियम

संभाव्यता सिद्धांत में, कुल विचरण का नियम या विचरण अपघटन सूत्र या नियम विचरण सूत्र या पुनरावृत्त प्रसरण के नियम को ईव के नियम के रूप में भी जाना जाता है, बताता है कि यादि $$X$$ और $$Y$$ एक ही प्रायिकता स्थान पर यादृच्छिक चर हैं, और तब $$Y$$ का प्रसरण परिमित है

$$ \operatorname{Var_Y}(Y) = \operatorname{E_X}[\operatorname{Var_Y}(Y \mid X)] + \operatorname{Var_X}(\operatorname{E_Y}[Y \mid X]). $$ संभाव्यता सिद्धांतकारों की तुलना में शायद सांख्यिकीविदों के लिए बेहतर ज्ञात भाषा में, दो शब्द क्रमशः अस्पष्टीकृत और विचरण के समझाए गए घटक हैं (cf. विचरण का अंश अस्पष्टीकृत, व्याख्यात्मक भिन्नता)। जिवानांकिकी में, विशेष रूप से विश्वसनीयता सिद्धांत, पहले घटक को प्रक्रिया विचरण (ईवीपीवी) का अपेक्षित मान कहा जाता है और दूसरे को काल्पनिक साधनों (वीएचएम) का विचरण कहा जाता है। ये दो घटक प्रारंभिक ईवी वीई से "प्रसरण की अपेक्षा" और "उम्मीद की भिन्नता" शब्द "ईव के नियम" का स्रोत भी हैं।

सूत्रीकरण
$$c \geq 2$$ घटकों के लिए एक सामान्य प्रसरण अपघटन सूत्र है (नीचे देखें) । उदाहरण के लिए दो अनुकूलन यादृच्छिक चर के साथ: $$\operatorname{Var}[Y] = \operatorname{E}\left[\operatorname{Var}\left(Y \mid X_1, X_2\right)\right] + \operatorname{E}[\operatorname{Var}(\operatorname{E}\left[Y \mid X_1, X_2\right] \mid X_1)] + \operatorname{Var}(\operatorname{E}\left[Y \mid X_1\right]),$$ जो कुल नियम भिन्नता के नियम से निम्नानुसार है: $$\operatorname{Var}(Y \mid X_1) = \operatorname{E} \left[\operatorname{Var}(Y \mid X_1, X_2) \mid X_1\right] + \operatorname{Var} \left(\operatorname{E}\left[Y \mid X_1, X_2 \right] \mid X_1\right).$$ ध्यान दें कि नियम अपेक्षित मान $$\operatorname{E}(Y \mid X)$$ अपने आप में एक यादृच्छिक चर है, जिसका मान $$X.$$ के मान पर निर्भर करता है ध्यान दें कि $$Y$$ नियम अपेक्षित मान देखते हुए $$X = x$$ का एक $$x$$ कार्य है (यह वह जगह है जहां संभाव्यता सिद्धांत के पारंपरिक और कठोर केस-संवेदी अंकन का पालन महत्वपूर्ण हो जाता है!)। यादि हम $$\operatorname{E}(Y \mid X = x) = g(x)$$ लिखते हैं फिर यादृच्छिक चर $$\operatorname{E}(Y \mid X)$$ बस $$g(X).$$ इसी तरह की टिप्पणियां नियम भिन्नता पर प्रयुक्त होती हैं।

एक विशेष स्थिति, (कुल अपेक्षा के नियम के समान) कहता है कि यदि $$A_1, \ldots, A_n$$ संपूर्ण परिणाम स्थान का एक विभाजन है, अर्थात, ये घटनाएँ परस्पर अनन्य और संपूर्ण हैं $$\begin{align} \operatorname{Var} (X) = {} & \sum_{i=1}^n \operatorname{Var}(X\mid A_i) \Pr(A_i) + \sum_{i=1}^n \operatorname{E}[X\mid A_i]^2 (1-\Pr(A_i))\Pr(A_i) \\[4pt] & {} - 2\sum_{i=2}^n \sum_{j=1}^{i-1} \operatorname{E}[X \mid A_i] \Pr(A_i)\operatorname{E}[X\mid A_j] \Pr(A_j). \end{align}$$ इस सूत्र में, पहला घटक नियम भिन्नता की अपेक्षा है; अन्य दो घटक नियम अपेक्षा के विचरण हैं।

प्रमाण
कुल अपेक्षा के नियम का उपयोग करके कुल भिन्नता का नियम सिद्ध किया जा सकता है। पहला, $$\operatorname{Var}[Y] = \operatorname{E}\left[Y^2\right] - \operatorname{E}[Y]^2$$ विचरण की परिभाषा से। फिर से, विचरण की परिभाषा से, और कुल अपेक्षा के नियम को प्रयुक्त करने से, हमारे पास है $$\operatorname{E}\left[Y^2\right] = \operatorname{E}\left[\operatorname{E}[Y^2\mid X]\right] = \operatorname{E} \left[\operatorname{Var}[Y \mid X] + [\operatorname{E}[Y \mid X]]^2\right].$$ अब हम $$Y$$ के नियम दूसरे क्षण को फिर से लिखते हैं इसके विचरण और पहले क्षण के संदर्भ में और दाहिनी ओर कुल अपेक्षा के नियम को प्रयुक्त करते हैं: $$\operatorname{E}\left[Y^2\right] - \operatorname{E}[Y]^2 = \operatorname{E} \left[\operatorname{Var}[Y \mid X] + [\operatorname{E}[Y \mid X]]^2\right] - [\operatorname{E} [\operatorname{E}[Y \mid X]]]^2.$$ चूंकि किसी राशि की अपेक्षा अपेक्षाओं का योग है, इसलिए नियमो को अब पुनर्समूहित किया जा सकता है: $$= \left(\operatorname{E} [\operatorname{Var}[Y \mid X]]\right) + \left(\operatorname{E} \left[\operatorname{E}[Y \mid X]^2\right] - [\operatorname{E} [\operatorname{E}[Y \mid X]]]^2\right).$$ अंत में, हम कोष्ठक के दूसरे समूह में नियमो को नियम अपेक्षा $$\operatorname{E}[Y \mid X]$$ के विचरण के रूप में पहचानते हैं ।: $$= \operatorname{E} [\operatorname{Var}[Y \mid X]] + \operatorname{Var} [\operatorname{E}[Y \mid X]].$$

गतिशील प्रणालियों पर प्रयुक्त सामान्य विचरण अपघटन
निम्नलिखित सूत्र दिखाता है कि प्रसंभाव्य गतिशील प्रणालियों के लिए सामान्य, माप सिद्धांतिक भिन्नता अपघटन सूत्र को कैसे प्रयुक्त किया जाए। मान लीजिए $$Y(t)$$ समय $$t.$$ पर प्रणाली चर का मान हो मान लीजिए कि हमारे पास आंतरिक इतिहास (प्राकृतिक निस्पंदन) है $$H_{1t},H_{2t},\ldots,H_{c-1,t}$$,है प्रत्येक प्रणाली चर के एक अलग संग्रह के इतिहास (प्रक्षेपवक्र) के अनुरूप है । संग्रहों को अलग करने की आवश्यकता नहीं है। $$Y(t)$$ के प्रसरण को हर समय $$t,$$ के लिए $$c \geq 2$$ घटकों में निम्नानुसार विघटित किया जा सकता है: $$\begin{align} \operatorname{Var}[Y(t)] = {} & \operatorname{E}(\operatorname{Var}[Y(t)\mid H_{1t},H_{2t},\ldots,H_{c-1,t}]) \\[4pt] & {} + \sum_{j=2}^{c-1}\operatorname{E}(\operatorname{Var}[\operatorname{E}[Y(t)\mid H_{1t},H_{2t},\ldots,H_{jt}] \mid H_{1t},H_{2t},\ldots,H_{j-1,t}]) \\[4pt] & {} + \operatorname{Var}(\operatorname{E}[Y(t)\mid H_{1t}]). \end{align}$$ अपघटन अद्वितीय नहीं है। यह अनुक्रमिक अपघटन में अनुकूलन के क्रम पर निर्भर करता है।

सहसंबंध का वर्ग और समझाया गया (या सूचनात्मक) भिन्नता
जिन स्थिति में $$(Y, X)$$ ऐसे हैं कि नियम अपेक्षित मान रैखिक है; अर्थात ऐसे स्थिति में है जहां $$\operatorname{E}(Y \mid X) = a X + b,$$ यह सहप्रसरण की द्विरेखीयता से अनुसरण करता है $$a={\operatorname{Cov}(Y, X) \over \operatorname{Var}(X)}$$ और $$b = \operatorname{E}(Y)-{\operatorname{Cov}(Y, X) \over \operatorname{Var}(X)} \operatorname{E}(X)$$ और कुल भिन्नता से विभाजित भिन्नता का समझाया गया घटक $$Y$$ और $$X;$$ के बीच के सहसंबंध का वर्ग है अर्थात ऐसे स्थिति में है $${\operatorname{Var}(\operatorname{E}(Y \mid X)) \over \operatorname{Var}(Y)} = \operatorname{Corr}(X, Y)^2.$$ इस स्थिति का एक उदाहरण है जब $$(X, Y)$$ द्विचर सामान्य (गाऊसी) वितरण है।

अधिक सामान्यतः, जब नियम अपेक्षा $$\operatorname{E}(Y \mid X)$$ $$X$$ का एक अरैखिक फलन है $$\iota_{Y\mid X} = {\operatorname{Var}(\operatorname{E}(Y \mid X)) \over \operatorname{Var}(Y)} = \operatorname{Corr}(\operatorname{E}(Y \mid X), Y)^2,$$ $$(X, Y).$$ के संयुक्त वितरण से निकाले गए डेटा का उपयोग करते हुए, जिसे $$X,$$पर $$Y$$ के एक गैर-रैखिक प्रतिगमन से आर वर्ग के रूप में अनुमानित किया जा सकता है।} जब $$\operatorname{E}(Y \mid X)$$ का गॉसियन वितरण है (और $$X$$ का एक व्युत्क्रमणीय कार्य है) या $$Y$$ का स्वयं एक (सीमांत) गॉसियन वितरण है, भिन्नता का यह समझाया गया घटक पारस्परिक जानकारी पर एक निचली सीमा निर्धारित करता है: $$\operatorname{I}(Y; X) \geq \ln \left([1 - \iota_{Y \mid X}]^{-1/2}\right).$$

उच्च क्षण
इसी प्रकार का नियम तीसरे केन्द्रीय क्षण के लिए $$\mu_3$$ कहते है $$\mu_3(Y)=\operatorname{E}\left(\mu_3(Y \mid X)\right) + \mu_3(\operatorname{E}(Y \mid X)) + 3\operatorname{cov}(\operatorname{E}(Y \mid X), \operatorname{var}(Y \mid X)).$$ उच्च संचयकों के लिए, एक सामान्यीकरण उपस्थित है। कुल संचयन का नियम देखें।

यह भी देखें

 * - एक सामान्यीकरण

संदर्भ

 * (Problem 34.10(b))
 * (Problem 34.10(b))