सहप्रसरण



संभाव्यता सिद्धांत और सांख्यिकी में सहप्रसरण दो यादृच्छिक चरों की संयुक्त परिवर्तनशीलता का एक उपाय है। यदि एक चर के बड़े मान मुख्य रूप से दूसरे चर के बड़े मूल्यों के अनुरूप होते हैं, और वही कम मानों के लिए होता है (अर्थात, चर समान व्यवहार दिखाते हैं), सहप्रसरण सकारात्मक है। विपरीत स्थिति में, जब एक चर के अधिक मूल्य मुख्य रूप से दूसरे के कम मूल्यों के अनुरूप होते हैं, (अर्थात, चर विपरीत व्यवहार दिखाते हैं), सहप्रसरण ऋणात्मक होता है। सहप्रसरण का चिन्ह, इसलिए, चरों के बीच रैखिक संबंध में प्रवृत्ति को दर्शाता है। सहप्रसरण का परिमाण उन प्रसरणों का ज्यामितीय माध्य है जो दो यादृच्छिक चरों के लिए सामान्य हैं। पियर्सन गुणनफल-आघूर्ण सहसंबंध गुणांक दो यादृच्छिक चरों के लिए कुल प्रसरणों के ज्यामितीय माध्य से विभाजित करके सहप्रसरण को सामान्य करता है।

(1) दो यादृच्छिक चर के सहप्रसरण के बीच एक अंतर किया जाना चाहिए, जो एक सांख्यिकीय जनसंख्या सांख्यिकीय पैरामीटर है जिसे संयुक्त संभाव्यता वितरण की संपत्ति के रूप में देखा जा सकता है, और (2) नमूना (सांख्यिकी) सहप्रसरण, जो इसके अतिरिक्त नमूने के वर्णनकर्ता के रूप में सेवा करने के लिए, जनसंख्या पैरामीटर के सांख्यिकीय अनुमान मान के रूप में भी कार्य करता है।

परिभाषा
दो संयुक्त वितरण के लिए वास्तविक संख्या-मूल्यवान यादृच्छिक चर $$X$$ और $$Y$$ परिमित दूसरे क्षणों के साथ, सहप्रसरण को उनके व्यक्तिगत अपेक्षित मूल्यों से उनके विचलन के उत्पाद के अपेक्षित मूल्य (या माध्य) के रूप में परिभाषित किया गया है:

$$\operatorname{cov}(X, Y) = \operatorname{E}{\big[(X - \operatorname{E}[X])(Y - \operatorname{E}[Y])\big]}$$ कहाँ $$\operatorname{E}[X]$$ का अपेक्षित मूल्य है $$X$$, के माध्य के रूप में भी जाना जाता है $$X$$. सहप्रसरण को भी कभी-कभी निरूपित किया जाता है $$\sigma_{XY}$$ या $$\sigma(X,Y)$$, विचरण के अनुरूप। अपेक्षाओं की रैखिकता संपत्ति का उपयोग करके, यह उनके उत्पाद के अपेक्षित मूल्य घटाकर उनके अपेक्षित मूल्यों के उत्पाद को सरल बनाया जा सकता है:

\begin{align} \operatorname{cov}(X, Y) &= \operatorname{E}\left[\left(X - \operatorname{E}\left[X\right]\right) \left(Y - \operatorname{E}\left[Y\right]\right)\right] \\ &= \operatorname{E}\left[X Y - X \operatorname{E}\left[Y\right] - \operatorname{E}\left[X\right] Y + \operatorname{E}\left[X\right] \operatorname{E}\left[Y\right]\right] \\ &= \operatorname{E}\left[X Y\right] - \operatorname{E}\left[X\right] \operatorname{E}\left[Y\right] - \operatorname{E}\left[X\right] \operatorname{E}\left[Y\right] + \operatorname{E}\left[X\right] \operatorname{E}\left[Y\right] \\ &= \operatorname{E}\left[X Y\right] - \operatorname{E}\left[X\right] \operatorname{E}\left[Y\right], \end{align} $$ लेकिन यह समीकरण विनाशकारी रद्दीकरण के लिए अतिसंवेदनशील है (नीचे सहप्रसरण#संख्यात्मक संगणना पर अनुभाग देखें)।

सहप्रसरण की माप की इकाई $$\operatorname{cov}(X, Y)$$ के हैं $$X$$ के समय $$Y$$. इसके विपरीत, सहसंबंध, जो सहप्रसरण पर निर्भर करता है, रैखिक निर्भरता का एक आयाम रहित संख्या माप है। (वास्तव में, सहसंबंध गुणांक सहप्रसरण के सामान्यीकृत संस्करण के रूप में समझा जा सकता है।)

जटिल यादृच्छिक चर के लिए परिभाषा
दो जटिल यादृच्छिक चर के बीच सहप्रसरण $$Z, W$$ परिभाषित किया जाता है


 * $$\operatorname{cov}(Z, W) =

\operatorname{E}\left[(Z - \operatorname{E}[Z])\overline{(W - \operatorname{E}[W])}\right] = \operatorname{E}\left[Z\overline{W}\right] - \operatorname{E}[Z]\operatorname{E}\left[\overline{W}\right] $$ परिभाषा में दूसरे कारक के जटिल संयुग्मन पर ध्यान दें।

एक संबंधित छद्म सहप्रसरण को भी परिभाषित किया जा सकता है।

असतत यादृच्छिक चर
यदि (वास्तविक) यादृच्छिक चर जोड़ी $$(X,Y)$$ मान ग्रहण कर सकते हैं $$(x_i,y_i)$$ के लिए $$i=1,\ldots,n$$, समान संभावनाओं के साथ $$p_i=1/n$$, तो साधन के संदर्भ में सहप्रसरण को समान रूप से लिखा जा सकता है $$\operatorname{E}[X]$$ और $$\operatorname{E}[Y]$$ जैसा


 * $$\operatorname{cov} (X,Y)=\frac{1}{n}\sum_{i=1}^n (x_i-E(X))(y_i-E(Y)).$$

यह सीधे तौर पर साधनों का जिक्र किए बिना समान रूप से व्यक्त किया जा सकता है
 * $$ \operatorname{cov}(X,Y) = \frac{1}{n^2} \sum_{i=1}^n \sum_{j=1}^n \frac{1}{2}(x_i - x_j)(y_i - y_j) = \frac{1}{n^2} \sum_i \sum_{j>i} (x_i-x_j)(y_i - y_j). $$

अधिक आम तौर पर, अगर वहाँ हैं $$n$$ की संभावित प्राप्ति $$(X,Y)$$, अर्थात् $$(x_i,y_i)$$ लेकिन संभवतः असमान संभावनाओं के साथ $$p_i$$ के लिए $$i=1,\ldots,n$$, तो सहप्रसरण है


 * $$\operatorname{cov} (X,Y)=\sum_{i=1}^n p_i (x_i-E(X)) (y_i-E(Y)).$$

उदाहरण
3 स्वतंत्र यादृच्छिक चर पर विचार करें $$A, B, C$$ और दो स्थिरांक $$q, r$$.

\begin{align} X &= qA + B \\ Y &= rA + C \\ \operatorname{cov}(X, Y) &= qr \operatorname{var}(A) \end{align} $$ विशेष मामले में, $$q=1$$ और $$r=1$$, के बीच सहप्रसरण $$X$$ और $$Y$$, केवल का विचरण है $$A$$ और सहप्रसरण नाम पूरी तरह उपयुक्त है।

लगता है कि $$X$$ और $$Y$$ निम्नलिखित संयुक्त संभाव्यता वितरण है, जिसमें छह केंद्रीय कोशिकाएं असतत संयुक्त संभावनाएं देती हैं $$f(x, y)$$ छह काल्पनिक अहसासों में से $$(x, y) \in S = \left\{ (5, 8), (6, 8), (7, 8), (5, 9), (6, 9), (7, 9) \right\}$$: $$X$$ जबकि तीन मान (5, 6 और 7) ले सकते हैं $$Y$$ दो (8 और 9) ले सकते हैं। उनके साधन हैं $$\mu_X = 5(0.3) + 6(0.4) + 7(0.1 + 0.2) = 6$$ और $$\mu_Y = 8(0.4 + 0.1) + 9(0.3 + 0.2) = 8.5$$. तब,


 * $$\begin{align}

\operatorname{cov}(X, Y)   ={} &\sigma_{XY} = \sum_{(x,y)\in S}f(x, y) \left(x - \mu_X\right)\left(y - \mu_Y\right) \\[4pt] ={} &(0)(5 - 6)(8 - 8.5) + (0.4)(6 - 6)(8 - 8.5) + (0.1)(7 - 6)(8 - 8.5) +{} \\[4pt] &(0.3)(5 - 6)(9 - 8.5) + (0)(6 - 6)(9 - 8.5) + (0.2)(7 - 6)(9 - 8.5) \\[4pt] ={} &{-0.1} \; . \end{align}$$

स्वयं के साथ सहप्रसरण
विचरण सहप्रसरण का एक विशेष मामला है जिसमें दो चर समान होते हैं (अर्थात, जिसमें एक चर हमेशा दूसरे के समान मान लेता है):
 * $$\operatorname{cov}(X, X) =\operatorname{var}(X)\equiv\sigma^2(X)\equiv\sigma_X^2.$$

रैखिक संयोजनों का सहप्रसरण
अगर $$X$$, $$Y$$, $$W$$, और $$V$$ वास्तविक-मूल्यवान यादृच्छिक चर हैं और $$a,b,c,d$$ वास्तविक-मूल्यवान स्थिरांक हैं, तो निम्नलिखित तथ्य सहप्रसरण की परिभाषा के परिणाम हैं:

\begin{align} \operatorname{cov}(X, a) &= 0 \\ \operatorname{cov}(X, X) &= \operatorname{var}(X) \\ \operatorname{cov}(X, Y) &= \operatorname{cov}(Y, X) \\ \operatorname{cov}(aX, bY) &= ab\, \operatorname{cov}(X, Y) \\ \operatorname{cov}(X+a, Y+b) &= \operatorname{cov}(X, Y) \\ \operatorname{cov}(aX+bY, cW+dV) &= ac\,\operatorname{cov}(X,W)+ad\,\operatorname{cov}(X,V)+bc\,\operatorname{cov}(Y,W)+bd\,\operatorname{cov}(Y,V) \end{align} $$ एक क्रम के लिए $$X_1,\ldots,X_n$$ वास्तविक-मूल्यवान और स्थिरांक में यादृच्छिक चर $$a_1,\ldots,a_n$$, अपने पास


 * $$\operatorname{var}\left(\sum_{i=1}^n a_iX_i \right) = \sum_{i=1}^n a_i^2\sigma^2(X_i) + 2\sum_{i,j\,:\,i<j} a_ia_j\operatorname{cov}(X_i,X_j) = \sum_{i,j} {a_ia_j\operatorname{cov}(X_i,X_j)}

$$

हॉफडिंग की सहप्रसरण पहचान
दो यादृच्छिक चर के बीच सहप्रसरण की गणना करने के लिए एक उपयोगी पहचान $$X, Y $$ होफ़डिंग की सहप्रसरण पहचान है:
 * $$\operatorname{cov}(X, Y) = \int_\mathbb R \int_\mathbb R \left(F_{(X, Y)}(x, y) - F_X(x)F_Y(y)\right) \,dx \,dy$$

कहाँ $$ F_{(X,Y)}(x,y) $$ यादृच्छिक सदिश का संयुक्त संचयी बंटन फलन है $$ (X, Y) $$ और $$ F_X(x), F_Y(y) $$ सीमांत वितरण हैं।

असंबद्धता और स्वतंत्रता
यादृच्छिक चर जिनका सहप्रसरण शून्य है, असंबद्ध कहलाते हैं। इसी प्रकार, यादृच्छिक सदिशों के घटक जिनका सहप्रसरण मैट्रिक्स मुख्य विकर्ण के बाहर प्रत्येक प्रविष्टि में शून्य है, असंबद्ध भी कहलाते हैं।

अगर $$X$$ और $$Y$$ सांख्यिकीय स्वतंत्रता हैं, तो उनका सहप्रसरण शून्य है। यह इस प्रकार है क्योंकि स्वतंत्रता के तहत,


 * $$\operatorname{E}[XY]=\operatorname{E}[X] \cdot \operatorname{E}[Y]. $$

हालाँकि, आम तौर पर इसका विलोम सत्य नहीं है। उदाहरण के लिए, चलो $$X$$ में समान रूप से वितरित हो $$[-1,1]$$ और जाने $$Y=X^2$$. स्पष्ट रूप से, $$X$$ और $$Y$$ स्वतंत्र नहीं हैं, लेकिन
 * $$\begin{align}

\operatorname{cov}(X, Y) &= \operatorname{cov}\left(X, X^2\right) \\ &= \operatorname{E}\left[X \cdot X^2\right] - \operatorname{E}[X] \cdot \operatorname{E}\left[X^2\right] \\ &= \operatorname{E}\left[X^3\right] - \operatorname{E}[X]\operatorname{E}\left[X^2\right] \\ &= 0 - 0 \cdot \operatorname{E}[X^2] \\ &= 0. \end{align}$$ इस मामले में, के बीच संबंध $$Y$$ और $$X$$ गैर-रैखिक है, जबकि सहसंबंध और सहप्रसरण दो यादृच्छिक चर के बीच रैखिक निर्भरता के उपाय हैं। इस उदाहरण से पता चलता है कि यदि दो यादृच्छिक चर असंबंधित हैं, तो इसका मतलब यह नहीं है कि वे स्वतंत्र हैं। हालाँकि, यदि दो चर बहुभिन्नरूपी सामान्य वितरण हैं (लेकिन यदि वे केवल सामान्य रूप से वितरित नहीं हैं और असंबद्ध स्वतंत्र नहीं हैं), तो असंबद्धता का अर्थ स्वतंत्रता है।

आंतरिक उत्पादों से संबंध
सहप्रसरण के कई गुणों को यह देखकर सुरुचिपूर्ण ढंग से निकाला जा सकता है कि यह एक आंतरिक उत्पाद के समान गुणों को संतुष्ट करता है:
 * 1) बिलिनियर ऑपरेटर: स्थिरांक के लिए $$a$$ और $$b$$ और यादृच्छिक चर $$X,Y,Z,$$ $$ \operatorname{cov}(aX+bY,Z) = a \operatorname{cov}(X,Z) + b \operatorname{cov}(Y,Z)$$
 * 2) सममित: $$\operatorname{cov}(X,Y) = \operatorname{cov}(Y,X)$$
 * 3) निश्चित द्विरेखीय रूप|सकारात्मक अर्ध-निश्चित: $$\sigma^2(X) = \operatorname{cov}(X,X) \ge 0$$ सभी यादृच्छिक चर के लिए $$X$$, और $$\operatorname{cov}(X,X) = 0$$ इसका आशय है $$X$$ स्थिर लगभग निश्चित है।

वास्तव में इन गुणों का अर्थ है कि सहप्रसरण भागफल स्थान (रैखिक बीजगणित) पर एक आंतरिक उत्पाद को परिमित दूसरे क्षण के साथ यादृच्छिक चर के उप-स्थान को ले कर प्राप्त करता है और किसी भी दो की पहचान करता है जो एक स्थिरांक से भिन्न होता है। (यह पहचान सकारात्मक अर्ध-निश्चितता को सकारात्मक निश्चितता में बदल देती है।) वह भागफल सदिश स्थान परिमित दूसरे क्षण और शून्य के साथ यादृच्छिक चर के उप-स्थान के लिए आइसोमोर्फिक है; उस उप-स्थान पर, सहप्रसरण ठीक Lp स्थान है | L2 नमूना स्थान पर वास्तविक-मूल्यवान कार्यों का आंतरिक उत्पाद।

नतीजतन, परिमित भिन्नता वाले यादृच्छिक चर के लिए, असमानता


 * $$|\operatorname{cov}(X, Y)| \le \sqrt{\sigma^2(X) \sigma^2(Y)} $$

कॉची-श्वार्ज़ असमानता के माध्यम से है।

सबूत: अगर $$\sigma^2(Y) = 0$$, तो यह तुच्छ रूप से धारण करता है। अन्यथा, यादृच्छिक चर दें


 * $$ Z = X - \frac{\operatorname{cov}(X, Y)}{\sigma^2(Y)} Y.$$

तो हमारे पास हैं


 * $$\begin{align}

0 \le \sigma^2(Z) &= \operatorname{cov}\left(        X - \frac{\operatorname{cov}(X, Y)}{\sigma^2(Y)} Y,\;         X - \frac{\operatorname{cov}(X, Y)}{\sigma^2(Y)} Y       \right) \\[12pt] &= \sigma^2(X) - \frac{(\operatorname{cov}(X, Y))^2}{\sigma^2(Y)}. \end{align}$$

नमूना सहप्रसरण की गणना
बीच में नमूना सहप्रसरण $$K$$ पर आधारित चर $$N$$ अन्यथा अप्राप्य आबादी से खींची गई प्रत्येक की टिप्पणियां, द्वारा दी जाती हैं $$K \times K$$ मैट्रिक्स (गणित) $$\textstyle \overline{\mathbf{q}} = \left[q_{jk}\right]$$ प्रविष्टियों के साथ


 * $$q_{jk} = \frac{1}{N - 1}\sum_{i=1}^N \left(X_{ij} - \bar{X}_j\right) \left(X_{ik} - \bar{X}_k\right),$$

जो चर के बीच सहप्रसरण का एक अनुमान है $$j$$ और चर $$k$$.

नमूना माध्य और नमूना सहप्रसरण मैट्रिक्स माध्य के एक अनुमानक और यादृच्छिक सदिश के सहप्रसरण मैट्रिक्स के पूर्वाग्रह हैं $$\textstyle \mathbf{X}$$, एक सदिश जिसका jवाँ तत्व $$(j = 1,\, \ldots,\, K)$$ यादृच्छिक चरों में से एक है। नमूना सहप्रसरण मैट्रिक्स का कारण है $$\textstyle N-1$$ के बजाय भाजक में $$\textstyle N$$ अनिवार्य रूप से जनसंख्या का मतलब है $$\operatorname{E}(\mathbf{X})$$ ज्ञात नहीं है और इसे नमूना माध्य से बदल दिया गया है $$\mathbf{\bar{X}}$$. अगर जनसंख्या का मतलब है $$\operatorname{E}(\mathbf{X})$$ ज्ञात है, अनुरूप निष्पक्ष अनुमान द्वारा दिया गया है


 * $$ q_{jk} = \frac{1}{N} \sum_{i=1}^N \left(X_{ij} - \operatorname{E}\left(X_j\right)\right) \left(X_{ik} - \operatorname{E}\left(X_k\right)\right)$$.

वास्तविक यादृच्छिक वैक्टर
के ऑटो-सहप्रसरण मैट्रिक्स

एक वेक्टर के लिए $$\mathbf{X} = \begin{bmatrix}X_1 & X_2 & \dots & X_m\end{bmatrix}^\mathrm{T}$$ का $$m$$ परिमित दूसरे क्षणों के साथ संयुक्त रूप से वितरित रैंडम चर, इसका ऑटो-कोवैरियंस मैट्रिक्स (जिसे वैरियंस-कॉवैरियंस मैट्रिक्स या बस कोवैरियंस मैट्रिक्स के रूप में भी जाना जाता है) $$\operatorname{K}_{\mathbf{X}\mathbf{X}}$$ (द्वारा भी दर्शाया गया है $$\Sigma(\mathbf{X})$$ या $$\operatorname{cov}(\mathbf{X}, \mathbf{X})$$) परिभाषित किया जाता है


 * $$\begin{align}

\operatorname{K}_\mathbf{XX} = \operatorname{cov}(\mathbf{X}, \mathbf{X}) &= \operatorname{E}\left[(\mathbf{X} - \operatorname{E}[\mathbf{X}]) (\mathbf{X} - \operatorname{E}[\mathbf{X}])^\mathrm{T}\right] \\ &= \operatorname{E}\left[\mathbf{XX}^\mathrm{T}\right] - \operatorname{E}[\mathbf{X}]\operatorname{E}[\mathbf{X}]^\mathrm{T}. \end{align}$$ होने देना $$\mathbf{X}$$ सहप्रसरण मैट्रिक्स के साथ एक यादृच्छिक वेक्टर बनें $Σ$, और जाने $A$ एक मैट्रिक्स बनें जो कार्य कर सके $$\mathbf{X}$$ बाईं तरफ। मैट्रिक्स-वेक्टर उत्पाद का सहप्रसरण मैट्रिक्स $A X$ है:
 * $$\begin{align}

\operatorname{cov}(\mathbf{AX},\mathbf{AX}) &= \operatorname{E}\left[\mathbf{AX(A}\mathbf{X)}^\mathrm{T}\right] - \operatorname{E}[\mathbf{AX}] \operatorname{E}\left[(\mathbf{A}\mathbf{X})^\mathrm{T}\right] \\ &= \operatorname{E}\left[\mathbf{AXX}^\mathrm{T}\mathbf{A}^\mathrm{T}\right] - \operatorname{E}[\mathbf{AX}] \operatorname{E}\left[\mathbf{X}^\mathrm{T}\mathbf{A}^\mathrm{T}\right] \\ &= \mathbf{A}\operatorname{E}\left[\mathbf{XX}^\mathrm{T}\right]\mathbf{A}^\mathrm{T} - \mathbf{A}\operatorname{E}[\mathbf{X}] \operatorname{E}\left[\mathbf{X}^\mathrm{T}\right]\mathbf{A}^\mathrm{T} \\ &= \mathbf{A}\left(\operatorname{E}\left[\mathbf{XX}^\mathrm{T}\right] - \operatorname{E}[\mathbf{X}] \operatorname{E}\left[\mathbf{X}^\mathrm{T}\right]\right)\mathbf{A}^\mathrm{T} \\ &= \mathbf{A}\Sigma\mathbf{A}^\mathrm{T}. \end{align}$$ यह अपेक्षित मूल्य की रैखिकता का प्रत्यक्ष परिणाम है और उपयोगी है एक रैखिक परिवर्तन लागू करते समय, जैसे एक सफ़ेद परिवर्तन, एक सदिश के लिए।

वास्तविक यादृच्छिक सदिशों का क्रॉस-सहप्रसरण मैट्रिक्स
वास्तविक यादृच्छिक वैक्टर के लिए $$\mathbf{X} \in \mathbb{R}^m$$ और $$\mathbf{Y} \in \mathbb{R}^n$$, द $$m \times n$$ क्रॉस-कोवैरियंस मैट्रिक्स बराबर है

कहाँ $$\mathbf{Y}^{\mathrm T}$$ वेक्टर (या मैट्रिक्स) का स्थानान्तरण है $$\mathbf{Y}$$. $$(i,j)$$इस मैट्रिक्स का वां>-वां तत्व सहप्रसरण के बराबर है $$\operatorname{cov}(X_i,Y_j)$$ बीच $i$- का अदिश घटक $$\mathbf{X}$$ और यह $j$- का अदिश घटक $$\mathbf{Y}$$. विशेष रूप से, $$\operatorname{cov}(\mathbf{Y},\mathbf{X})$$ का स्थानान्तरण है $$\operatorname{cov}(\mathbf{X},\mathbf{Y})$$.

एक वास्तविक या जटिल हिल्बर्ट अंतरिक्ष में यादृच्छिक वैक्टर का क्रॉस-सहप्रसरण sesquilinear रूप
अधिक आम तौर पर चलो $$H_1 = (H_1, \langle \,,\rangle_1)$$ और $$H_2 = (H_2, \langle \,,\rangle_2)$$, हिल्बर्ट अंतरिक्ष खत्म हो जाएं $$\mathbb{R}$$ या $$\mathbb{C}$$ साथ $$\langle \,, \rangle$$ पहले चर में विरोधी रेखीय, और चलो $$\mathbf{X}, \mathbf{Y}$$ होना $$H_1$$ सम्मान। $$H_2$$ मूल्यवान यादृच्छिक चर। फिर का सहप्रसरण $$\mathbf{X}$$ और $$\mathbf{Y}$$ पर sesquilinear रूप है $$H_1 \times H_2$$ (पहले चर में विरोधी रेखीय) द्वारा दिया गया
 * $$\begin{align}

\operatorname{K}_{X,Y}(h_1,h_2) = \operatorname{cov}(\mathbf{X},\mathbf{Y})(h_1,h_2) &= \operatorname{E}\left[\langle h_1,(\mathbf{X} - \operatorname{E}[\mathbf{X}])\rangle_1\langle(\mathbf{Y} - \operatorname{E}[\mathbf{Y}]), h_2 \rangle_2\right]\\ &= \operatorname{E}[\langle h_1,\mathbf{X}\rangle_1\langle\mathbf{Y}, h_2 \rangle_2] - \operatorname{E}[\langle h,\mathbf{X} \rangle_1]\operatorname{E}[\langle \mathbf{Y},h_2 \rangle_2] \\ &= \langle h_1, \operatorname{E}\left[(\mathbf{X} - \operatorname{E}[\mathbf{X}])(\mathbf{Y} - \operatorname{E}[\mathbf{Y}])^\dagger \right]h_2 \rangle_1\\ &= \langle h_1, \left( \operatorname{E}[\mathbf{X}\mathbf{Y}^\dagger] - \operatorname{E}[\mathbf{X}]\operatorname{E}[\mathbf{Y}]^\dagger \right) h_2 \rangle_1\\ \end{align} $$

संख्यात्मक गणना
कब $$\operatorname{E}[XY] \approx \operatorname{E}[X]\operatorname{E}[Y]$$, समीकरण $$\operatorname{cov}(X, Y) = \operatorname{E}\left[X Y\right] - \operatorname{E}\left[X\right] \operatorname{E}\left[Y\right]$$ विनाशकारी रद्दीकरण की संभावना है यदि $$\operatorname{E}\left[X Y\right]$$ और $$\operatorname{E}\left[X\right] \operatorname{E}\left[Y\right]$$ सटीक रूप से गणना नहीं की जाती है और इस प्रकार कंप्यूटर प्रोग्राम से बचा जाना चाहिए जब डेटा पहले केंद्रित नहीं किया गया हो। इस मामले में प्रसरण#सहप्रसरण की गणना के लिए एल्गोरिदम को प्राथमिकता दी जानी चाहिए।

टिप्पणियाँ
सहप्रसरण को कभी-कभी दो यादृच्छिक चरों के बीच रैखिक निर्भरता का माप कहा जाता है। इसका मतलब वही नहीं है जो रैखिक बीजगणित के संदर्भ में है (रैखिक निर्भरता देखें)। जब सहप्रसरण सामान्यीकृत होता है, तो पियर्सन सहसंबंध गुणांक प्राप्त होता है, जो चरों के बीच संबंध का वर्णन करने वाले सर्वोत्तम संभव रैखिक फ़ंक्शन के लिए उपयुक्तता प्रदान करता है। इस अर्थ में सहप्रसरण निर्भरता का एक रेखीय गेज है।

आनुवंशिकी और आणविक जीव विज्ञान में
सहप्रसरण जीव विज्ञान में एक महत्वपूर्ण उपाय है। डीएनए के कुछ अनुक्रम प्रजातियों के बीच दूसरों की तुलना में अधिक संरक्षित हैं, और इस प्रकार प्रोटीन या आरएनए संरचनाओं की द्वितीयक और तृतीयक संरचनाओं का अध्ययन करने के लिए, अनुक्रमों की बारीकी से संबंधित प्रजातियों में तुलना की जाती है। यदि अनुक्रम परिवर्तन पाए जाते हैं या गैर-कोडिंग आरएनए (जैसे कि माइक्रो RNA) में कोई परिवर्तन नहीं पाया जाता है, तो आरएनए लूप जैसे सामान्य संरचनात्मक रूपांकनों के लिए अनुक्रम आवश्यक पाए जाते हैं। आनुवांशिकी में, सहप्रसरण आनुवंशिक संबंध मैट्रिक्स (जीआरएम) (उर्फ रिश्तेदारी मैट्रिक्स) की गणना के लिए एक आधार प्रदान करता है, जो किसी ज्ञात करीबी रिश्तेदार के साथ-साथ जटिल लक्षणों की आनुवंशिकता के अनुमान पर अनुमान से जनसंख्या संरचना पर अनुमान लगाने में सक्षम बनाता है।

विकास और प्राकृतिक चयन के सिद्धांत में, मूल्य समीकरण वर्णन करता है कि समय के साथ एक आनुवंशिक विशेषता आवृत्ति में कैसे बदलती है। विकास और प्राकृतिक चयन का गणितीय विवरण देने के लिए समीकरण एक विशेषता और फिटनेस (जीव विज्ञान) के बीच सहप्रसरण का उपयोग करता है। यह उन प्रभावों को समझने का एक तरीका प्रदान करता है जो जीन संचरण और प्राकृतिक चयन का जनसंख्या की प्रत्येक नई पीढ़ी के भीतर जीन के अनुपात पर होता है। परिजन चयन पर डब्ल्यू.डी. हैमिल्टन के कार्य को फिर से व्युत्पन्न करने के लिए मूल्य समीकरण जॉर्ज आर. प्राइस द्वारा व्युत्पन्न किया गया था। विभिन्न विकासवादी मामलों के लिए मूल्य समीकरण उदाहरणों का निर्माण किया गया है।

वित्तीय अर्थशास्त्र में
सहप्रसरण वित्तीय अर्थशास्त्र में महत्वपूर्ण भूमिका निभाते हैं, विशेष रूप से आधुनिक पोर्टफोलियो सिद्धांत और पूंजी परिसंपत्ति मूल्य निर्धारण मॉडल में। विभिन्न संपत्तियों के रिटर्न के बीच सहप्रसरण का उपयोग, कुछ मान्यताओं के तहत, विभिन्न संपत्तियों की सापेक्ष मात्रा निर्धारित करने के लिए किया जाता है, जो निवेशकों को (एक सामान्य अर्थशास्त्र में) या भविष्यवाणी की जाती है (एक सकारात्मक अर्थशास्त्र में) विविधीकरण (वित्त) के संदर्भ में धारण करना चुनते हैं। ).

मौसम संबंधी और समुद्र संबंधी डेटा आत्मसात
में मौसम पूर्वानुमान मॉडल चलाने के लिए आवश्यक प्रारंभिक स्थितियों का अनुमान लगाने में सहप्रसरण मैट्रिक्स महत्वपूर्ण है, एक प्रक्रिया जिसे डेटा सम्मिलन के रूप में जाना जाता है। 'पूर्वानुमान त्रुटि सहप्रसरण मैट्रिक्स' का निर्माण आम तौर पर एक माध्य स्थिति (या तो एक जलवायु विज्ञान या पहनावा माध्य) के आसपास गड़बड़ी के बीच किया जाता है। 'अवलोकन त्रुटि सहप्रसरण मैट्रिक्स' का निर्माण संयुक्त अवलोकन संबंधी त्रुटियों (विकर्ण पर) और माप (विकर्ण से दूर) के बीच सहसंबद्ध त्रुटियों के परिमाण का प्रतिनिधित्व करने के लिए किया गया है। यह कलमन फ़िल्टरिंग और समय-भिन्न प्रणालियों के लिए अधिक सामान्य राज्य अनुमान के लिए व्यापक अनुप्रयोग का एक उदाहरण है।

सूक्ष्म मौसम विज्ञान में
भँवर सहप्रसरण तकनीक एक प्रमुख वायुमंडलीय माप तकनीक है जहाँ औसत मूल्य से ऊर्ध्वाधर हवा की गति में तात्कालिक विचलन और गैस सांद्रता में तात्कालिक विचलन के बीच सहप्रसरण ऊर्ध्वाधर अशांत प्रवाह की गणना का आधार है।

सिग्नल प्रोसेसिंग में
एक संकेत के वर्णक्रमीय परिवर्तनशीलता को पकड़ने के लिए सहप्रसरण मैट्रिक्स का उपयोग किया जाता है।

सांख्यिकी और छवि प्रसंस्करण में
सहप्रसरण मैट्रिक्स का उपयोग मुख्य घटक विश्लेषण में डेटा प्रीप्रोसेसिंग में फीचर डायमेंशनलिटी को कम करने के लिए किया जाता है।

यह भी देखें

 * प्रसरण # सहप्रसरण की गणना के लिए एल्गोरिदम
 * सहप्रसरण का विश्लेषण
 * स्वतःप्रसरण
 * सहप्रसरण समारोह
 * सहप्रसरण आव्यूह
 * सहप्रसरण संचालक
 * दूरी सहप्रसरण, या ब्राउनियन सहप्रसरण।
 * कुल सहप्रसरण का नियम
 * अनिश्चितता का प्रसार