सहप्रसरण



सांख्यिकी में सहप्रसरण दो यादृच्छिक चरों के लिये संयुक्त परिवर्तनशीलता का उपाय होता है। इस प्रकार यदि एक चर के बड़े मान मुख्य रूप से दूसरे चर के बड़े मानों के अनुरूप होते हैं, और वही कम मानों के लिए उपयोग होते हैं (अर्थात,चर समान व्यवहार दिखाते हैं), सहप्रसरण सकारात्मक होता है। इस विपरीत स्थिति में जब चरों के अधिक मूल्य मुख्य रूप से दूसरे के कम मानों के अनुरूप होते हैं अर्थात चर विपरीत दिखायी देते हैं, तब सहप्रसरण ऋणात्मक होते हैं। सहप्रसरण का चिन्ह इसलिए चरों के बीच रैखिक संबंध में प्रवृत्ति को दर्शाता हैं। सहप्रसरण का परिमाण उन प्रसरणों का ज्यामितीय माध्य होता है जो दो यादृच्छिक चरों के लिए सामान्य होता हैं। पियर्सन गुणनफल-आघूर्ण सहसंबंध गुणांक दो यादृच्छिक चरों के लिए कुल प्रसरणों के ज्यामितीय माध्य से विभाजित करके सहप्रसरण को सामान्य करता है।

समीकरम (1) दो यादृच्छिक चरों के सहप्रसरण के बीच अंतर किया जाना चाहिए, जो सांख्यिकीय जनसंख्या के लिए सांख्यिकीय पैरामीटर के द्वारा परिभाषित होता है जिसे संयुक्त संभाव्यता वितरण की संपत्ति के रूप में देखा जा सकता है, और समीकरण (2) में सांख्यिकी सहप्रसरण जो इसके अतिरिक्त प्रमाणों के लिए वर्णनकर्ता के रूप में सेवा करने के लिए जनसंख्या पैरामीटर के सांख्यिकीय अनुमान मान के रूप में भी कार्य करता है।

परिभाषा
दो संयुक्त वितरण के लिए वास्तविक संख्या मूल्यवान यादृच्छिक चरों के लिए $$X$$ और $$Y$$ परिमित दूसरे क्षणों के साथ, सहप्रसरण को उनके व्यक्तिगत अपेक्षित मानों से उनके विचलन के उत्पाद के अपेक्षित मूल्य (या माध्य) के रूप में परिभाषित किया गया है: $$\operatorname{cov}(X, Y) = \operatorname{E}{\big[(X - \operatorname{E}[X])(Y - \operatorname{E}[Y])\big]}$$जहाँ $$\operatorname{E}[X]$$ का अपेक्षित मान $$X$$ द्वारा परिभाषित होता हैं, इस $$X$$ के माध्य के रूप में भी जाना जाता है। सहप्रसरण को भी कभी-कभी $$\sigma_{XY}$$ या $$\sigma(X,Y)$$, विचरण के अनुरूप निरूपित किया जाता है। इस प्रकार अपेक्षाओं की रैखिकता गुणों का उपयोग करके इनके उत्पाद के अपेक्षित मूल्य को घटाकर उनके अपेक्षित मानों के उत्पाद को सरल बनाया जा सकता है:



\begin{align} \operatorname{cov}(X, Y) &= \operatorname{E}\left[\left(X - \operatorname{E}\left[X\right]\right) \left(Y - \operatorname{E}\left[Y\right]\right)\right] \\ &= \operatorname{E}\left[X Y - X \operatorname{E}\left[Y\right] - \operatorname{E}\left[X\right] Y + \operatorname{E}\left[X\right] \operatorname{E}\left[Y\right]\right] \\ &= \operatorname{E}\left[X Y\right] - \operatorname{E}\left[X\right] \operatorname{E}\left[Y\right] - \operatorname{E}\left[X\right] \operatorname{E}\left[Y\right] + \operatorname{E}\left[X\right] \operatorname{E}\left[Y\right] \\ &= \operatorname{E}\left[X Y\right] - \operatorname{E}\left[X\right] \operatorname{E}\left[Y\right], \end{align} $$ किन्तु यह समीकरण विनाशकारी निरस्त स्थिति के लिए अतिसंवेदनशील है, (यहाँ पर नीचे सहप्रसरण संख्यात्मक संगणना पर अनुभाग देखें)।

सहप्रसरण की माप की इकाई $$X$$ के समय $$Y$$ $$\operatorname{cov}(X, Y)$$ के हैं। इसके विपरीत सहसंबंध जो सहप्रसरण पर निर्भर करता है, रैखिक निर्भरता का आयाम रहित संख्या माप है। (वास्तव में सहसंबंध गुणांक सहप्रसरण के सामान्यीकृत संस्करण के रूप में समझा जा सकता है।)

जटिल यादृच्छिक चरों के लिए परिभाषा
दो जटिल यादृच्छिक चरों के बीच सहप्रसरण $$Z, W$$ परिभाषित किया जाता है


 * $$\operatorname{cov}(Z, W) =

\operatorname{E}\left[(Z - \operatorname{E}[Z])\overline{(W - \operatorname{E}[W])}\right] = \operatorname{E}\left[Z\overline{W}\right] - \operatorname{E}[Z]\operatorname{E}\left[\overline{W}\right] $$ परिभाषा में दूसरे कारक के जटिल संयुग्मन पर ध्यान दें।

इस प्रकार संबंधित यादृच्छिक सहप्रसरण को भी परिभाषित किया जा सकता है।

असतत यादृच्छिक चरों
यदि (वास्तविक) यादृच्छिक चरों के लिए संयुग्म $$(X,Y)$$ के मान को प्राप्त कर सकते हैं। इस प्रकार $$(x_i,y_i)$$ के लिए $$i=1,\ldots,n$$, समान संभावनाओं के साथ $$p_i=1/n$$ के रूप में निरूपित होता हैं, तो साधन के संदर्भ में सहप्रसरण को समान रूप से $$\operatorname{E}[X]$$ और $$\operatorname{E}[Y]$$ द्वारा लिखा जा सकता है।


 * $$\operatorname{cov} (X,Y)=\frac{1}{n}\sum_{i=1}^n (x_i-E(X))(y_i-E(Y)).$$

यह सीधे तौर पर साधनों के लिए साक्ष्य के बिना समान रूप से व्यक्त किया जा सकता है।
 * $$ \operatorname{cov}(X,Y) = \frac{1}{n^2} \sum_{i=1}^n \sum_{j=1}^n \frac{1}{2}(x_i - x_j)(y_i - y_j) = \frac{1}{n^2} \sum_i \sum_{j>i} (x_i-x_j)(y_i - y_j). $$

सामान्यतः यदि यहाँ $$n$$ की संभावित प्राप्ति $$(X,Y)$$, अर्थात् $$(x_i,y_i)$$ द्वारा की जाती हैं किन्तु संभवतः असमान संभावनाओं के साथ $$p_i$$ के लिए $$i=1,\ldots,n$$, तो सहप्रसरण इस प्रकार होता है।


 * $$\operatorname{cov} (X,Y)=\sum_{i=1}^n p_i (x_i-E(X)) (y_i-E(Y)).$$

उदाहरण
3 स्वतंत्र यादृच्छिक चरों $$A, B, C$$ और दो स्थिरांक $$q, r$$ पर विचार करने पर यह समीकरण प्राप्त होता हैं।

\begin{align} X &= qA + B \\ Y &= rA + C \\ \operatorname{cov}(X, Y) &= qr \operatorname{var}(A) \end{align} $$ विशेष स्थितियों में, $$q=1$$ और $$r=1$$, के बीच सहप्रसरण $$X$$ और $$Y$$, केवल का विचरण $$A$$ है और सहप्रसरण पूरी तरह उपयुक्त होता है।

इस प्रकार यह माना जा सकता है कि $$X$$ और $$Y$$ निम्नलिखित संयुक्त संभाव्यता वितरण है, जिसमें छह केंद्रीय कोशिकाएं असतत संयुक्त संभावनाएं देती हैं। इस प्रकार $$f(x, y)$$ छह काल्पनिक स्थितियों में $$(x, y) \in S = \left\{ (5, 8), (6, 8), (7, 8), (5, 9), (6, 9), (7, 9) \right\}$$: यहाँ पर $$X$$ मुख्य रूप से तीन मानों के लिए (5, 6 और 7) ले सकते हैं तथा $$Y$$ के लिए दो मान (8 और 9) ले सकते हैं। इसके साधन $$\mu_X = 5(0.3) + 6(0.4) + 7(0.1 + 0.2) = 6$$ और $$\mu_Y = 8(0.4 + 0.1) + 9(0.3 + 0.2) = 8.5$$. हैं, इस प्रकार,


 * $$\begin{align}

\operatorname{cov}(X, Y)   ={} &\sigma_{XY} = \sum_{(x,y)\in S}f(x, y) \left(x - \mu_X\right)\left(y - \mu_Y\right) \\[4pt] ={} &(0)(5 - 6)(8 - 8.5) + (0.4)(6 - 6)(8 - 8.5) + (0.1)(7 - 6)(8 - 8.5) +{} \\[4pt] &(0.3)(5 - 6)(9 - 8.5) + (0)(6 - 6)(9 - 8.5) + (0.2)(7 - 6)(9 - 8.5) \\[4pt] ={} &{-0.1} \; . \end{align}$$

स्वयं के साथ सहप्रसरण
विचरण सहप्रसरण की विशेष स्थिति है जिसमें दो चरों समान होते हैं (अर्थात, जिसमें चरों हमेशा दूसरे के समान मान लेता है):
 * $$\operatorname{cov}(X, X) =\operatorname{var}(X)\equiv\sigma^2(X)\equiv\sigma_X^2.$$

रैखिक संयोजनों का सहप्रसरण
यदि $$X$$, $$Y$$, $$W$$, और $$V$$ वास्तविक-मूल्यवान यादृच्छिक चरों हैं, और $$a,b,c,d$$ वास्तविक-मूल्यवान स्थिरांक हैं, तो निम्नलिखित तथ्य सहप्रसरण की परिभाषा के परिणाम हैं:

\begin{align} \operatorname{cov}(X, a) &= 0 \\ \operatorname{cov}(X, X) &= \operatorname{var}(X) \\ \operatorname{cov}(X, Y) &= \operatorname{cov}(Y, X) \\ \operatorname{cov}(aX, bY) &= ab\, \operatorname{cov}(X, Y) \\ \operatorname{cov}(X+a, Y+b) &= \operatorname{cov}(X, Y) \\ \operatorname{cov}(aX+bY, cW+dV) &= ac\,\operatorname{cov}(X,W)+ad\,\operatorname{cov}(X,V)+bc\,\operatorname{cov}(Y,W)+bd\,\operatorname{cov}(Y,V) \end{align} $$ इस क्रम के लिए $$X_1,\ldots,X_n$$ वास्तविक-मूल्यवान और स्थिरांक में यादृच्छिक चरों $$a_1,\ldots,a_n$$, इस प्रकार हमारे पास उक्त समीकरण प्राप्त होता हैं।


 * $$\operatorname{var}\left(\sum_{i=1}^n a_iX_i \right) = \sum_{i=1}^n a_i^2\sigma^2(X_i) + 2\sum_{i,j\,:\,i<j} a_ia_j\operatorname{cov}(X_i,X_j) = \sum_{i,j} {a_ia_j\operatorname{cov}(X_i,X_j)}

$$

हॉफडिंग की सहप्रसरण पहचान
दो यादृच्छिक चरों के बीच सहप्रसरण की गणना करने के लिए उपयोगी पहचान $$X, Y $$ होफ़डिंग की सहप्रसरण पहचान है:
 * $$\operatorname{cov}(X, Y) = \int_\mathbb R \int_\mathbb R \left(F_{(X, Y)}(x, y) - F_X(x)F_Y(y)\right) \,dx \,dy$$

कहाँ $$ F_{(X,Y)}(x,y) $$ यादृच्छिक सदिश का संयुक्त संचयी बंटन फलन $$ (X, Y) $$ और $$ F_X(x), F_Y(y) $$ है जिसे सीमांत वितरण कहा जाता हैं।

असंबद्धता और स्वतंत्रता
यादृच्छिक चरों जिनका सहप्रसरण शून्य होता है, असंबद्ध कहलाते हैं। इसी प्रकार यादृच्छिक सदिशों के घटक जिनका सहप्रसरण आव्यूह मुख्य विकर्ण के बाहर प्रत्येक प्रविष्टि में शून्य रहता है, यह असंबद्ध भी कहलाते हैं।

यदि $$X$$ और $$Y$$ सांख्यिकीय स्वतंत्रता हैं, तो उनका सहप्रसरण मान शून्य रहता है। यह इस प्रकार है क्योंकि स्वतंत्रता के अनुसार,


 * $$\operatorname{E}[XY]=\operatorname{E}[X] \cdot \operatorname{E}[Y]. $$

चूँकि, सामान्यतः इसका विलोम सत्य नहीं है। उदाहरण के लिए $$X$$ में समान रूप से वितरित होने पर $$[-1,1]$$ और जाने $$Y=X^2$$ रहता हैं इस प्रकार स्पष्ट रूप से, $$X$$ और $$Y$$ स्वतंत्र नहीं रहते हैं, किन्तु
 * $$\begin{align}

\operatorname{cov}(X, Y) &= \operatorname{cov}\left(X, X^2\right) \\ &= \operatorname{E}\left[X \cdot X^2\right] - \operatorname{E}[X] \cdot \operatorname{E}\left[X^2\right] \\ &= \operatorname{E}\left[X^3\right] - \operatorname{E}[X]\operatorname{E}\left[X^2\right] \\ &= 0 - 0 \cdot \operatorname{E}[X^2] \\ &= 0. \end{align}$$ इन स्थितियों में संबंधित $$Y$$ और $$X$$ क्षैतिज रहते हैं, जबकि सहसंबंध और सहप्रसरण दो यादृच्छिक चरों के बीच रैखिक निर्भरता के लिए उपयोग किया जाता हैं। इस उदाहरण से पता चलता है कि यदि दो यादृच्छिक चरों असंबंधित रहते हैं, तो इसका अर्थ यह नहीं है कि वे स्वतंत्र हैं। चूँकि यदि दो चरों बहुभिन्नरूपी सामान्य वितरण हैं (किन्तु यदि वे केवल सामान्य रूप से वितरित नहीं हैं और असंबद्ध स्वतंत्र नहीं हैं), तो असंबद्धता का अर्थ स्वतंत्रता से रहता हैं।

आंतरिक उत्पादों से संबंध
सहप्रसरण के कई गुणों को यह देखकर सुरुचिपूर्ण विधि से निकाला जा सकता है कि यह आंतरिक उत्पाद के समान गुणों को संतुष्ट करता है:
 * 1) बिलिनियर ऑपरेटर: स्थिरांक के लिए $$a$$ और $$b$$ और यादृच्छिक चरों $$X,Y,Z,$$ $$ \operatorname{cov}(aX+bY,Z) = a \operatorname{cov}(X,Z) + b \operatorname{cov}(Y,Z)$$
 * 2) सममित: $$\operatorname{cov}(X,Y) = \operatorname{cov}(Y,X)$$
 * 3) निश्चित द्विरेखीय रूप|सकारात्मक अर्ध-निश्चित: $$\sigma^2(X) = \operatorname{cov}(X,X) \ge 0$$ सभी यादृच्छिक चरों के लिए $$X$$, और $$\operatorname{cov}(X,X) = 0$$ इसका आशय है $$X$$ स्थिर लगभग निश्चित है।

वास्तव में इन गुणों का अर्थ है कि सहप्रसरण भागफल स्थान (रैखिक बीजगणित) पर आंतरिक उत्पाद को परिमित दूसरे क्षण के साथ यादृच्छिक चरों के उप-स्थान को ले कर प्राप्त करता है और किसी भी दो की पहचान करता है जो स्थिरांक से भिन्न होता है। (यह पहचान सकारात्मक अर्ध-निश्चितता को सकारात्मक निश्चितता में परिवर्तन करती हैं।) इस भागफल में सदिश स्थान के लिए परिमित स्थिति पर दूसरे क्षण और शून्य के साथ यादृच्छिक चरों के उप-स्थान के लिए आइसोमोर्फिक विधि का उपयोग किया जाता है, उस उप-स्थान पर, सहप्रसरण ठीक Lp स्थान है। यहाँ पर L2 के स्थान पर वास्तविक-मूल्यवान कार्यों का आंतरिक उत्पाद प्राप्त होता हैं।

परिणाम स्वरुप, परिमित भिन्नता वाले यादृच्छिक चरों के लिए, असमानता इस प्रकार हैं।


 * $$|\operatorname{cov}(X, Y)| \le \sqrt{\sigma^2(X) \sigma^2(Y)} $$

कॉची श्वार्ज़ असमानता के माध्यम से है।

प्रमाण: यदि $$\sigma^2(Y) = 0$$, तो यह तुच्छ रूप से धारण करता है। अन्यथा, यादृच्छिक चरों दें


 * $$ Z = X - \frac{\operatorname{cov}(X, Y)}{\sigma^2(Y)} Y.$$

तो हमें उक्त समीकरण प्राप्त होता हैं।


 * $$\begin{align}

0 \le \sigma^2(Z) &= \operatorname{cov}\left(        X - \frac{\operatorname{cov}(X, Y)}{\sigma^2(Y)} Y,\;         X - \frac{\operatorname{cov}(X, Y)}{\sigma^2(Y)} Y       \right) \\[12pt] &= \sigma^2(X) - \frac{(\operatorname{cov}(X, Y))^2}{\sigma^2(Y)}. \end{align}$$

प्रमाणिक सहप्रसरण की गणना
बीच में प्रमाणिक सहप्रसरण $$K$$ पर आधारित चरों $$N$$ अन्यथा अप्राप्य आबादी से खींची गई प्रत्येक की टिप्पणियों द्वारा दी जाती हैं। इस प्रकार $$K \times K$$ आव्यूह (गणित) $$\textstyle \overline{\mathbf{q}} = \left[q_{jk}\right]$$ प्रविष्टियों के साथ


 * $$q_{jk} = \frac{1}{N - 1}\sum_{i=1}^N \left(X_{ij} - \bar{X}_j\right) \left(X_{ik} - \bar{X}_k\right),$$

जो चरों के बीच सहप्रसरण का अनुमान $$j$$ और चरों $$k$$ है।

प्रमाणिक माध्य और प्रमाणिक सहप्रसरण आव्यूह माध्य के अनुमानक और यादृच्छिक सदिश के सहप्रसरण आव्यूह $$\textstyle \mathbf{X}$$ के पूर्वाग्रह हैं, सदिश जिसका jवाँ तत्व $$(j = 1,\, \ldots,\, K)$$ यादृच्छिक चरों में से है। प्रमाणिक सहप्रसरण आव्यूह का कारण है। इस प्रकार $$\textstyle N-1$$ के अतिरिक्त भाजक में $$\textstyle N$$ अनिवार्य रूप से जनसंख्या का अर्थ है $$\operatorname{E}(\mathbf{X})$$ का मान ज्ञात नहीं है और इसे प्रमाणिक माध्य से परिवर्तित कर दिया गया है। इस प्रकार $$\mathbf{\bar{X}}$$ जनसंख्या का आशय यह है कि $$\operatorname{E}(\mathbf{X})$$ ज्ञात है, तथा इसके अनुरूप निष्पक्ष अनुमान उक्त समीकरण द्वारा दिया गया है-


 * $$ q_{jk} = \frac{1}{N} \sum_{i=1}^N \left(X_{ij} - \operatorname{E}\left(X_j\right)\right) \left(X_{ik} - \operatorname{E}\left(X_k\right)\right)$$.

वास्तविक यादृच्छिक वैक्टर के ऑटो-सहप्रसरण आव्यूह
वेक्टर के लिए $$\mathbf{X} = \begin{bmatrix}X_1 & X_2 & \dots & X_m\end{bmatrix}^\mathrm{T}$$ का $$m$$ परिमित दूसरे क्षणों के साथ संयुक्त रूप से वितरित रैंडम चरों, इसका ऑटो-कोवैरियंस आव्यूह (जिसे वैरियंस-कॉवैरियंस आव्यूह या बस कोवैरियंस आव्यूह के रूप में भी जाना जाता है), इस प्रकार $$\operatorname{K}_{\mathbf{X}\mathbf{X}}$$ (द्वारा भी दर्शाया गया है $$\Sigma(\mathbf{X})$$ या $$\operatorname{cov}(\mathbf{X}, \mathbf{X})$$) परिभाषित किया जाता है


 * $$\begin{align}

\operatorname{K}_\mathbf{XX} = \operatorname{cov}(\mathbf{X}, \mathbf{X}) &= \operatorname{E}\left[(\mathbf{X} - \operatorname{E}[\mathbf{X}]) (\mathbf{X} - \operatorname{E}[\mathbf{X}])^\mathrm{T}\right] \\ &= \operatorname{E}\left[\mathbf{XX}^\mathrm{T}\right] - \operatorname{E}[\mathbf{X}]\operatorname{E}[\mathbf{X}]^\mathrm{T}. \end{align}$$ यहाँ पर $$\mathbf{X}$$ सहप्रसरण आव्यूह के साथ यादृच्छिक वेक्टर $Σ$ बनाता हैं, और $A$ आव्यूह जो $$\mathbf{X}$$ के बाईं ओर कार्य करते हैं। इन आव्यूह वेक्टर उत्पाद का सहप्रसरण आव्यूह $A X$ होता है:
 * $$\begin{align}

\operatorname{cov}(\mathbf{AX},\mathbf{AX}) &= \operatorname{E}\left[\mathbf{AX(A}\mathbf{X)}^\mathrm{T}\right] - \operatorname{E}[\mathbf{AX}] \operatorname{E}\left[(\mathbf{A}\mathbf{X})^\mathrm{T}\right] \\ &= \operatorname{E}\left[\mathbf{AXX}^\mathrm{T}\mathbf{A}^\mathrm{T}\right] - \operatorname{E}[\mathbf{AX}] \operatorname{E}\left[\mathbf{X}^\mathrm{T}\mathbf{A}^\mathrm{T}\right] \\ &= \mathbf{A}\operatorname{E}\left[\mathbf{XX}^\mathrm{T}\right]\mathbf{A}^\mathrm{T} - \mathbf{A}\operatorname{E}[\mathbf{X}] \operatorname{E}\left[\mathbf{X}^\mathrm{T}\right]\mathbf{A}^\mathrm{T} \\ &= \mathbf{A}\left(\operatorname{E}\left[\mathbf{XX}^\mathrm{T}\right] - \operatorname{E}[\mathbf{X}] \operatorname{E}\left[\mathbf{X}^\mathrm{T}\right]\right)\mathbf{A}^\mathrm{T} \\ &= \mathbf{A}\Sigma\mathbf{A}^\mathrm{T}. \end{align}$$ यह अपेक्षित मूल्य की रैखिकता का प्रत्यक्ष परिणाम है और इसलिए ये उपयोगी होते हैं।

किसी रैखिक परिवर्तन लागू करते समय जैसे सफ़ेद परिवर्तन, सदिश के लिए इसका ध्यान रखा जाता हैं।

वास्तविक यादृच्छिक सदिशों का क्रॉस-सहप्रसरण आव्यूह
वास्तविक यादृच्छिक वैक्टर के लिए $$\mathbf{X} \in \mathbb{R}^m$$ और $$\mathbf{Y} \in \mathbb{R}^n$$, $$m \times n$$ क्रॉस-कोवैरियंस आव्यूह के बराबर होता है

जहाँ $$\mathbf{Y}^{\mathrm T}$$ वेक्टर $$\mathbf{Y}$$. $$(i,j)$$ (या आव्यूह) का स्थानान्तरण है, इस आव्यूह का वां>-वां तत्व सहप्रसरण के बराबर होता है। $$\operatorname{cov}(X_i,Y_j)$$ बीच $i$- का अदिश घटक $$\mathbf{X}$$ और यह $j$- का अदिश घटक $$\mathbf{Y}$$. विशेष रूप से, $$\operatorname{cov}(\mathbf{Y},\mathbf{X})$$ का स्थानान्तरण $$\operatorname{cov}(\mathbf{X},\mathbf{Y})$$ होता है।

वास्तविक या जटिल हिल्बर्ट तल में यादृच्छिक वैक्टर का क्रॉस-सहप्रसरण रैखिक रूप
अधिक सामान्य स्थिति में $$H_1 = (H_1, \langle \,,\rangle_1)$$ और $$H_2 = (H_2, \langle \,,\rangle_2)$$, हिल्बर्ट तल निरस्त हो जाता हैं इस प्रकार $$\mathbb{R}$$ या $$\mathbb{C}$$ साथ $$\langle \,, \rangle$$ पहले चरों में विरोधी रेखीय रूप में प्रदर्शित होता हैं, इस प्रकार $$\mathbf{X}, \mathbf{Y}$$ $$H_1$$ तथा $$H_2$$ का मान यादृच्छिक चरों पर निर्भर करता हैं। इस स्थिति में सहप्रसरण $$\mathbf{X}$$ और $$\mathbf{Y}$$ पर रैखिक रूप $$H_1 \times H_2$$ है। जिसका पहले चरों में विरोधी रेखीय इस प्रकार दी जाती हैं।
 * $$\begin{align}

\operatorname{K}_{X,Y}(h_1,h_2) = \operatorname{cov}(\mathbf{X},\mathbf{Y})(h_1,h_2) &= \operatorname{E}\left[\langle h_1,(\mathbf{X} - \operatorname{E}[\mathbf{X}])\rangle_1\langle(\mathbf{Y} - \operatorname{E}[\mathbf{Y}]), h_2 \rangle_2\right]\\ &= \operatorname{E}[\langle h_1,\mathbf{X}\rangle_1\langle\mathbf{Y}, h_2 \rangle_2] - \operatorname{E}[\langle h,\mathbf{X} \rangle_1]\operatorname{E}[\langle \mathbf{Y},h_2 \rangle_2] \\ &= \langle h_1, \operatorname{E}\left[(\mathbf{X} - \operatorname{E}[\mathbf{X}])(\mathbf{Y} - \operatorname{E}[\mathbf{Y}])^\dagger \right]h_2 \rangle_1\\ &= \langle h_1, \left( \operatorname{E}[\mathbf{X}\mathbf{Y}^\dagger] - \operatorname{E}[\mathbf{X}]\operatorname{E}[\mathbf{Y}]^\dagger \right) h_2 \rangle_1\\ \end{align} $$

संख्यात्मक गणना
इस प्रकार जब $$\operatorname{E}[XY] \approx \operatorname{E}[X]\operatorname{E}[Y]$$ के समान होता हैं तब समीकरण $$\operatorname{cov}(X, Y) = \operatorname{E}\left[X Y\right] - \operatorname{E}\left[X\right] \operatorname{E}\left[Y\right]$$ विनाशकारी निरस्तीकरण की संभावना रहती है। इस प्रकार यदि $$\operatorname{E}\left[X Y\right]$$ और $$\operatorname{E}\left[X\right] \operatorname{E}\left[Y\right]$$ त्रुटिहीन रूप से गणना नहीं की जाती है और इस प्रकार कंप्यूटर प्रोग्राम से बचा जाना चाहिए जब डेटा पहले केंद्रित नहीं किया जाता हैं। इस स्थितियों में प्रसरण सहप्रसरण की गणना के लिए एल्गोरिदम को प्राथमिकता दी जाती हैं।

टिप्पणियाँ
सहप्रसरण को कभी-कभी दो यादृच्छिक चरों के बीच रैखिक निर्भरता का माप कहा जाता है। इसका कोई अर्थ नहीं है जो रैखिक बीजगणित के संदर्भ में है। जब सहप्रसरण सामान्यीकृत होता है, तो पियर्सन सहसंबंध गुणांक प्राप्त होता है, जो चरों के बीच संबंध का वर्णन करने वाले सर्वोत्तम संभव रैखिक फ़ंक्शन के लिए उपयुक्तता प्रदान करता है। इस अर्थ में सहप्रसरण निर्भरता का रेखीय गेज रहता हैं।

आनुवंशिकी और आणविक जीव विज्ञान में
सहप्रसरण जीव विज्ञान में महत्वपूर्ण उपाय है। डीएनए के कुछ अनुक्रम प्रजातियों के बीच दूसरों की तुलना में अधिक संरक्षित रहते हैं, और इस प्रकार प्रोटीन या आरएनए संरचनाओं की द्वितीयक और तृतीयक संरचनाओं का अध्ययन करने के लिए, अनुक्रमों की बारीकी से संबंधित प्रजातियों में तुलना की जाती है। यदि अनुक्रम परिवर्तन पाए जाते हैं या गैर-कोडिंग आरएनए (जैसे कि माइक्रो आरएनए) में कोई परिवर्तन नहीं किया जाता है, तो आरएनए लूप जैसे सामान्य संरचनात्मक रूपांकनों के लिए अनुक्रम आवश्यक पाए जाते हैं। आनुवांशिकी में, सहप्रसरण आनुवंशिक संबंध आव्यूह (जीआरएम) (सह आव्यूह) की गणना के लिए आधार प्रदान करता है, जो किसी ज्ञात समीपस्थ के साथ जटिल लक्षणों की आनुवंशिकता के अनुमान पर अनुमान से जनसंख्या संरचना पर अनुमान लगाने में सक्षम बनाता है।

विकास और प्राकृतिक चयन के सिद्धांत में, मूल्य समीकरण वर्णन करता है कि समय के साथ आनुवंशिक विशेषता आवृत्ति में कैसे परिवर्तित होती है। इस विकास और प्राकृतिक चयन का गणितीय विवरण देने के लिए समीकरण विशेषता और फिटनेस (जीव विज्ञान) के बीच सहप्रसरण का उपयोग करता है। यह उन प्रभावों को समझने का विधि प्रदान करता है जो जीन संचरण और प्राकृतिक चयन का जनसंख्या की प्रत्येक नई पीढ़ी के भीतर जीन के अनुपात पर होता है। इसके चयन पर डब्ल्यू.डी. हैमिल्टन के कार्य को फिर से व्युत्पन्न करने के लिए मूल्य समीकरण जॉर्ज आर. प्राइस द्वारा व्युत्पन्न किया गया था। विभिन्न विकासवादी स्थितियों के लिए मूल्य समीकरण उदाहरण का निर्माण किया गया है।

वित्तीय अर्थशास्त्र में
सहप्रसरण वित्तीय अर्थशास्त्र में महत्वपूर्ण भूमिका निभाते हैं, विशेष रूप से आधुनिक पोर्टफोलियो सिद्धांत और पूंजी परिसंपत्ति मूल्य निर्धारण मॉडल में इसका उपयोग किया जाता हैं। इन विभिन्न संपत्तियों के रिटर्न के बीच सहप्रसरण का उपयोग, कुछ मान्यताओं के अनुसार विभिन्न संपत्तियों की सापेक्ष मात्रा निर्धारित करने के लिए किया जाता है, जो निवेशकों को सामान्य अर्थशास्त्र में या सकारात्मक अर्थशास्त्र में विविधीकरण (वित्त) के संदर्भ में धारण करना चुनते हैं।

मौसम संबंधी और समुद्र संबंधी डेटा आत्मसात में
मौसम पूर्वानुमान मॉडल चलाने के लिए आवश्यक प्रारंभिक स्थितियों का अनुमान लगाने में सहप्रसरण आव्यूह महत्वपूर्ण है, उक्त प्रक्रिया जिसे डेटा सम्मिलन के रूप में जाना जाता है। 'पूर्वानुमान त्रुटि सहप्रसरण आव्यूह' का निर्माण सामान्यतः माध्य स्थिति (या तो जलवायु विज्ञान या पहनावा माध्य) के लिए इसकी त्रुटि के बीच किया जाता है। 'अवलोकन त्रुटि सहप्रसरण आव्यूह' का निर्माण संयुक्त अवलोकन संबंधी त्रुटियों (विकर्ण पर) और माप (विकर्ण से दूर) के बीच सहसंबद्ध त्रुटियों के परिमाण का प्रतिनिधित्व करने के लिए किया जाता हैं। यह कलमन फ़िल्टरिंग और समय-भिन्न प्रणालियों के लिए अधिक सामान्य स्थिति के अनुमान के लिए व्यापक अनुप्रयोग का उदाहरण है।

सूक्ष्म मौसम विज्ञान में
भँवर सहप्रसरण तकनीक प्रमुख वायुमंडलीय माप तकनीक है जहाँ औसत मूल्य से ऊर्ध्वाधर हवा की गति में तात्कालिक विचलन और गैस सांद्रता में तात्कालिक विचलन के बीच सहप्रसरण ऊर्ध्वाधर अशांत प्रवाह की गणना का आधार माना जाता हैं।

संकेत प्रक्रिया में
संकेतन के वर्णक्रमीय परिवर्तनशीलता को प्राप्त करने के लिए सहप्रसरण आव्यूह का उपयोग किया जाता है।

सांख्यिकी और प्रतिबिंब प्रसंस्करण मे
सहप्रसरण आव्यूह का उपयोग मुख्य घटक विश्लेषण में डेटा प्रीप्रोसेसिंग में गुणों को दिशा के आधार पर कम करने के लिए किया जाता है।

यह भी देखें

 * प्रसरण सहप्रसरण की गणना के लिए एल्गोरिदम
 * सहप्रसरण का विश्लेषण
 * स्वतःप्रसरण
 * सहप्रसरण फंक्शन
 * सहप्रसरण आव्यूह
 * सहप्रसरण संचालक
 * दूरी सहप्रसरण, या ब्राउनियन सहप्रसरण।
 * कुल सहप्रसरण का नियम
 * अनिश्चितता का प्रसार