अपसरण (सांख्यिकी)

अभियोग ज्यामिति में, विचलन एक प्रकार की सांख्यिकीय दूरी है: एक युग्मक फलन जो एक संभाव्यता वितरण से दूसरे सांख्यिकीय बहुविध पर अलगाव को स्थापित करता है।

सबसे सरल विचलन यूक्लिडियन दूरी (एसईडी) है, और विचलन को एसईडी के सामान्यीकरण के रूप में देखा जा सकता है। अन्य सबसे महत्वपूर्ण विचलन सापेक्ष एन्ट्रॉपी (कुल्बैक-लीब्लर विचलन, केएल विचलन) है, जो अभियोग सिद्धांत के लिए केंद्रीय है। कई अन्य विशिष्ट विचलन और विचलन के वर्ग हैं, विशेष रूप से f-विचलन और n विचलन (देखें ).

परिभाषा
एक विभेदक बहुविध $$M$$ आयाम का $$n$$ दिया गया है, $$M$$ पर विचलन एक $$C^2$$-फलन $$D: M\times M\to [0, \infty)$$ है जो निम्नलिखित को संतुष्ट करता है: सांख्यिकी के अनुप्रयोगों में, बहुविध $$M$$ सामान्यतः एक प्राचलिक परिवार के मापदंडों का स्थान होता है।
 * 1) $$D(p, q) \geq 0$$ सभी $$p, q \in M$$ के लिए (गैर-नकारात्मकता),
 * 2) $$D(p, q) = 0$$ यदि और केवल यदि $$p=q$$ (सकारात्मकता),
 * 3) हर बिंदु $$p\in M$$, $$D(p, p+dp)$$ पर अत्यल्प विस्थापनों के लिए धनात्मक-निश्चित द्विघात रूप $$dp$$ से $$p$$ है।

अवस्था 3 ​​का अर्थ है $$D$$ स्पर्शरेखा स्थान $$T_pM$$ पर हर $$p\in M$$ के लिए एक आंतरिक उत्पाद को परिभाषित करता है। चूँकि $$D$$, $$M$$ पर $$C^2$$ है, यह $$M$$ पर एक रिमेंनियन मेट्रिक $$g$$ को परिभाषित करता है।

स्थानीय रूप से $$p\in M$$, हम निर्देशांक $$x$$ के साथ एक स्थानीय समन्वय मानचित्र बना सकते हैं, तो विचलन निम्न है $$D(x(p), x(p) + dx) = \textstyle\frac{1}{2} dx^T g_p(x) dx + O(|dx|^3)$$जहाँ $$g_p(x)$$ आकार $$n\times n$$ का एक आव्यूह है। यह बिंदु $$p$$ पर रिमेंनियन मात्रिक निर्देशांक $$x$$ में व्यक्त किया गया है।

स्थिति 3 के आयामी विश्लेषण से पता चलता है कि विचलन में वर्ग दूरी का आयाम है।

द्वैत विचलन $$D^*$$ निम्न रूप में परिभाषित किया जाता है
 * $$D^*(p, q) = D(q, p).$$

जब हम $$D$$ को $$D^*$$ के विपरीत करना चाहते हैं, तो हम $$D$$ को प्रारंभिक विचलन के रूप में संदर्भित करते हैं।

किसी विचलन $$D$$ को देखते हुए, इसके सममित संस्करण को इसके दोहरे विचलन के साथ औसत करके प्राप्त किया जाता है:
 * $$D_S(p, q) = \textstyle\frac{1}{2}\big(D(p,q) + D(q, p)\big).$$

अन्य समान अवधारणाओं से अंतर
मात्रिक (गणित) के विपरीत, अपसरण को सममित होने की आवश्यकता नहीं है, और विषमता अनुप्रयोगों में महत्वपूर्ण है। तद्नुसार, प्रायः p और q के बीच के स्थान पर p या p से q के विचलन को असमान रूप से संदर्भित किया जाता है। दूसरे, अपसरण वर्ग दूरी का सामान्यीकरण करते हैं, रेखीय दूरी का नहीं, और इस प्रकार त्रिकोण असमानता को संतुष्ट नहीं करते हैं, लेकिन कुछ अपसरण (जैसे कि ब्रेगमैन अपसरण) पाइथागोरस प्रमेय के सामान्यीकरण को संतुष्ट करते हैं।

सामान्य आँकड़ों और संभाव्यता में, विचलन सामान्यतः किसी भी प्रकार के कार्य $$D(p, q)$$ को संदर्भित करता है, जहाँ $$p, q$$ संभाव्यता वितरण या विचाराधीन अन्य वस्तुएं हैं, जैसे कि स्तिथि 1, 2 संतुष्ट हैं। अभियोग ज्यामिति में प्रयुक्त विचलन के लिए स्तिथि 3 ​​आवश्यक है।

एक उदाहरण के रूप में, संभाव्यता उपायों की कुल भिन्नता दूरी, सामान्यतः इस्तेमाल किया जाने वाला सांख्यिकीय विचलन, स्थिति 3 को संतुष्ट नहीं करता है।

चिन्हांकन
विचलन के लिए संकेतन क्षेत्रों के बीच महत्वपूर्ण रूप से भिन्न होता है, हालांकि कुछ परंपराएं हैं।

भिन्नता को सामान्यतः एक बड़े अक्षर 'डी' के साथ नोट किया जाता है, जैसा कि $$D(x, y)$$ में है, उन्हें मात्रिक दूरियों से अलग करने के लिए, जिन्हें लोअरकेस 'D' के साथ नोट किया गया है। जब कई भिन्नता उपयोग में होते हैं, तो वे सामान्यतः पादाक्षर के साथ अलग-अलग होते हैं, जैसे कि $$D_\text{KL}$$ कुल्बैक-लीब्लर अपसरण (KL अपसरण) के लिए होते हैं।

प्रायः मापदंडों के बीच एक अलग विभाजक का उपयोग विशेष रूप से विषमता पर जोर देने के लिए किया जाता है। अभियोग सिद्धांत में, सामान्यतः एक युग्म स्तंभ $$D(p \parallel q)$$का उपयोग किया जाता है; यह समान है, लेकिन सशर्त संभाव्यता के लिए संकेतन $$P(A | B)$$ से अलग है, और सापेक्ष एन्ट्रॉपी के रूप में विचलन को सापेक्ष माप के रूप में व्याख्या करने पर जोर देता है; केएल विचलन के लिए यह अंकन सामान्य है। इसके स्थान पर एक कोलन का उपयोग किया जा सकता है, जैसे $$D(p : q)$$; यह दो वितरणों का समर्थन करने वाली सापेक्ष जानकारी को महत्त्व देता है।

मापदंडों के लिए अंकन भी भिन्न होता है। $$P, Q$$ प्रायिकता वितरण के रूप में मापदंडों की व्याख्या करता है, जबकि $$p, q$$ या $$x, y$$ अंतरिक्ष में बिंदुओं के रूप में उनकी ज्यामितीय रूप से व्याख्या करता है, और $$\mu_1, \mu_2$$ या $$m_1, m_2$$ उन्हें उपायों के रूप में व्याख्या करता है।

ज्यामितीय गुण
भिन्नता के कई गुणों को प्राप्त किया जा सकता है यदि हम S को एक सांख्यिकीय बहुविध तक सीमित करते हैं, जिसका अर्थ है कि इसे परिमित-आयामी समन्वय प्रणाली θ के साथ प्राचलीकरण किया जा सकता है, ताकि वितरण के लिए p ∈ S हम p = p(θ) लिख सकते हैं।

एक जोड़ी अंक p, q ∈ S के लिए निर्देशांक θp और θq के साथ, D(p, q) के आंशिक व्युत्पन्न शब्द को निरूपित करें
 * $$\begin{align}

D((\partial_i)_p, q) \ \ &\stackrel{\mathrm{def}}{=}\ \ \tfrac{\partial}{\partial\theta^i_p} D(p, q), \\ D((\partial_i\partial_j)_p, (\partial_k)_q) \ \ &\stackrel{\mathrm{def}}{=}\ \ \tfrac{\partial}{\partial\theta^i_p} \tfrac{\partial}{\partial\theta^j_p}\tfrac{\partial}{\partial\theta^k_q}D(p, q), \ \ \mathrm{etc.} \end{align}$$ अब हम इन कार्यों को एक विकर्ण p = q तक सीमित करते हैं, और निम्न को निरूपित करें
 * $$\begin{align}

D[\partial_i, \cdot]\ &:\ p \mapsto D((\partial_i)_p, p), \\ D[\partial_i, \partial_j]\ &:\ p \mapsto D((\partial_i)_p, (\partial_j)_p),\ \ \mathrm{etc.} \end{align}$$ परिभाषा के अनुसार, फलन D(p, q) को न्यूनतम किया जाता है p = q, और इसलिए
 * $$\begin{align}

& D[\partial_i, \cdot] = D[\cdot, \partial_i] = 0, \\ & D[\partial_i\partial_j, \cdot] = D[\cdot, \partial_i\partial_j] = -D[\partial_i, \partial_j] \ \equiv\ g_{ij}^{(D)}, \end{align}$$ जहां आव्यूह g(D) सकारात्मक अर्ध-निश्चित आव्यूह है | सकारात्मक अर्ध-निश्चित है और बहुविध S पर एक अद्वितीय रिमेंनियन मात्रिक परिभाषित करता है।

भिन्नता डी (·, ·) भी संयोजन-मुक्त सजातीय संयोजन के एक अद्वितीय मरोड़ को परिभाषित करता है ∇ (डी)  गुणांक के साथ

\Gamma_{ij,k}^{(D)} = -D[\partial_i\partial_j, \partial_k], $$ और इस संयोजन के लिए दोहरी संबंध संयोजन ∇* दोहरी विचलन डी* द्वारा उत्पन्न होता है।

इस प्रकार, एक विचलन डी (·, ·) एक सांख्यिकीय बहुविध पर एक अद्वितीय द्वैतवादी संरचना (g(D), ∇(D), ∇(D*)) उत्पन्न करता है। इसका विलोम भी सत्य है: प्रत्येक मरोड़-मुक्त द्वैतवादी संरचना एक सांख्यिकीय बहुविध पर कुछ विश्व स्तर पर परिभाषित विचलन फलन से प्रेरित होती है (जो कि अद्वितीय होने की आवश्यकता नहीं है)। उदाहरण के लिए, जब D एक f-विचलन है कुछ फलन ƒ(·) के लिए, तो यह रीमैनियन मात्रिक g(Df) = c·g और संयोजन ∇(Df) = ∇(α) उत्पन्न करता है, जहां g विहित फिशर अभियोग मात्रिक है, ∇(ए) α-संयोजन है, c = ƒ′′(1), और α = 3 + 2ƒ′′′(1)/ƒ′′(1) है।

उदाहरण
दो सबसे महत्वपूर्ण विचलन सापेक्ष एंट्रॉपी (कुल्बैक-लीब्लर विचलन, केएल विचलन) हैं, जो अभियोग सिद्धांत और आंकड़ों के लिए केंद्रीय है, और स्क्वायर यूक्लिडियन दूरी (एसईडी)। अधिकतम एंट्रॉपी और कम से कम वर्गों के सिद्धांत के माध्यम से, विशेष रूप से लॉजिस्टिक प्रतिगमन और रैखिक प्रतिगमन में, इन दो भिन्नताओं को कम करना मुख्य तरीका है कि रैखिक प्रतिलोम समस्या हल हो जाती है।

अपसरण के दो सबसे महत्वपूर्ण वर्ग हैं एफ-अपसरण और ब्रैगमैन अपसरण; हालाँकि, साहित्य में अन्य प्रकार के विचलन कार्यों का भी सामना करना पड़ता है। कुल्बैक-लीब्लर विचलन एकमात्र विचलन है जो एक एफ-विचलन और ब्रैगमैन विचलन दोनों है; चुकता यूक्लिडियन विचलन एक ब्रेगमैन विचलन है (फलन के अनुरूप $x^2$), लेकिन f-विचलन नहीं है।

f विचलन
उत्तल कार्य $$f:[0, \infty)\to (-\infty, \infty]$$ ऐसे दिया गया है कि $$f(0) = \lim_{t\to 0^+}f(t), f(1) = 0$$, $$f$$ द्वारा उत्पन्न एफ-विचलन निम्न रूप में परिभाषित किया जाता है

D_f(p, q) = \int p(x)f\bigg(\frac{q(x)}{p(x)}\bigg) dx $$

ब्रैगमैन भिन्नता
ब्रैगमैन भिन्नता उत्तल सम्मुच्चय पर उत्तल कार्यों के अनुरूप हैं। एक दृढ़तः उत्तल कार्य दिया गया है, निरंतर भिन्न कार्य $F$ एक उत्तल सम्मुच्चय पर, जिसे ब्रैगमैन जनित्र के रूप में जाना जाता है, ब्रैगमैन अपसरण उत्तलता को मापता है: p पर मान के सन्निकटन के रूप में q से F के रैखिक सन्निकटन की त्रुटि निम्न है:
 * $$D_F(p, q) = F(p)-F(q)-\langle \nabla F(q), p-q\rangle. $$

ब्रैगमैन विचलन के लिए दोहरी विचलन मूल विचलन के ब्रैगमैन जनित्र के उत्तल संयुग्म F* द्वारा उत्पन्न विचलन है। उदाहरण के लिए, यूक्लिडियन दूरी के वर्ग के लिए, जनित्र $x^2$ है, जबकि सापेक्ष एंट्रॉपी के लिए जनित्र ऋणात्मक एंट्रॉपी अभिलेख $x \log x$ है।

इतिहास
अपसरण शब्द का उपयोग - यह किस प्रकार के कार्यों को संदर्भित करता है, और विभिन्न सांख्यिकीय दूरियों को क्या कहा जाता है - समय के साथ महत्वपूर्ण रूप से भिन्न होता है, लेकिन सी. 2000 द्वारा अभियोग ज्यामिति के भीतर, विशेष रूप से पाठ्यपुस्तक  में वर्तमान उपयोग पर तय किया गया था.

एक सांख्यिकीय दूरी के लिए विचलन शब्द का उपयोग अनौपचारिक रूप से c. 1910 से c. 1940 से विभिन्न संदर्भों में किया गया था। इसका औपचारिक उपयोग कम से कम दिनांकित है, उनके संभाव्यता वितरण द्वारा परिभाषित दो सांख्यिकीय आबादी के बीच विचलन के माप पर आख्यायुक्त है, जो भट्टाचार्य दूरी को परिभाषित करता है, और, दो बहुराष्ट्रीय आबादी के बीच विचलन के माप पर आख्यायुक्त है, जिसने भट्टाचार्य कोण को परिभाषित किया।  और पाठ्यपुस्तक  में कुल्बैक-लीब्लर विचलन के लिए इसके उपयोग से यह शब्द लोकप्रिय हुआ। विचलन शब्द का प्रयोग सामान्यतः  सांख्यिकीय दूरियों के लिए किया जाता था। सांख्यिकीय दूरियों के पूर्व उपयोग  और  के अनेक संदर्भ में दिए गए हैं।

वस्तुतः सममित विचलन को संदर्भित करने के लिए विचलन का उपयोग किया गया था (यह फलन पहले से ही 1948 में हेरोल्ड जेफरीस द्वारा परिभाषित और उपयोग किया गया था), भेदभाव के लिए औसत जानकारी ... प्रति अवलोकन के रूप में असममित कार्य को व्यक्त करते हुए, जबकि  असममित कार्य को निर्देशित विचलन के रूप में संदर्भित करता है।  सामान्यतः इस तरह के एक फलन को विचलन के गुणांक के रूप में संदर्भित किया जाता है, और दिखाया गया है कि कई मौजूदा कार्यों को f-विचलन के रूप में व्यक्त किया जा सकता है, जेफरीस के फलन को जेफरीस के विचलन के उपाय (आज जेफरीस विचलन), और कुल्बैक-लीब्लर के असममित फलन (प्रत्येक दिशा में) कुलबैक और लीब्लर के भेदभावपूर्ण जानकारी के उपायों के रूप में (आज कुल्बैक-लीब्लर विचलन) संदर्भित किया गया है। ।

विचलन की अभियोग ज्यामिति परिभाषा (इस लेख का विषय) को प्रारम्भ में अर्ध-दूरी सहित वैकल्पिक शब्दों द्वारा संदर्भित किया गया था और कंट्रास्ट फलन, हालांकि विचलन का उपयोग किया गया था  के लिए $α$-विचलन, और सामान्य वर्ग के लिए मानक बन गया है।

विचलन शब्द एक दूरी (मात्रिक) के विपरीत है, क्योंकि सममित विचलन त्रिभुज असमानता को संतुष्ट नहीं करता है। उदाहरण के लिए, ब्रैगमैन दूरी शब्द अभी भी पाया जाता है, लेकिन ब्रैगमैन अपसरण अब पसंद किया जाता है।

सांकेतिक रूप से, ने उनके असममित कार्य को $$I(1:2)$$ निरूपित किया, जबकि  उनके कार्यों  'd' को $$d\left(P_1, P_2\right)$$के रूप में दर्शाता है।

यह भी देखें

 * सांख्यिकीय दूरी

ग्रन्थसूची

 * . Republished by Dover Publications in 1968; reprinted in 1978: ISBN 0-8446-5625-9
 * . Republished by Dover Publications in 1968; reprinted in 1978: ISBN 0-8446-5625-9
 * . Republished by Dover Publications in 1968; reprinted in 1978: ISBN 0-8446-5625-9
 * . Republished by Dover Publications in 1968; reprinted in 1978: ISBN 0-8446-5625-9
 * . Republished by Dover Publications in 1968; reprinted in 1978: ISBN 0-8446-5625-9
 * . Republished by Dover Publications in 1968; reprinted in 1978: ISBN 0-8446-5625-9
 * . Republished by Dover Publications in 1968; reprinted in 1978: ISBN 0-8446-5625-9
 * . Republished by Dover Publications in 1968; reprinted in 1978: ISBN 0-8446-5625-9
 * . Republished by Dover Publications in 1968; reprinted in 1978: ISBN 0-8446-5625-9
 * . Republished by Dover Publications in 1968; reprinted in 1978: ISBN 0-8446-5625-9
 * . Republished by Dover Publications in 1968; reprinted in 1978: ISBN 0-8446-5625-9
 * . Republished by Dover Publications in 1968; reprinted in 1978: ISBN 0-8446-5625-9
 * . Republished by Dover Publications in 1968; reprinted in 1978: ISBN 0-8446-5625-9
 * . Republished by Dover Publications in 1968; reprinted in 1978: ISBN 0-8446-5625-9