अपसरण (सांख्यिकी)

अभियोग ज्यामिति में, अपसरण एक प्रकार की सांख्यिकीय दूरी है: एक युग्मक फलन जो एक संभाव्यता वितरण से दूसरे सांख्यिकीय बहुविध पर अलगाव को स्थापित करता है।

सबसे सरल अपसरण यूक्लिडियन दूरी (एसईडी) है, और अपसरण को एसईडी के सामान्यीकरण के रूप में देखा जा सकता है। अन्य सबसे महत्वपूर्ण अपसरण सापेक्ष एन्ट्रॉपी (कुल्बैक-लीब्लर अपसरण, केएल अपसरण) है, जो अभियोग सिद्धांत के लिए केंद्रीय है। कई अन्य विशिष्ट अपसरण और अपसरण के वर्ग हैं, विशेष रूप से f-अपसरण और n अपसरण (देखें ).

परिभाषा
एक विभेदक बहुविध $$M$$ आयाम का $$n$$ दिया गया है, $$M$$ पर अपसरण एक $$C^2$$-फलन $$D: M\times M\to [0, \infty)$$ है जो निम्नलिखित को संतुष्ट करता है: सांख्यिकी के अनुप्रयोगों में, बहुविध $$M$$ सामान्यतः एक प्राचलिक परिवार के मापदंडों का स्थान होता है।
 * 1) $$D(p, q) \geq 0$$ सभी $$p, q \in M$$ के लिए (गैर-नकारात्मकता),
 * 2) $$D(p, q) = 0$$ यदि और केवल यदि $$p=q$$ (सकारात्मकता),
 * 3) हर बिंदु $$p\in M$$, $$D(p, p+dp)$$ पर अत्यल्प विस्थापनों के लिए धनात्मक-निश्चित द्विघात रूप $$dp$$ से $$p$$ है।

अवस्था 3 ​​का अर्थ है $$D$$ स्पर्शरेखा स्थान $$T_pM$$ पर हर $$p\in M$$ के लिए एक आंतरिक उत्पाद को परिभाषित करता है। चूँकि $$D$$, $$M$$ पर $$C^2$$ है, यह $$M$$ पर एक रिमेंनियन मेट्रिक $$g$$ को परिभाषित करता है।

स्थानीय रूप से $$p\in M$$, हम निर्देशांक $$x$$ के साथ एक स्थानीय समन्वय मानचित्र बना सकते हैं, तो अपसरण निम्न है $$D(x(p), x(p) + dx) = \textstyle\frac{1}{2} dx^T g_p(x) dx + O(|dx|^3)$$जहाँ $$g_p(x)$$ आकार $$n\times n$$ का एक आव्यूह है। यह बिंदु $$p$$ पर रिमेंनियन मात्रिक निर्देशांक $$x$$ में व्यक्त किया गया है।

स्थिति 3 के आयामी विश्लेषण से पता चलता है कि अपसरण में वर्ग दूरी का आयाम है।

द्वैत अपसरण $$D^*$$ निम्न रूप में परिभाषित किया जाता है
 * $$D^*(p, q) = D(q, p).$$

जब हम $$D$$ को $$D^*$$ के विपरीत करना चाहते हैं, तो हम $$D$$ को प्रारंभिक अपसरण के रूप में संदर्भित करते हैं।

किसी अपसरण $$D$$ को देखते हुए, इसके सममित संस्करण को इसके दोहरे अपसरण के साथ औसत करके प्राप्त किया जाता है:
 * $$D_S(p, q) = \textstyle\frac{1}{2}\big(D(p,q) + D(q, p)\big).$$

अन्य समान अवधारणाओं से अंतर
मात्रिक (गणित) के विपरीत, अपसरण को सममित होने की आवश्यकता नहीं है, और विषमता अनुप्रयोगों में महत्वपूर्ण है। तद्नुसार, प्रायः p और q के बीच के स्थान पर p या p से q के अपसरण को असमान रूप से संदर्भित किया जाता है। दूसरे, अपसरण वर्ग दूरी का सामान्यीकरण करते हैं, रेखीय दूरी का नहीं, और इस प्रकार त्रिकोण असमानता को संतुष्ट नहीं करते हैं, लेकिन कुछ अपसरण (जैसे कि ब्रेगमैन अपसरण) पाइथागोरस प्रमेय के सामान्यीकरण को संतुष्ट करते हैं।

सामान्य आँकड़ों और संभाव्यता में, अपसरण सामान्यतः किसी भी प्रकार के कार्य $$D(p, q)$$ को संदर्भित करता है, जहाँ $$p, q$$ संभाव्यता वितरण या विचाराधीन अन्य वस्तुएं हैं, जैसे कि स्तिथि 1, 2 संतुष्ट हैं। अभियोग ज्यामिति में प्रयुक्त अपसरण के लिए स्तिथि 3 ​​आवश्यक है।

एक उदाहरण के रूप में, संभाव्यता उपायों की कुल भिन्नता दूरी, सामान्यतः इस्तेमाल किया जाने वाला सांख्यिकीय अपसरण, स्थिति 3 को संतुष्ट नहीं करता है।

चिन्हांकन
अपसरण के लिए संकेतन क्षेत्रों के बीच महत्वपूर्ण रूप से भिन्न होता है, हालांकि कुछ परंपराएं हैं।

भिन्नता को सामान्यतः एक बड़े अक्षर 'डी' के साथ नोट किया जाता है, जैसा कि $$D(x, y)$$ में है, उन्हें मात्रिक दूरियों से अलग करने के लिए, जिन्हें लोअरकेस 'D' के साथ नोट किया गया है। जब कई भिन्नता उपयोग में होते हैं, तो वे सामान्यतः पादाक्षर के साथ अलग-अलग होते हैं, जैसे कि $$D_\text{KL}$$ कुल्बैक-लीब्लर अपसरण (KL अपसरण) के लिए होते हैं।

प्रायः मापदंडों के बीच एक अलग विभाजक का उपयोग विशेष रूप से विषमता पर जोर देने के लिए किया जाता है। अभियोग सिद्धांत में, सामान्यतः एक युग्म स्तंभ $$D(p \parallel q)$$का उपयोग किया जाता है; यह समान है, लेकिन सशर्त संभाव्यता के लिए संकेतन $$P(A | B)$$ से अलग है, और सापेक्ष एन्ट्रॉपी के रूप में अपसरण को सापेक्ष माप के रूप में व्याख्या करने पर जोर देता है; केएल अपसरण के लिए यह अंकन सामान्य है। इसके स्थान पर एक कोलन का उपयोग किया जा सकता है, जैसे $$D(p : q)$$; यह दो वितरणों का समर्थन करने वाली सापेक्ष जानकारी को महत्त्व देता है।

मापदंडों के लिए अंकन भी भिन्न होता है। $$P, Q$$ प्रायिकता वितरण के रूप में मापदंडों की व्याख्या करता है, जबकि $$p, q$$ या $$x, y$$ अंतरिक्ष में बिंदुओं के रूप में उनकी ज्यामितीय रूप से व्याख्या करता है, और $$\mu_1, \mu_2$$ या $$m_1, m_2$$ उन्हें उपायों के रूप में व्याख्या करता है।

ज्यामितीय गुण
भिन्नता के कई गुणों को प्राप्त किया जा सकता है यदि हम S को एक सांख्यिकीय बहुविध तक सीमित करते हैं, जिसका अर्थ है कि इसे परिमित-आयामी समन्वय प्रणाली θ के साथ प्राचलीकरण किया जा सकता है, ताकि वितरण के लिए p ∈ S हम p = p(θ) लिख सकते हैं।

एक जोड़ी अंक p, q ∈ S के लिए निर्देशांक θp और θq के साथ, D(p, q) के आंशिक व्युत्पन्न शब्द को निरूपित करें
 * $$\begin{align}

D((\partial_i)_p, q) \ \ &\stackrel{\mathrm{def}}{=}\ \ \tfrac{\partial}{\partial\theta^i_p} D(p, q), \\ D((\partial_i\partial_j)_p, (\partial_k)_q) \ \ &\stackrel{\mathrm{def}}{=}\ \ \tfrac{\partial}{\partial\theta^i_p} \tfrac{\partial}{\partial\theta^j_p}\tfrac{\partial}{\partial\theta^k_q}D(p, q), \ \ \mathrm{etc.} \end{align}$$ अब हम इन कार्यों को एक विकर्ण p = q तक सीमित करते हैं, और निम्न को निरूपित करें
 * $$\begin{align}

D[\partial_i, \cdot]\ &:\ p \mapsto D((\partial_i)_p, p), \\ D[\partial_i, \partial_j]\ &:\ p \mapsto D((\partial_i)_p, (\partial_j)_p),\ \ \mathrm{etc.} \end{align}$$ परिभाषा के अनुसार, फलन D(p, q) को न्यूनतम किया जाता है p = q, और इसलिए
 * $$\begin{align}

& D[\partial_i, \cdot] = D[\cdot, \partial_i] = 0, \\ & D[\partial_i\partial_j, \cdot] = D[\cdot, \partial_i\partial_j] = -D[\partial_i, \partial_j] \ \equiv\ g_{ij}^{(D)}, \end{align}$$ जहां आव्यूह g(D) सकारात्मक अर्ध-निश्चित आव्यूह है | सकारात्मक अर्ध-निश्चित है और बहुविध S पर एक अद्वितीय रिमेंनियन मात्रिक परिभाषित करता है।

भिन्नता डी (·, ·) भी संयोजन-मुक्त सजातीय संयोजन के एक अद्वितीय मरोड़ को परिभाषित करता है ∇ (डी)  गुणांक के साथ

\Gamma_{ij,k}^{(D)} = -D[\partial_i\partial_j, \partial_k], $$ और इस संयोजन के लिए दोहरी संबंध संयोजन ∇* दोहरी अपसरण डी* द्वारा उत्पन्न होता है।

इस प्रकार, एक अपसरण डी (·, ·) एक सांख्यिकीय बहुविध पर एक अद्वितीय द्वैतवादी संरचना (g(D), ∇(D), ∇(D*)) उत्पन्न करता है। इसका विलोम भी सत्य है: प्रत्येक मरोड़-मुक्त द्वैतवादी संरचना एक सांख्यिकीय बहुविध पर कुछ विश्व स्तर पर परिभाषित अपसरण फलन से प्रेरित होती है (जो कि अद्वितीय होने की आवश्यकता नहीं है)। उदाहरण के लिए, जब D एक f-अपसरण है कुछ फलन ƒ(·) के लिए, तो यह रीमैनियन मात्रिक g(Df) = c·g और संयोजन ∇(Df) = ∇(α) उत्पन्न करता है, जहां g विहित फिशर अभियोग मात्रिक है, ∇(ए) α-संयोजन है, c = ƒ′′(1), और α = 3 + 2ƒ′′′(1)/ƒ′′(1) है।

उदाहरण
दो सबसे महत्वपूर्ण अपसरण सापेक्ष एंट्रॉपी (कुल्बैक-लीब्लर अपसरण, केएल अपसरण) हैं, जो अभियोग सिद्धांत और आंकड़ों के लिए केंद्रीय है, और स्क्वायर यूक्लिडियन दूरी (एसईडी)। अधिकतम एंट्रॉपी और कम से कम वर्गों के सिद्धांत के माध्यम से, विशेष रूप से लॉजिस्टिक प्रतिगमन और रैखिक प्रतिगमन में, इन दो भिन्नताओं को कम करना मुख्य तरीका है कि रैखिक प्रतिलोम समस्या हल हो जाती है।

अपसरण के दो सबसे महत्वपूर्ण वर्ग हैं एफ-अपसरण और ब्रैगमैन अपसरण; हालाँकि, साहित्य में अन्य प्रकार के अपसरण कार्यों का भी सामना करना पड़ता है। कुल्बैक-लीब्लर अपसरण एकमात्र अपसरण है जो एक एफ-अपसरण और ब्रैगमैन अपसरण दोनों है; चुकता यूक्लिडियन अपसरण एक ब्रेगमैन अपसरण है (फलन के अनुरूप $x^2$), लेकिन f-अपसरण नहीं है।

f अपसरण
उत्तल कार्य $$f:[0, \infty)\to (-\infty, \infty]$$ ऐसे दिया गया है कि $$f(0) = \lim_{t\to 0^+}f(t), f(1) = 0$$, $$f$$ द्वारा उत्पन्न एफ-अपसरण निम्न रूप में परिभाषित किया जाता है

D_f(p, q) = \int p(x)f\bigg(\frac{q(x)}{p(x)}\bigg) dx $$

ब्रैगमैन भिन्नता
ब्रैगमैन भिन्नता उत्तल सम्मुच्चय पर उत्तल कार्यों के अनुरूप हैं। एक दृढ़तः उत्तल कार्य दिया गया है, निरंतर भिन्न कार्य $F$ एक उत्तल सम्मुच्चय पर, जिसे ब्रैगमैन जनित्र के रूप में जाना जाता है, ब्रैगमैन अपसरण उत्तलता को मापता है: p पर मान के सन्निकटन के रूप में q से F के रैखिक सन्निकटन की त्रुटि निम्न है:
 * $$D_F(p, q) = F(p)-F(q)-\langle \nabla F(q), p-q\rangle. $$

ब्रैगमैन अपसरण के लिए दोहरी अपसरण मूल अपसरण के ब्रैगमैन जनित्र के उत्तल संयुग्म F* द्वारा उत्पन्न अपसरण है। उदाहरण के लिए, यूक्लिडियन दूरी के वर्ग के लिए, जनित्र $x^2$ है, जबकि सापेक्ष एंट्रॉपी के लिए जनित्र ऋणात्मक एंट्रॉपी अभिलेख $x \log x$ है।

इतिहास
अपसरण शब्द का उपयोग - यह किस प्रकार के कार्यों को संदर्भित करता है, और विभिन्न सांख्यिकीय दूरियों को क्या कहा जाता है - समय के साथ महत्वपूर्ण रूप से भिन्न होता है, लेकिन सी. 2000 द्वारा अभियोग ज्यामिति के भीतर, विशेष रूप से पाठ्यपुस्तक  में वर्तमान उपयोग पर तय किया गया था.

एक सांख्यिकीय दूरी के लिए अपसरण शब्द का उपयोग अनौपचारिक रूप से c. 1910 से c. 1940 से विभिन्न संदर्भों में किया गया था। इसका औपचारिक उपयोग कम से कम दिनांकित है, उनके संभाव्यता वितरण द्वारा परिभाषित दो सांख्यिकीय आबादी के बीच अपसरण के माप पर आख्यायुक्त है, जो भट्टाचार्य दूरी को परिभाषित करता है, और, दो बहुराष्ट्रीय आबादी के बीच अपसरण के माप पर आख्यायुक्त है, जिसने भट्टाचार्य कोण को परिभाषित किया।  और पाठ्यपुस्तक  में कुल्बैक-लीब्लर अपसरण के लिए इसके उपयोग से यह शब्द लोकप्रिय हुआ। अपसरण शब्द का प्रयोग सामान्यतः  सांख्यिकीय दूरियों के लिए किया जाता था। सांख्यिकीय दूरियों के पूर्व उपयोग  और  के अनेक संदर्भ में दिए गए हैं।

वस्तुतः सममित अपसरण को संदर्भित करने के लिए अपसरण का उपयोग किया गया था (यह फलन पहले से ही 1948 में हेरोल्ड जेफरीस द्वारा परिभाषित और उपयोग किया गया था), भेदभाव के लिए औसत जानकारी ... प्रति अवलोकन के रूप में असममित कार्य को व्यक्त करते हुए, जबकि  असममित कार्य को निर्देशित अपसरण के रूप में संदर्भित करता है।  सामान्यतः इस तरह के एक फलन को अपसरण के गुणांक के रूप में संदर्भित किया जाता है, और दिखाया गया है कि कई मौजूदा कार्यों को f-अपसरण के रूप में व्यक्त किया जा सकता है, जेफरीस के फलन को जेफरीस के अपसरण के उपाय (आज जेफरीस अपसरण), और कुल्बैक-लीब्लर के असममित फलन (प्रत्येक दिशा में) कुलबैक और लीब्लर के भेदभावपूर्ण जानकारी के उपायों के रूप में (आज कुल्बैक-लीब्लर अपसरण) संदर्भित किया गया है। ।

अपसरण की अभियोग ज्यामिति परिभाषा (इस लेख का विषय) को प्रारम्भ में अर्ध-दूरी सहित वैकल्पिक शब्दों द्वारा संदर्भित किया गया था और कंट्रास्ट फलन, हालांकि अपसरण का उपयोग किया गया था  के लिए $α$-अपसरण, और सामान्य वर्ग के लिए मानक बन गया है।

अपसरण शब्द एक दूरी (मात्रिक) के विपरीत है, क्योंकि सममित अपसरण त्रिभुज असमानता को संतुष्ट नहीं करता है। उदाहरण के लिए, ब्रैगमैन दूरी शब्द अभी भी पाया जाता है, लेकिन ब्रैगमैन अपसरण अब पसंद किया जाता है।

सांकेतिक रूप से, ने उनके असममित कार्य को $$I(1:2)$$ निरूपित किया, जबकि  उनके कार्यों  'd' को $$d\left(P_1, P_2\right)$$के रूप में दर्शाता है।

यह भी देखें

 * सांख्यिकीय दूरी

ग्रन्थसूची

 * . Republished by Dover Publications in 1968; reprinted in 1978: ISBN 0-8446-5625-9
 * . Republished by Dover Publications in 1968; reprinted in 1978: ISBN 0-8446-5625-9
 * . Republished by Dover Publications in 1968; reprinted in 1978: ISBN 0-8446-5625-9
 * . Republished by Dover Publications in 1968; reprinted in 1978: ISBN 0-8446-5625-9
 * . Republished by Dover Publications in 1968; reprinted in 1978: ISBN 0-8446-5625-9
 * . Republished by Dover Publications in 1968; reprinted in 1978: ISBN 0-8446-5625-9
 * . Republished by Dover Publications in 1968; reprinted in 1978: ISBN 0-8446-5625-9
 * . Republished by Dover Publications in 1968; reprinted in 1978: ISBN 0-8446-5625-9
 * . Republished by Dover Publications in 1968; reprinted in 1978: ISBN 0-8446-5625-9
 * . Republished by Dover Publications in 1968; reprinted in 1978: ISBN 0-8446-5625-9
 * . Republished by Dover Publications in 1968; reprinted in 1978: ISBN 0-8446-5625-9
 * . Republished by Dover Publications in 1968; reprinted in 1978: ISBN 0-8446-5625-9
 * . Republished by Dover Publications in 1968; reprinted in 1978: ISBN 0-8446-5625-9
 * . Republished by Dover Publications in 1968; reprinted in 1978: ISBN 0-8446-5625-9