हेलिंगर दूरी

प्रायिकता सिद्धांत और गणितीय आंकड़ों में, हेलिंगर दूरी (भट्टाचार्य दूरी से निकटता से संबंधित, यद्यपि भिन्न) का उपयोग दो प्रायिकता वितरणों के बीच समानता को मापने के लिए किया जाता है। यह एक प्रकार का f-भिन्नता है। अतः हेलिंगर दूरी को हेलिंगर समाकलन के संदर्भ में परिभाषित किया गया है, जिसे 1909 में अर्नेस्ट हेलिंगर द्वारा पूर्ण रूप से प्रस्तुत किया गया था।

इस प्रकार से इसे कभी-कभी जेफ़्रीज़ दूरी भी कहा जाता है।

माप सिद्धांत
अतः माप सिद्धांत के संदर्भ में हेलिंगर दूरी को परिभाषित करने के लिए, $$P$$ और $$Q$$ को माप समष्टि $$\mathcal{X}$$ पर दो प्रायिकता मापों को निरूपित करने दें जो सहायक माप $$\lambda$$ के संबंध में पूर्ण निरंतरता हैं। ऐसा माप सदैव स्थित रहता है, इस प्रकार से उदाहरण के लिए $$\lambda = (P + Q)$$। $$P$$ और $$Q$$ के बीच हेलिंगर दूरी का वर्ग मात्रा


 * $$H^2(P,Q) = \frac{1}{2}\displaystyle \int_{\mathcal{X}} \left(\sqrt{p(x)} - \sqrt{q(x)}\right)^2 \lambda(dx) $$ के रूप में पूर्ण रूप से परिभाषित किया गया है।

यहाँ, $$P(dx) = p(x)\lambda(dx)$$ और $$Q(dx) = q(x) \lambda(dx)$$, अर्थात $$p$$ और $$q$$, $$\lambda$$ के संबंध में क्रमशः P और Q के रेडॉन-निकोडिम व्युत्पन्न हैं। अतः यह परिभाषा $$\lambda$$ पर निर्भर नहीं करती है,अर्थात P और Q के बीच हेलिंगर दूरी नहीं बदलती है यदि $$\lambda$$ को एक अलग प्रायिकता माप के साथ प्रतिस्थापित किया जाता है जिसके संबंध में P और Q दोनों पूर्ण निरंतरता हैं। इस प्रकार से सघनता के लिए, उपरोक्त सूत्र को प्रातः


 * $$H^2(P,Q) = \frac{1}{2}\int_{\mathcal{X}} \left(\sqrt{P(dx)} - \sqrt{Q(dx)}\right)^2 $$ के रूप में पूर्ण रूप से लिखा जाता है।

लेब्सेग माप का उपयोग कर प्रायिकता सिद्धांत
अतः प्रारंभिक प्रायिकता सिद्धांत के संदर्भ में हेलिंगर दूरी को परिभाषित करने के लिए, हम λ को लेबेस्ग माप के रूप में लेते हैं, ताकि dP / dλ और dQ / dλ मात्र प्रायिकता घनत्व फलन हों। इस प्रकार से यदि हम घनत्वों को क्रमशः f और g के रूप में निरूपित करते हैं, तो वर्ग हेलिंगर दूरी को मानक गणना समाकल


 * $$H^2(f,g) =\frac{1}{2}\int \left(\sqrt{f(x)} - \sqrt{g(x)}\right)^2 \, dx = 1 - \int \sqrt{f(x) g(x)} \, dx$$

के रूप में निरूपित करते हैं, जहां दूसरा रूप वर्ग का विस्तार करके और इस तथ्य का उपयोग करके प्राप्त किया जा सकता है कि इसके डोमेन पर प्रायिकता घनत्व का अभिन्न अंग 1 के बराबर है।

इस प्रकार से हेलिंगर दूरी H(P,Q) गुण (कॉची-श्वार्ज़ असमानता से व्युत्पन्न)


 * $$0\le H(P,Q) \le 1$$ को पूर्ण रूप से संतुष्ट करती है।

असतत वितरण
अतः दो असतत प्रायिकता वितरणों $$P=(p_1, \ldots, p_k)$$ और $$Q=(q_1, \ldots, q_k)$$ के लिए, उनकी हेलिंगर दूरी को



H(P, Q) = \frac{1}{\sqrt{2}} \; \sqrt{\sum_{i=1}^k (\sqrt{p_i} - \sqrt{q_i})^2}, $$ के रूप में परिभाषित किया गया है, जो प्रत्यक्षतः वर्गमूल सदिश के अंतर के यूक्लिडियन दूरी से संबंधित है, अर्थात

H(P, Q) = \frac{1}{\sqrt{2}} \; \bigl\|\sqrt{P} - \sqrt{Q} \bigr\|_2. $$ भी, $$ 1 - H^2(P,Q) = \sum_{i=1}^k \sqrt{p_i q_i}. $$

गुण
इस प्रकार से हेलिंगर दूरी किसी दिए गए प्रायिकता समष्टि पर प्रायिकता वितरण के फलन समष्टि पर एक परिबद्ध फलन माप (गणित) बनाती है।

अतः अधिकतम दूरी 1 तब प्राप्त होती है जब P प्रत्येक समुच्चय के लिए प्रायिकता शून्य निर्दिष्ट करता है, जिस पर Q धनात्मक प्रायिकता को पूर्ण रूप से निर्दिष्ट करता है, और इसके विपरीत होता है।

इस प्रकार से कभी-कभी समाकलन के सामने कारक $$1/\sqrt{2}$$ को छोड़ दिया जाता है, ऐसी स्थिति में हेलिंगर की दूरी शून्य से दो के वर्गमूल तक होती है।

अतः हेलिंगर दूरी भट्टाचार्य दूरी $$BC(P,Q)$$ से संबंधित है क्योंकि इसे


 * $$H(P,Q) = \sqrt{1 - BC(P,Q)}$$ के रूप में पूर्ण रूप से परिभाषित किया जा सकता है।

इस प्रकार से हेलिंजर दूरियों का उपयोग अनुक्रमिक विश्लेषण और स्पर्शोन्मुख सांख्यिकी के सिद्धांत में किया जाता है।

अतः दो सामान्य वितरणों $$ P \sim \mathcal{N}(\mu_1,\sigma_1^2)$$ और $$ Q \sim \mathcal{N}(\mu_2,\sigma_2^2)$$ के बीच वर्गाकार हेलिंगर दूरी है:

H^2(P, Q) = 1 - \sqrt{\frac{2\sigma_1\sigma_2}{\sigma_1^2+\sigma_2^2}} \, e^{-\frac{1}{4}\frac{(\mu_1-\mu_2)^2}{\sigma_1^2+\sigma_2^2}}. $$ दो बहुभिन्नरूपी सामान्य वितरणों $$ P \sim \mathcal{N}(\mu_1,\Sigma_1)$$ और $$ Q \sim \mathcal{N}(\mu_2,\Sigma_2)$$ के बीच वर्गाकार हेलिंगर दूरी है

H^2(P, Q) = 1 - \frac{ \det (\Sigma_1)^{1/4} \det (\Sigma_2) ^{1/4}} { \det \left( \frac{\Sigma_1 + \Sigma_2}{2}\right)^{1/2} } \exp\left\{-\frac{1}{8}(\mu_1 - \mu_2)^T \left(\frac{\Sigma_1 + \Sigma_2}{2}\right)^{-1} (\mu_1 - \mu_2) \right\} $$ इस प्रकार से दो घातीय वितरणों $$ P \sim \mathrm{Exp}(\alpha)$$ और $$ Q \sim \mathrm{Exp}(\beta)$$ के बीच वर्गाकार हेलिंगर दूरी है:
 * $$H^2(P, Q) = 1 - \frac{2 \sqrt{\alpha \beta}}{\alpha + \beta}.$$

अतः दो वेइबुल वितरणों के बीच वर्गाकार हेलिंगर दूरी $$ P \sim \mathrm{W}(k,\alpha)$$ और $$ Q \sim \mathrm{W}(k,\beta)$$ (जहाँ $$ k $$ एक सामान्य आकार पैरामीटर है और $$ \alpha\,, \beta $$ क्रमशः माप पैरामीटर हैं):
 * $$ H^2(P, Q) = 1 - \frac{2 (\alpha \beta)^{k/2}}{\alpha^k + \beta^k}. $$

दर मापदंडों $$\alpha$$ और $$\beta$$ के साथ दो पॉइसन वितरणों के बीच वर्गाकार हेलिंगर दूरी, ताकि $$ P \sim \mathrm{Poisson}(\alpha)$$ और $$ Q \sim \mathrm{Poisson}(\beta)$$, है:
 * $$ H^2(P,Q) = 1-e^{-\frac{1}{2} (\sqrt{\alpha} - \sqrt{\beta})^2}. $$

इस प्रकार से दो बीटा वितरणों के बीच वर्गाकार हेलिंगर दूरी $$ P \sim \text{Beta}(a_1,b_1)$$ और $$ Q \sim \text{Beta}(a_2, b_2)$$ है:
 * $$H^2(P,Q) = 1 - \frac{B\left(\frac{a_1 + a_2}{2}, \frac{b_1 + b_2}{2}\right)}{\sqrt{B(a_1, b_1) B(a_2, b_2)}}$$

जहाँ $$B$$ बीटा फलन है।

अतः दो गामा वितरणों $$ P \sim \text{Gamma}(a_1,b_1)$$ और $$ Q \sim \text{Gamma}(a_2, b_2)$$ के बीच वर्गाकार हेलिंगर दूरी है:
 * $$H^2(P,Q) = 1 - \Gamma\left({\scriptstyle\frac{a_1 + a_2}{2}}\right)\left(\frac{b_1+b_2}{2}\right)^{-(a_1+a_2)/2}\sqrt{\frac{b_1^{a_1}b_2^{a_2}}{\Gamma(a_1)\Gamma(a_2)}}$$

जहाँ $$\Gamma$$ गामा फलन है।

कुल भिन्नता दूरी के साथ संबंध
इस प्रकार से हेलिंगर दूरी $$H(P,Q)$$ और कुल भिन्नता दूरी (या सांख्यिकीय दूरी) $$\delta(P,Q)$$ इस प्रकार संबंधित हैं:

H^2(P,Q) \leq \delta(P,Q) \leq \sqrt{2}H(P,Q)\,. $$ अतः इस असमानता में स्थिरांक इस पर निर्भर हो सकते हैं कि आप कौन सा पुनर्सामान्यीकरण ($$1/2$$ या $$1/\sqrt{2}$$) पूर्ण रूप से चुनते हैं।

इस प्रकार से ये असमानताएं 1-मानदंड और 2-मानदंड के बीच की असमानताओं से तुरंत उत्पन्न होती हैं।

यह भी देखें

 * सांख्यिकीय दूरी
 * कुल्बैक-लीब्लर विचलन
 * भट्टाचार्य दूरी
 * कुल भिन्नता दूरी
 * फिशर सूचना मापन