हेलिंगर दूरी

संभाव्यता सिद्धांत और गणितीय आंकड़ों में, हेलिंगर दूरी (भट्टाचार्य दूरी से निकटता से संबंधित, हालांकि अलग) का उपयोग दो संभाव्यता वितरणों के बीच समानता को मापने के लिए किया जाता है। यह एक प्रकार का f-डाइवर्जेंस|f-डाइवर्जेंस है। हेलिंगर दूरी को हेलिंगर अभिन्न के संदर्भ में परिभाषित किया गया है, जिसे 1909 में अर्नेस्ट हेलिंगर द्वारा पेश किया गया था। इसे कभी-कभी जेफ़्रीज़ दूरी भी कहा जाता है।

माप सिद्धांत
माप सिद्धांत के संदर्भ में हेलिंगर दूरी को परिभाषित करने के लिए, आइए $$P$$ और $$Q$$ माप स्थान पर दो संभाव्यता मापों को निरूपित करें $$\mathcal{X}$$ यह एक सहायक माप के संबंध में पूर्ण निरंतरता है $$\lambda$$. ऐसा उपाय हमेशा मौजूद रहता है, उदा $$\lambda = (P + Q)$$. हेलिंगर के वर्ग के बीच की दूरी $$P$$ और $$Q$$ मात्रा के रूप में परिभाषित किया गया है


 * $$H^2(P,Q) = \frac{1}{2}\displaystyle \int_{\mathcal{X}} \left(\sqrt{p(x)} - \sqrt{q(x)}\right)^2 \lambda(dx). $$

यहाँ, $$P(dx) = p(x)\lambda(dx)$$ और $$Q(dx) = q(x) \lambda(dx)$$, अर्थात। $$p$$ और $$q$$ के संबंध में क्रमशः पी और क्यू के रेडॉन-निकोडिम डेरिवेटिव हैं $$\lambda$$. यह परिभाषा निर्भर नहीं करती $$\lambda$$, यानी पी और क्यू के बीच हेलिंगर दूरी नहीं बदलती है $$\lambda$$ को एक अलग संभाव्यता माप के साथ प्रतिस्थापित किया जाता है जिसके संबंध में P और Q दोनों बिल्कुल निरंतर हैं। सघनता के लिए, उपरोक्त सूत्र को अक्सर इस प्रकार लिखा जाता है


 * $$H^2(P,Q) = \frac{1}{2}\int_{\mathcal{X}} \left(\sqrt{P(dx)} - \sqrt{Q(dx)}\right)^2. $$

लेब्सेग माप का उपयोग कर संभाव्यता सिद्धांत
प्रारंभिक संभाव्यता सिद्धांत के संदर्भ में हेलिंगर दूरी को परिभाषित करने के लिए, हम λ को लेबेस्ग माप के रूप में लेते हैं, ताकि dP / dλ और dQ / dλ केवल संभाव्यता घनत्व फ़ंक्शन हों। यदि हम घनत्वों को क्रमशः एफ और जी के रूप में निरूपित करते हैं, तो वर्ग हेलिंगर दूरी को मानक कैलकुलस इंटीग्रल के रूप में व्यक्त किया जा सकता है


 * $$H^2(f,g) =\frac{1}{2}\int \left(\sqrt{f(x)} - \sqrt{g(x)}\right)^2 \, dx = 1 - \int \sqrt{f(x) g(x)} \, dx,$$

जहां दूसरा रूप वर्ग का विस्तार करके और इस तथ्य का उपयोग करके प्राप्त किया जा सकता है कि इसके डोमेन पर संभाव्यता घनत्व का अभिन्न अंग 1 के बराबर है।

हेलिंगर दूरी H(P,Q) संपत्ति को संतुष्ट करती है (कॉची-श्वार्ज़ असमानता#L2|कॉची-श्वार्ज़ असमानता से व्युत्पन्न)


 * $$0\le H(P,Q) \le 1.$$

असतत वितरण
दो असतत संभाव्यता वितरणों के लिए $$P=(p_1, \ldots, p_k)$$ और $$Q=(q_1, \ldots, q_k)$$, उनकी हेलिंगर दूरी को इस प्रकार परिभाषित किया गया है



H(P, Q) = \frac{1}{\sqrt{2}} \; \sqrt{\sum_{i=1}^k (\sqrt{p_i} - \sqrt{q_i})^2}, $$ जो सीधे तौर पर वर्गमूल सदिशों के अंतर की यूक्लिडियन दूरी से संबंधित है, अर्थात।

H(P, Q) = \frac{1}{\sqrt{2}} \; \bigl\|\sqrt{P} - \sqrt{Q} \bigr\|_2. $$ भी, $$ 1 - H^2(P,Q) = \sum_{i=1}^k \sqrt{p_i q_i}. $$

गुण
हेलिंगर दूरी किसी दिए गए संभाव्यता स्थान पर संभाव्यता वितरण के फ़ंक्शन स्थान पर एक बंधा हुआ कार्य मीट्रिक (गणित) बनाती है।

अधिकतम दूरी 1 तब प्राप्त होती है जब P प्रत्येक सेट के लिए संभाव्यता शून्य निर्दिष्ट करता है, जिस पर Q सकारात्मक संभावना निर्दिष्ट करता है, और इसके विपरीत।

कभी-कभी कारक $$1/\sqrt{2}$$ अभिन्न के सामने छोड़ दिया गया है, इस स्थिति में हेलिंगर की दूरी शून्य से दो के वर्गमूल तक होती है।

हेलिंगर दूरी भट्टाचार्य दूरी से संबंधित है $$BC(P,Q)$$ जैसा कि इसे परिभाषित किया जा सकता है


 * $$H(P,Q) = \sqrt{1 - BC(P,Q)}.$$

हेलिंजर दूरियों का उपयोग अनुक्रमिक विश्लेषण और स्पर्शोन्मुख सांख्यिकी के सिद्धांत में किया जाता है। दो सामान्य वितरणों के बीच वर्गाकार हेलिंगर दूरी $$ P \sim \mathcal{N}(\mu_1,\sigma_1^2)$$ और $$ Q \sim \mathcal{N}(\mu_2,\sigma_2^2)$$ है:

H^2(P, Q) = 1 - \sqrt{\frac{2\sigma_1\sigma_2}{\sigma_1^2+\sigma_2^2}} \, e^{-\frac{1}{4}\frac{(\mu_1-\mu_2)^2}{\sigma_1^2+\sigma_2^2}}. $$ दो बहुभिन्नरूपी सामान्य वितरणों के बीच वर्गाकार हेलिंगर दूरी $$ P \sim \mathcal{N}(\mu_1,\Sigma_1)$$ और $$ Q \sim \mathcal{N}(\mu_2,\Sigma_2)$$ है

H^2(P, Q) = 1 - \frac{ \det (\Sigma_1)^{1/4} \det (\Sigma_2) ^{1/4}} { \det \left( \frac{\Sigma_1 + \Sigma_2}{2}\right)^{1/2} } \exp\left\{-\frac{1}{8}(\mu_1 - \mu_2)^T \left(\frac{\Sigma_1 + \Sigma_2}{2}\right)^{-1} (\mu_1 - \mu_2) \right\} $$ दो घातीय वितरणों के बीच वर्गाकार हेलिंगर दूरी $$ P \sim \mathrm{Exp}(\alpha)$$ और $$ Q \sim \mathrm{Exp}(\beta)$$ है:
 * $$H^2(P, Q) = 1 - \frac{2 \sqrt{\alpha \beta}}{\alpha + \beta}.$$

दो वेइबुल वितरणों के बीच वर्गाकार हेलिंगर दूरी $$ P \sim \mathrm{W}(k,\alpha)$$ और $$ Q \sim \mathrm{W}(k,\beta)$$ (कहाँ $$ k $$ एक सामान्य आकार पैरामीटर है और $$ \alpha\,, \beta $$ क्रमशः स्केल पैरामीटर हैं):
 * $$ H^2(P, Q) = 1 - \frac{2 (\alpha \beta)^{k/2}}{\alpha^k + \beta^k}. $$

दर मापदंडों के साथ दो पॉइसन वितरणों के बीच वर्गाकार हेलिंगर दूरी $$\alpha$$ और $$\beta$$, ताकि $$ P \sim \mathrm{Poisson}(\alpha)$$ और $$ Q \sim \mathrm{Poisson}(\beta)$$, है:
 * $$ H^2(P,Q) = 1-e^{-\frac{1}{2} (\sqrt{\alpha} - \sqrt{\beta})^2}. $$

दो बीटा वितरणों के बीच वर्गाकार हेलिंगर दूरी $$ P \sim \text{Beta}(a_1,b_1)$$ और $$ Q \sim \text{Beta}(a_2, b_2)$$ है:
 * $$H^2(P,Q) = 1 - \frac{B\left(\frac{a_1 + a_2}{2}, \frac{b_1 + b_2}{2}\right)}{\sqrt{B(a_1, b_1) B(a_2, b_2)}}$$

कहाँ $$B$$ बीटा फ़ंक्शन है.

दो गामा वितरणों के बीच वर्गाकार हेलिंगर दूरी $$ P \sim \text{Gamma}(a_1,b_1)$$ और $$ Q \sim \text{Gamma}(a_2, b_2)$$ है:
 * $$H^2(P,Q) = 1 - \Gamma\left({\scriptstyle\frac{a_1 + a_2}{2}}\right)\left(\frac{b_1+b_2}{2}\right)^{-(a_1+a_2)/2}\sqrt{\frac{b_1^{a_1}b_2^{a_2}}{\Gamma(a_1)\Gamma(a_2)}}$$

कहाँ $$\Gamma$$ गामा फ़ंक्शन है.

कुल भिन्नता दूरी के साथ संबंध
हेलिंगर दूरी $$H(P,Q)$$ और कुल भिन्नता दूरी (या सांख्यिकीय दूरी) $$\delta(P,Q)$$ इस प्रकार संबंधित हैं:

H^2(P,Q) \leq \delta(P,Q) \leq \sqrt{2}H(P,Q)\,. $$ इस असमानता में स्थिरांक आपके द्वारा चुने गए पुनर्सामान्यीकरण के आधार पर बदल सकते हैं ($$1/2$$ या $$1/\sqrt{2}$$).

ये असमानताएं एलपी स्पेस#परिमित आयामों में पी-मानदंड|1-मानदंड और एलपी स्थान#परिमित आयामों में पी-मानदंड|2-मानदंड के बीच की असमानताओं से तुरंत उत्पन्न होती हैं।

यह भी देखें

 * सांख्यिकीय दूरी
 * कुल्बैक-लीब्लर विचलन
 * भट्टाचार्य दूरी
 * कुल भिन्नता दूरी
 * फिशर सूचना मीट्रिक