दिशात्मक सांख्यिकी

दिशात्मक आँकड़े (वृत्ताकार आँकड़े या गोलाकार आँकड़े भी) आँकड़ों की उपशाखा है जो दिशा (ज्यामिति) (यूक्लिडियन अंतरिक्ष, आर में इकाई वैक्टर) से संबंधित है।n), कार्तीय समन्वय प्रणाली (रेखा (ज्यामिति) 'आर' में मूल के माध्यम सेn) या 'R' में घुमावएन. अधिक आम तौर पर, दिशात्मक आँकड़े कॉम्पैक्ट रीमैनियन कई गुना पर टिप्पणियों से संबंधित होते हैं, जिसमें स्टिफ़ेल कई गुना भी शामिल है।

तथ्य यह है कि 0 डिग्री (कोण)कोण) और 360 डिग्री समान कोण हैं, इसलिए उदाहरण के लिए 180 डिग्री 2 डिग्री और 358 डिग्री का समझदार औसत नहीं है, एक उदाहरण प्रदान करता है कि कुछ प्रकार के डेटा के विश्लेषण के लिए विशेष सांख्यिकीय विधियों की आवश्यकता होती है (इस मामले में, कोणीय डेटा)। डेटा के अन्य उदाहरण जिन्हें दिशात्मक माना जा सकता है, उनमें अस्थायी अवधियों (जैसे दिन, सप्ताह, महीने, वर्ष, आदि का समय), कम्पास दिशाएं, अणुओं में डायहेड्रल कोण, अभिविन्यास, घूर्णन आदि शामिल हैं।

परिपत्र वितरण
कोई प्रायिकता घनत्व फ़ंक्शन (पीडीएफ) $$\ p(x)$$ लाइन पर लपेटा जा सकता है वितरण | इकाई त्रिज्या के एक वृत्त की परिधि के चारों ओर लपेटा गया। यानी लपेटे हुए चर का पीडीएफ $$\theta = x_w=x \bmod 2\pi\ \ \in (-\pi,\pi]$$ है $$p_w(\theta) = \sum_{k=-\infty}^{\infty}{p(\theta+2\pi k)}.$$ इस अवधारणा को बहुभिन्नरूपी संदर्भ में साधारण योग के विस्तार से विस्तारित किया जा सकता है $$F$$ राशियाँ जो फीचर स्पेस में सभी आयामों को कवर करती हैं: $$p_w(\boldsymbol\theta) = \sum_{k_1=-\infty}^{\infty} \cdots \sum_{k_F=-\infty}^\infty {p(\boldsymbol\theta + 2\pi k_1\mathbf{e}_1 + \dots + 2\pi k_F\mathbf{e}_F)}$$ कहाँ $$\mathbf{e}_k = (0, \dots, 0, 1, 0, \dots, 0)^{\mathsf{T}}$$ है $$k$$-वें यूक्लिडियन आधार वेक्टर।

निम्नलिखित खंड कुछ प्रासंगिक परिपत्र वितरण दिखाते हैं।

वॉन माईस सर्कुलर वितरण
वॉन मिज़ वितरण एक परिपत्र वितरण है, जो किसी भी अन्य परिपत्र वितरण की तरह, सर्कल के चारों ओर एक निश्चित रैखिक संभाव्यता वितरण के आवरण के रूप में सोचा जा सकता है। वॉन मिज़ वितरण के लिए अंतर्निहित रैखिक संभाव्यता वितरण गणितीय रूप से अट्रैक्टिव है; हालाँकि, सांख्यिकीय उद्देश्यों के लिए, अंतर्निहित रैखिक वितरण से निपटने की कोई आवश्यकता नहीं है। वॉन मिज़ वितरण की उपयोगिता दो गुना है: यह सभी परिपत्र वितरणों का सबसे गणितीय रूप से ट्रैक्टेबल है, जो सरल सांख्यिकीय विश्लेषण की अनुमति देता है, और यह लिपटे सामान्य वितरण के करीब है, जो रैखिक सामान्य वितरण के अनुरूप है, महत्वपूर्ण है क्योंकि यह बड़ी संख्या में छोटे कोणीय विचलनों के योग के लिए सीमित मामला है। वास्तव में, वॉन मिज़ वितरण को अक्सर इसके उपयोग में आसानी और लिपटे सामान्य वितरण (फिशर, 1993) के साथ घनिष्ठ संबंध के कारण परिपत्र सामान्य वितरण के रूप में जाना जाता है।

वॉन माइस वितरण का पीडीएफ है: $$f(\theta;\mu,\kappa) = \frac{e^{\kappa\cos(\theta-\mu)}}{2\pi I_0(\kappa)}$$ कहाँ $$I_0$$ क्रम 0 का संशोधित बेसेल फलन है।

परिपत्र वर्दी वितरण
संभाव्यता घनत्व समारोह (पीडीएफ) परिपत्र वर्दी वितरण द्वारा दिया गया है $$U(\theta) = \frac 1 {2\pi}.$$ ऐसा भी सोचा जा सकता है $$\kappa = 0$$ ऊपर वॉन मिसेस का।

लपेटा हुआ सामान्य वितरण
रैप्ड नॉर्मल डिस्ट्रीब्यूशन (WN) का पीडीएफ है: $$ WN(\theta;\mu,\sigma) = \frac{1}{\sigma \sqrt{2\pi}} \sum^{\infty}_{k=-\infty} \exp \left[\frac{-(\theta - \mu - 2\pi k)^2}{2 \sigma^2} \right] = \frac{1}{2\pi}\vartheta\left(\frac{\theta-\mu}{2\pi},\frac{i\sigma^2}{2\pi}\right) $$ जहां μ और σ क्रमशः अलिखित वितरण का माध्य और मानक विचलन हैं, और $$\vartheta(\theta,\tau)$$ थीटा कार्य है: $$ \vartheta(\theta,\tau) = \sum_{n=-\infty}^\infty (w^2)^n q^{n^2} $$ कहाँ $$w \equiv e^{i\pi \theta}$$ और $$q \equiv e^{i\pi\tau}.$$

लपेटा कॉची वितरण
लिपटे कॉची वितरण (WC) का पीडीएफ है: $$WC(\theta;\theta_0,\gamma) = \sum_{n=-\infty}^\infty \frac{\gamma}{\pi(\gamma^2+(\theta+2\pi n-\theta_0)^2)} = \frac{1}{2\pi}\,\,\frac{\sinh\gamma}{\cosh\gamma-\cos(\theta-\theta_0)}$$ कहाँ $$\gamma$$ पैमाना कारक है और $$\theta_0$$ चरम स्थिति है।

लपेटा हुआ लेवी वितरण
रैप्ड लेवी डिस्ट्रीब्यूशन (डब्ल्यूएल) का पीडीएफ है: $$f_{WL}(\theta;\mu,c) = \sum_{n=-\infty}^\infty \sqrt{\frac{c}{2\pi}}\,\frac{e^{-c/2(\theta+2\pi n-\mu)}}{(\theta+2\pi n-\mu)^{3/2}}$$ जहां योग का मान शून्य माना जाता है जब $$\theta+2\pi n-\mu \le 0$$, $$c$$ पैमाना कारक है और $$\mu$$ स्थान पैरामीटर है।

उच्च-आयामी मैनिफोल्ड्स पर वितरण
द्वि-आयामी क्षेत्र (जैसे केंट वितरण) पर भी वितरण मौजूद हैं ), एन-क्षेत्र | एन-आयामी क्षेत्र (वॉन मिसेस-फिशर वितरण ) या टोरस्र्स  (द्विभाजित वॉन मिसेस वितरण ).

मिसेस-फिशर वितरण का मैट्रिक्स स्टिफ़ेल मैनिफोल्ड पर एक वितरण है, और इसका उपयोग रोटेशन मैट्रिक्स पर प्रायिकता वितरण के निर्माण के लिए किया जा सकता है। बिंगहैम वितरण N आयामों में अक्षों पर वितरण है, या समतुल्य रूप से, (N − 1)-आयामी क्षेत्र पर बिंदुओं पर पहचान किए गए एंटीपोड के साथ है। उदाहरण के लिए, यदि N = 2, अक्ष तल में उत्पत्ति के माध्यम से अप्रत्यक्ष रेखाएँ हैं। इस मामले में, प्रत्येक अक्ष विमान में यूनिट सर्कल (जो एक आयामी क्षेत्र है) को दो बिंदुओं पर काटता है जो एक दूसरे के एंटीपोड हैं। N = 4 के लिए, बिंगहैम वितरण इकाई चतुष्कोणों ( मैं मुड़ा ्स) के स्थान पर वितरण है। चूंकि छंद एक रोटेशन मैट्रिक्स से मेल खाता है, एन = 4 के लिए बिंघम वितरण का उपयोग मैट्रिक्स-वॉन मिसेस-फिशर वितरण की तरह, रोटेशन के स्थान पर संभाव्यता वितरण के निर्माण के लिए किया जा सकता है।

ये वितरण उदाहरण के लिए भूविज्ञान में उपयोग किए जाते हैं, क्रिस्टलोग्राफी और जैव सूचना विज्ञान।

क्षण
एक परिपत्र वितरण के कच्चे वेक्टर (या त्रिकोणमितीय) क्षणों को इस रूप में परिभाषित किया गया है



m_n=\operatorname E(z^n)=\int_\Gamma P(\theta) z^n \, d\theta $$ कहाँ $$\Gamma$$ लंबाई का कोई अंतराल है $$2\pi$$, $$P(\theta)$$ वृत्ताकार बंटन का प्रायिकता घनत्व फलन है, और $$z=e^{i \theta}$$. अभिन्न के बाद से $$P(\theta)$$ एकता है, और एकीकरण अंतराल परिमित है, यह इस प्रकार है कि किसी भी परिपत्र वितरण के क्षण हमेशा परिमित और अच्छी तरह से परिभाषित होते हैं।

नमूना क्षणों को समान रूप से परिभाषित किया गया है:



\overline{m}_n=\frac{1}{N}\sum_{i=1}^N z_i^n. $$ जनसंख्या परिणामी वेक्टर, लंबाई और माध्य कोण को संबंधित नमूना मापदंडों के अनुरूप परिभाषित किया गया है।



\rho=m_1 $$

R=|m_1| $$

\theta_n=\operatorname{Arg}(m_n). $$ इसके अलावा, उच्च क्षणों की लंबाई को इस प्रकार परिभाषित किया गया है:



R_n=|m_n| $$ जबकि उच्च क्षणों के कोणीय भाग न्यायसंगत हैं $$(n \theta_n) \bmod 2\pi$$. सभी क्षणों की लंबाई 0 और 1 के बीच होगी।

स्थान और प्रसार के उपाय
जनसंख्या और उस जनसंख्या से लिए गए नमूने दोनों के लिए केंद्रीय प्रवृत्ति और सांख्यिकीय फैलाव के विभिन्न उपायों को परिभाषित किया जा सकता है।

केंद्रीय प्रवृत्ति
स्थान का सबसे सामान्य माप वृत्ताकार माध्य है। जनसंख्या वृत्ताकार माध्य केवल वितरण का पहला क्षण है जबकि नमूना माध्य नमूने का पहला क्षण है। नमूना माध्य जनसंख्या माध्य के निष्पक्ष अनुमानक के रूप में काम करेगा।

जब डेटा केंद्रित होता है, तो माध्यिका और मोड को रैखिक मामले के सादृश्य द्वारा परिभाषित किया जा सकता है, लेकिन अधिक फैलाव या बहु-मोडल डेटा के लिए, ये अवधारणाएँ उपयोगी नहीं होती हैं।

फैलाव
सर्कुलर फैलाव के सबसे आम उपाय हैं:

\overline{\operatorname{Var}(z)} = 1 - \overline{R} $$ और आबादी के लिए $$ \operatorname{Var}(z) = 1 - R $$ दोनों के मान 0 और 1 के बीच होंगे। S(z) = \sqrt{\ln(1/R^2)} = \sqrt{-2\ln(R)} $$ $$ \overline{S}(z) = \sqrt{\ln(1/{\overline{R}}^2)} = \sqrt{-2\ln({\overline{R}})} $$ 0 और अनंत के बीच मानों के साथ। मानक विचलन की यह परिभाषा (विचरण के वर्गमूल के बजाय) उपयोगी है क्योंकि लपेटे हुए सामान्य वितरण के लिए, यह अंतर्निहित सामान्य वितरण के मानक विचलन का अनुमानक है। इसलिए यह मानक विचलन के छोटे मूल्यों के लिए परिपत्र वितरण को रैखिक मामले में मानकीकृत करने की अनुमति देगा। यह वॉन मिज़ वितरण पर भी लागू होता है जो लपेटे गए सामान्य वितरण के निकट अनुमानित है। ध्यान दें कि छोटे के लिए $$S(z)$$, अपने पास $$S(z)^2 = 2 \operatorname{Var}(z)$$. \overline{\delta}=\frac{1-{\overline{R}_2}}{2{\overline{R}}^2} $$ 0 और अनंत के बीच मानों के साथ। प्रसार का यह माप प्रसरण के सांख्यिकीय विश्लेषण में उपयोगी पाया गया है।
 * द. नमूने के लिए परिपत्र विचरण को इस प्रकार परिभाषित किया गया है: $$
 * द $$
 * द $$\delta = \frac{1-R_2}{2R^2}$$ $$

माध्य का वितरण
एन माप के एक सेट को देखते हुए $$z_n=e^{i\theta_n}$$ z का माध्य मान इस प्रकार परिभाषित किया गया है:



\overline{z}=\frac{1}{N}\sum_{n=1}^N z_n $$ जिसे व्यक्त किया जा सकता है



\overline{z} = \overline{C}+i\overline{S} $$ कहाँ



\overline{C} = \frac{1}{N}\sum_{n=1}^N \cos(\theta_n) \text{ and } \overline{S} = \frac{1}{N}\sum_{n=1}^N \sin(\theta_n) $$ या, वैकल्पिक रूप से:



\overline{z} = \overline{R}e^{i\overline{\theta}} $$ कहाँ



\overline{R} = \sqrt{{\overline{C}}^2+{\overline{S}}^2} \text{ and } \overline{\theta} = \arctan (\overline{S} / \overline{C}). $$ माध्य कोण का वितरण ($$\overline{\theta}$$) एक परिपत्र पीडीएफ के लिए पी (θ) द्वारा दिया जाएगा:



P(\overline{C},\overline{S}) \, d\overline{C} \, d\overline{S} = P(\overline{R},\overline{\theta}) \, d\overline{R} \, d\overline{\theta} = \int_\Gamma \cdots \int_\Gamma \prod_{n=1}^N \left[ P(\theta_n) \, d\theta_n \right] $$ कहाँ $$\Gamma$$ लंबाई के किसी भी अंतराल से अधिक है $$2\pi$$ और अभिन्न बाधा के अधीन है $$\overline{S}$$ और $$\overline{C}$$ स्थिर हैं, या, वैकल्पिक रूप से, वह $$\overline{R}$$ और $$\overline{\theta}$$ स्थिर हैं।

अधिकांश परिपत्र वितरणों के लिए माध्य के वितरण की गणना विश्लेषणात्मक रूप से संभव नहीं है, और विचरण का विश्लेषण करने के लिए, संख्यात्मक या गणितीय अनुमानों की आवश्यकता होती है।

नमूना साधनों के वितरण के लिए केंद्रीय सीमा प्रमेय लागू किया जा सकता है। (मुख्य लेख: दिशात्मक सांख्यिकी के लिए केंद्रीय सीमा प्रमेय)। इसे दिखाया जा सकता है कि वितरण $$[\overline{C},\overline{S}]$$ बड़े नमूना आकार की सीमा में एक द्विभाजित सामान्य वितरण तक पहुँचता है।

फिट और महत्व परीक्षण की अच्छाई
चक्रीय डेटा के लिए - (उदाहरण के लिए, क्या यह समान रूप से वितरित है):
 * एक अनिमॉडल क्लस्टर के लिए रेले परीक्षण
 * संभवतः मल्टीमॉडल डेटा के लिए कुइपर का परीक्षण।

यह भी देखें

 * परिपत्र सहसंबंध गुणांक
 * जटिल सामान्य वितरण
 * लपेटा हुआ वितरण

दिशात्मक सांख्यिकी पर पुस्तकें

 * बत्शेलेट, ई. सर्कुलर स्टैटिस्टिक्स इन बायोलॉजी, अकादमिक प्रेस, लंदन, 1981। ISBN 0-12-081050-6.
 * निकोलस फिशर (सांख्यिकीविद) | फिशर, एन.आई., सर्कुलर डेटा का सांख्यिकीय विश्लेषण, कैम्ब्रिज यूनिवर्सिटी प्रेस, 1993। ISBN 0-521-35018-2
 * निकोलस फिशर (सांख्यिकीविद्) | फिशर, एन.आई., लुईस, टी., एम्बलटन, बीजेजे। गोलाकार डेटा का सांख्यिकीय विश्लेषण, कैम्ब्रिज यूनिवर्सिटी प्रेस, 1993। ISBN 0-521-45699-1
 * जमालमदका एस. राव और सेनगुप्ता ए. परिपत्र सांख्यिकी में विषय, विश्व वैज्ञानिक, 2001। ISBN 981-02-3778-2
 * कांतिलाल मर्दिया|मर्दिया, के.वी. और जुप्प पी., डायरेक्शनल स्टैटिस्टिक्स (दूसरा संस्करण), जॉन विले एंड संस लिमिटेड, 2000। ISBN 0-471-95333-4
 * ले, सी. और वर्देबाउट, टी., मॉडर्न डायरेक्शनल स्टैटिस्टिक्स, सीआरसी प्रेस टेलर एंड फ्रांसिस ग्रुप, 2017। ISBN 978-1-4987-0664-3

श्रेणी:दिशात्मक आँकड़े श्रेणी:सांख्यिकीय डेटा प्रकार श्रेणी:सांख्यिकीय सिद्धांत श्रेणी:संभाव्यता वितरण के प्रकार