फैलाव का सूचकांक

संभाव्यता सिद्धांत और सांख्यिकी में, फैलाव का सूचकांक, फैलाव सूचकांक, फैलाव का गुणांक, सापेक्ष भिन्नता, या भिन्नता-से-माध्य अनुपात (वीएमआर), भिन्नता के गुणांक की तरह, संभाव्यता वितरण के सांख्यिकीय फैलाव का एक सामान्यीकरण (सांख्यिकी) उपाय है: यह मात्रा निर्धारित करने के लिए उपयोग किया जाने वाला एक उपाय है मानक सांख्यिकीय मॉडल की तुलना में देखी गई घटनाओं का एक सेट क्लस्टर या फैला हुआ है या नहीं।

इसे विचरण के अनुपात के रूप में परिभाषित किया गया है $$\sigma^2$$ मतलब के लिए $$\mu$$,
 * $$D = {\sigma^2 \over \mu }.$$

इसे फ़ैनो फ़ैक्टर के रूप में भी जाना जाता है, हालांकि यह शब्द कभी-कभी विंडो डेटा के लिए आरक्षित होता है (माध्य और विचरण की गणना उप-जनसंख्या पर की जाती है), जहां फैलाव के सूचकांक का उपयोग विशेष मामले में किया जाता है जहां विंडो अनंत है. विंडोइंग डेटा अक्सर किया जाता है: वीएमआर की गणना अक्सर समय के विभिन्न अंतरालों या अंतरिक्ष के छोटे क्षेत्रों में की जाती है, जिसे विंडोज़ कहा जा सकता है, और परिणामी आंकड़े को फैनो फैक्टर कहा जाता है।

इसे केवल तभी परिभाषित किया जाता है जब माध्य हो $$\mu$$ गैर-शून्य है, और आम तौर पर इसका उपयोग केवल सकारात्मक आंकड़ों के लिए किया जाता है, जैसे घटनाओं के बीच डेटा या समय की गणना करना, या जहां अंतर्निहित वितरण को घातीय वितरण या पॉइसन वितरण माना जाता है।

शब्दावली
इस संदर्भ में, देखे गए डेटासेट में पूर्वनिर्धारित घटनाओं के घटित होने का समय शामिल हो सकता है, जैसे किसी दिए गए क्षेत्र में किसी दिए गए परिमाण से अधिक भूकंप, या किसी दिए गए प्रजाति के पौधों के भौगोलिक स्थान में स्थान। ऐसी घटनाओं का विवरण पहले समान आकार के समय- या स्थान-क्षेत्रों के प्रत्येक सेट में घटनाओं या घटनाओं की संख्या की गणना में परिवर्तित किया जाता है।

उपरोक्त गणनाओं के लिए फैलाव सूचकांक को परिभाषित करता है। अंतरालों के लिए फैलाव सूचकांक के लिए एक अलग परिभाषा लागू होती है, जहां उपचारित मात्राएं घटनाओं के बीच के समय-अंतराल की लंबाई हैं। सामान्य उपयोग यह है कि फैलाव सूचकांक का अर्थ गिनती के लिए फैलाव सूचकांक है।

व्याख्या
कुछ वितरण, विशेष रूप से पॉइसन वितरण, में समान भिन्नता और माध्य होता है, जिससे उन्हें VMR = 1 मिलता है। ज्यामितीय वितरण और नकारात्मक द्विपद वितरण में VMR > 1 होता है, जबकि द्विपद वितरण में VMR <1 होता है, और निरंतर यादृच्छिक चर होता है वीएमआर = 0. इससे निम्नलिखित तालिका प्राप्त होती है: इसे विलक्षणता (गणित) द्वारा शंकु वर्गों के वर्गीकरण के अनुरूप माना जा सकता है; विवरण के लिए कुछ असतत संभाव्यता वितरणों के Cumulant#Cumulant देखें।

फैलाव सूचकांक की प्रासंगिकता यह है कि इसका मान 1 होता है जब किसी अंतराल में घटनाओं की संख्या का संभाव्यता वितरण एक पॉइसन वितरण होता है। इस प्रकार माप का उपयोग यह आकलन करने के लिए किया जा सकता है कि क्या देखे गए डेटा को पॉइसन प्रक्रिया का उपयोग करके मॉडल किया जा सकता है। जब फैलाव का गुणांक 1 से कम होता है, तो एक डेटासेट को कम-फैला हुआ कहा जाता है: यह स्थिति घटना के पैटर्न से संबंधित हो सकती है जो पॉइसन प्रक्रिया से जुड़ी यादृच्छिकता से अधिक नियमित होती है। उदाहरण के लिए, नियमित, आवधिक घटनाओं को कम फैलाया जाएगा। यदि फैलाव का सूचकांक 1 से बड़ा है, तो एक डेटासेट को अति-फैलाव|अति-फैला हुआ कहा जाता है।

फैलाव सूचकांक के एक नमूना-आधारित अनुमान का उपयोग मॉडल की पर्याप्तता के लिए एक औपचारिक सांख्यिकीय परिकल्पना परीक्षण के निर्माण के लिए किया जा सकता है कि गिनती की एक श्रृंखला पॉइसन वितरण का पालन करती है। अंतराल-गिनती के संदर्भ में, अति-फैलाव, पॉइसन वितरण की तुलना में कम गिनती के साथ अधिक अंतराल और उच्च गिनती के साथ अधिक अंतराल से मेल खाता है: इसके विपरीत, कम-फैलाव की विशेषता अधिक अंतराल होने से होती है, जिसकी गिनती करीब होती है पॉइसन वितरण की तुलना में माध्य गणना।

वीएमआर किसी दी गई घटना की यादृच्छिकता की डिग्री का भी एक अच्छा माप है। उदाहरण के लिए, इस तकनीक का उपयोग आमतौर पर मुद्रा प्रबंधन में किया जाता है।

उदाहरण
बेतरतीब ढंग से फैलने वाले कणों (एक प्रकार कि गति) के लिए, किसी दिए गए आयतन के अंदर कणों की संख्या का वितरण पॉइसोनियन है, यानी वीएमआर = 1। इसलिए, यह आकलन करने के लिए कि क्या दिया गया स्थानिक पैटर्न (यह मानते हुए कि आपके पास इसे मापने का एक तरीका है) पूरी तरह से प्रसार के कारण है या यदि कुछ कण-कण संपर्क शामिल है: अंतरिक्ष को पैच, क्वाड्रेट या नमूना इकाइयों (एसयू) में विभाजित करें, गिनती करें प्रत्येक पैच या एसयू में व्यक्तियों की संख्या, और वीएमआर की गणना करें। 1 से काफी अधिक वीएमआर एक क्लस्टर्ड वितरण को दर्शाता है, जहां आकर्षक अंतर-कण क्षमता को कम करने के लिए यादृच्छिक चलना पर्याप्त नहीं है।

इतिहास
पॉइसन या द्विपद वितरण से विचलन का पता लगाने के लिए परीक्षण के उपयोग पर चर्चा करने वाला पहला व्यक्ति 1877 में लेक्सिस था। उनके द्वारा विकसित परीक्षणों में से एक लेक्सिस अनुपात था।

वनस्पति विज्ञान में इस सूचकांक का प्रयोग पहली बार 1936 में आर्थर रॉय क्लैफम द्वारा किया गया था।

यदि चर को पॉइसन वितरित किया जाता है तो फैलाव का सूचकांक χ के रूप में वितरित किया जाता है2 n के साथ आँकड़ा - 1 स्वतंत्रता की डिग्री जब n बड़ा हो और μ > 3 हो। रुचि के कई मामलों के लिए यह अनुमान सटीक है और फिशर ने 1950 में इसके लिए एक सटीक परीक्षण निकाला।

पॉल जी. होएल ने इसके वितरण के पहले चार क्षणों का अध्ययन किया। उन्होंने पाया कि χ का सन्निकटन2 आँकड़ा उचित है यदि μ > 5.

तिरछा वितरण
अत्यधिक विषम वितरणों के लिए, द्विघात वितरण के विपरीत, रैखिक हानि फ़ंक्शन का उपयोग करना अधिक उपयुक्त हो सकता है। इस मामले में फैलाव का अनुरूप गुणांक डेटा के माध्यिका से माध्यिका तक औसत पूर्ण विचलन का अनुपात है, या, प्रतीकों में:


 * $$ CD = \frac{1}{n}\frac{\sum_j{|m - x_j|}}{ m } $$ जहाँ n नमूना आकार है, m नमूना माध्यिका है और पूरे नमूने पर लिया गया योग है। आयोवा, न्यूयॉर्क (राज्य) और दक्षिण डकोटा बकाया करों का अनुमान लगाने के लिए फैलाव के इस रैखिक गुणांक का उपयोग करते हैं।

दो-नमूना परीक्षण के लिए, जिसमें नमूना आकार बड़े होते हैं, दोनों नमूनों में एक ही माध्यिका होती है, और इसके चारों ओर फैलाव में भिन्नता होती है, फैलाव के रैखिक गुणांक के लिए एक आत्मविश्वास अंतराल निम्न से घिरा होता है


 * $$ \frac{t_a}{t_b}\exp{\left(-\sqrt{z_\alpha \left( \operatorname{var} \left[ \log \left( \frac{t_a} {t_b} \right) \right] \right)}\right)}$$

जहां टीj j का माध्य निरपेक्ष विचलन हैवेंनमूना और zαआत्मविश्वास α के सामान्य वितरण के लिए विश्वास अंतराल की लंबाई है (उदाहरण के लिए, α = 0.05, z के लिए)α= 1.96).

यह भी देखें

 * डेटा गिनें
 * अनुकूल माध्य

समान अनुपात

 * गुणांक का परिवर्तन, $$\sigma/\mu$$
 * मानकीकृत क्षण, $$\mu_k/\sigma^k$$
 * फैनो फैक्टर, $$\sigma^2_W/\mu_W$$ (विंडोड वम्र)
 * शोर अनुपात करने के लिए संकेत, $$\mu/\sigma$$ ( संकेत आगे बढ़ाना में)