फैलाव का सूचकांक

संभाव्यता सिद्धांत और सांख्यिकी में, फैलाव का सूचकांक,और फैलाव का गुणांक, सापेक्ष भिन्नता, या भिन्नता-से-माध्य अनुपात (वीएमआर), भिन्नता के गुणांक की प्रकार, संभाव्यता वितरण के सांख्यिकीय फैलाव का सामान्यीकरण (सांख्यिकी) उपाय है, यह मात्रा निर्धारित करने के लिए उपयोग किया जाता है मानक सांख्यिकीय नमूना की समानता में देखी गई घटनाओं का सेट क्लस्टर फैला हुआ है या फैला हुआ नहीं है।

इसे विचरण $$\sigma^2$$ के अनुपात $$\mu$$ के रूप में परिभाषित किया जाता है,
 * $$D = {\sigma^2 \over \mu }.$$

इसे फ़ैनो फ़ैक्टर के रूप में भी जाना जाता है, चूंकि यह शब्द कभी-कभी विंडो डेटा के लिए सुरक्षित रखा जाता है इसलिए (माध्य और विचरण की गणना उप-जनसंख्या पर की जाती है), जहां फैलाव के सूचकांक का उपयोग विशेष स्थितियों में किया जाता है जहां विंडो अनंत है इसलिए विंडोइंग डेटा को विंडोवड करना अधिकांशतः किया जाता है: VMR की गणना अधिकांशतः समय के विभिन्न अंतरालों या अंतरिक्ष के छोटे क्षेत्रों में की जाती है, जिसे विंडोज़ कहा जा सकता है, और परिणामी आंकड़े को फैनो फैक्टर कहा जाता है।

इसे केवल तभी परिभाषित किया जाता है जब माध्य $$\mu$$ गैर-शून्य हो, और सामान्यतः इसका उपयोग केवल सकारात्मक आंकड़ों के लिए किया जाता है, जैसे घटनाओं के बीच डेटा या समय की गणना करना, या अंतर्निहित वितरण को घातीय वितरण या पॉइसन वितरण माना जाता है।

शब्दावली
इस संदर्भ में, देखे गए डेटासेट में पूर्व निर्धारित घटनाओं के घटित होने का समय सम्मलित हो सकता है, जैसे कि निश्चित क्षेत्र में होने वाले भूकंपों की घटनाओं के समय या निश्चित प्रजाति के पौधों के भूगोलीय अंतरिक्ष में स्थान, संख्या के रूप में परिवर्तित किए जाते हैं। इस तरह की घटनाओं के आयतन की गणना की जाती है, जिसमें समान आकार के समय- या स्थान-क्षेत्रों में प्रत्येक घटनाओं या घटनाओं की संख्या की गणना की जाती है।

इसलिए उपरोक्त गणनाओं के लिए फैलाव सूचकांक को परिभाषित करता है। अंतरालों के लिए फैलाव सूचकांक के लिए अलग परिभाषा लागू होती है, जहां संख्याओं की विस्तार होती है, जिन्हें घटनाओं के बीच समय-अंतराल की लंबाई के रूप में देखा जाता है। सामान्यतः उपयोग किया जाने वाला शब्द "फैलाव सूचकांक" गिनती के लिए फैलाव सूचकांक का अर्थ होता है।

व्याख्या
कुछ वितरण, विशेष रूप से पॉइसन वितरण में फैलाव और माध्य समान होता है, जिसके कारण उनका VMR = 1 होता है। ज्यामितीय वितरण और नकारात्मक द्विपद वितरण में VMR > 1 होता है, चूँकि द्विपद वितरण में VMR <1 होता है, और निरंतर यादृच्छिक चर VMR = 0 होता है। इससे निम्नलिखित तालिका प्राप्त होती है: इसे विलक्षणता (गणित) के लिए शंकु वर्गों के वर्गीकरण के अनुरूप माना जा सकता है; विवरण के लिए कुछ असतत संभाव्यता वितरणों के संचयी देखें गए है।

फैलाव सूचकांक की प्रासंगिकता यह है कि जब अंतराल में घटनाओं की संभावना वितरण पॉइसन वितरण होता है, तो यह 1 का मान रखता है। इस प्रकार माप का उपयोग किया जा सकता है ताकि देखा गया डेटा को पॉइसन प्रक्रिया का उपयोग करके नमूना किया जा सकता है। जब फैलाव सूचकांक 1 से कम होता है, तो डेटासेट को "अविस्पंशित" कहा जाता है: यह स्थिति पॉइसन प्रक्रिया के साथ संबद्ध यादृच्छिकता की समानता में नियमितता वाले प्रायिकताओं से संबंधित हो सकती है। उदाहरण के लिए, नियमित, आवर्ती घटनाएं अविस्पंशित होंगी। अगर फैलाव सूचकांक 1 से अधिक होता है, तो डेटासेट "अधिक विस्पंशित" कहलाता है।

फैलाव सूचकांक के नमूना-आधारित अनुमान का उपयोग नमूना की पर्याप्तता के लिए औपचारिक सांख्यिकीय परिकल्पना परीक्षण के निर्माण के लिए किया जा सकता है इसलिए गिनती की श्रृंखला पॉइसन वितरण का पालन करती है। जिससे अंतराल-गिनती के संदर्भ में, अति-फैलाव, पॉइसन वितरण की समानता में कम गिनती के साथ अधिक अंतराल और उच्च गिनती के साथ अधिक अंतराल से मेल खाता है: इसके विपरीत, कम-फैलाव की विशेषता अधिक अंतराल होने से होती है, जिसकी गिनती करीब होती है पॉइसन वितरण की समानता में माध्य गणना होती है ।

VMR किसी दी गई घटना की यादृच्छिकता की डिग्री का भी अच्छा माप है। उदाहरण के लिए, इस कार्यपद्धति का उपयोग सामान्यतः मुद्रा प्रबंधन में किया जाता है।

उदाहरण
यदि यादृच्छिक रूप से फैली हुई कणों ( प्रकार कि गति) के लिए, दिए गए आयतन में कणों की संख्या का वितरण पॉइसोनियन होता है, अर्थात् VMR=1 होता है। इसलिए, यदि आपके पास उसे मापने का तरीका होता है, तो यह निर्धारित करने के लिए कि क्या दिए गए आवर्तन में किसी कण-कण के बीच कुछ प्रभावशीलता सम्मलित है या नहीं: स्थान को पैचों, चतुष्कोणों या नमूना इकाइयों (SU) में विभाजित करें, प्रत्येक पैच या SU में व्यक्तियों की संख्या गणना करें, और VMR की गणना करें। 1 से काफी अधिक VMR के द्वारा पुष्टि की जाती है कि वहां क्लस्टर वितरण है, जहां संयोजक कण-कण की आकर्षक शक्ति को स्मोथर करने के लिए यादृच्छिक चलन पर पर्याप्त नहीं होता है।

इतिहास
पॉइसन या द्विपद वितरण से विचलन का पता लगाने के लिए परीक्षण के उपयोग पर चर्चा करने वाला पहला व्यक्ति 1877 में लेक्सिस था। उनके द्वारा विकसित परीक्षणों में से लेक्सिस अनुपात था।

इस सूचकांक का पहली बार वनस्पति विज्ञान में 1936 में आर्थर रॉय क्लैफम ने उपयोग किया था।

यदि विविधताएँ पॉइसन वितरित हैं, तो फैलाव का सूचकांक χ2 सांख्यिकी है जिसकी n - 1 स्वतंत्रता संख्या होती है जब n बड़ा होता है और μ > 3 होता है। बहुत सारे स्थितियों के लिए यह अनुमान त्रुटिहीन होता है और 1950 में फिशर ने इसके लिए त्रुटिहीन परीक्षा निर्धारित की थी।

पॉल जी. होएल ने इसके वितरण के पहले चार केंद्रीय विसंगतियों का अध्ययन किया था। उन्होंने पाया कि यदि μ > 5 है तो χ2 सांख्यिकी के प्रतिनिधित्व के लिए अनुमान उचित होता है।

विषम वितरण
जिससे अत्यधिक विषम वितरणों के लिए, द्विघात वितरण के विपरीत, रैखिक हानि फ़ंक्शन का उपयोग करना अधिक उपयुक्त हो सकता है। इस स्थितियों में फैलाव का अनुरूप गुणांक डेटा के माध्यिका से माध्यिका तक माध्य पूर्ण विचलन का अनुपात है, या, प्रतीकों में प्रयोग किया जाता है:


 * $$ CD = \frac{1}{n}\frac{\sum_j{|m - x_j|}}{ m } $$

यहाँ n नमूना का आकार है, m नमूना माध्यिका है और यह समूह पर कुल योग किया जाता है। आयोवा, न्यूयॉर्क (राज्य) और दक्षिण डकोटा बकाया करों का अनुमान लगाने के लिए फैलाव के इस रैखिक गुणांक का उपयोग करते हैं।

दो-नमूना परीक्षण के लिए, जिसमें नमूना आकार बड़े होते हैं, दोनों नमूनों का समान माध्यिका होती है, और उसके चारों ओर विस्तार में अंतर होता है, रैखिक CD के लिए विश्वसनीयता अंतराल निम्न द्वारा सीमित होता है:


 * $$ \frac{t_a}{t_b}\exp{\left(-\sqrt{z_\alpha \left( \operatorname{var} \left[ \log \left( \frac{t_a} {t_b} \right) \right] \right)}\right)}$$

यहाँ tj ,jth नमूने की माध्य वास्तविकता है और zαआत्मविश्वास α के लिए सामान्य वितरण विश्वसनीयता अंतराल की लंबाई है (उदाहरण के लिए, α = 0.05,और zα= 1.96 होता है)|

यह भी देखें

 * डेटा गिनें
 * अनुकूल माध्य

समान अनुपात

 * गुणांक का परिवर्तन, $$\sigma/\mu$$
 * मानकीकृत क्षण, $$\mu_k/\sigma^k$$
 * फैनो फैक्टर, $$\sigma^2_W/\mu_W$$ (विंडोड वम्र)
 * शोर अनुपात करने के लिए संकेत, $$\mu/\sigma$$ ( संकेत आगे बढ़ाना में)