मानक त्रुटि

From Vigyanwiki
Revision as of 19:50, 28 March 2023 by alpha>Shikhav
एक निष्पक्ष सामान्य वितरण त्रुटि के साथ मानकनमूना किए गए मान के लिए, उपरोक्त नमूनों के अनुपात को दर्शाता है जो वास्तविक मान से ऊपर और नीचे 0, 1, 2 और 3 मानक विचलन के बीच गिरेंगे।


एक आंकड़े की मानक त्रुटि (एसई)[1] (सामान्यतः एक सांख्यिकीय पैरामीटर का अनुमान) इसके नमूनाकरण वितरण का मानक विचलन [2] या उस मानक विचलन का अनुमान है। यदि आँकड़ा मानकनमूना माध्य है, तो इसे माध्य (एसईएम) की मानक त्रुटि कहा जाता है।[1]

माध्य का प्रतिचयन वितरण एक ही जनसंख्या से बार-बार प्रतिचयन द्वारा उत्पन्न होता है और प्रतिदर्श माध्य की रिकॉर्डिंग प्राप्त होती है। यह विभिन्न साधनों का वितरण बनाता है, और इस वितरण का अपना माध्य और विचरण होता है। गणितीय रूप से, प्राप्त मानकनमूना माध्य वितरण का विचरण मानकनमूना आकार द्वारा विभाजित जनसंख्या के विचरण के बराबर है। ऐसा इसलिए है क्योंकि जैसे-जैसे सैंपल का आकार बढ़ता है, सैंपल का मतलब जनसंख्या माध्य के आसपास अधिक बारीकी से क्लस्टर होता है।

इसलिए, माध्य की मानक त्रुटि और मानक विचलन के बीच संबंध ऐसा है कि, किसी दिए गए नमूने के आकार के लिए, माध्य की मानक त्रुटि मानकनमूना आकार के वर्गमूल से विभाजित मानक विचलन के बराबर होती है।[1]दूसरे शब्दों में, माध्य की मानक त्रुटि जनसंख्या माध्य के आसपास मानकनमूना माध्य के फैलाव का माप है।

प्रतिगमन विश्लेषण में, शब्द मानक त्रुटि या तो घटे हुए ची-स्क्वायर आँकड़ों के वर्गमूल या किसी विशेष प्रतिगमन गुणांक के लिए मानक त्रुटि (जैसा कि, कहते हैं, विश्वास अंतराल में उपयोग किया जाता है) को संदर्भित करता है।

मानकनमूना माध्य की मानक त्रुटि

सटीक मूल्य

मान लीजिए कि एक सांख्यिकीय रूप से स्वतंत्र मानकनमूना है टिप्पणियों के मानक विचलन के साथ एक सांख्यिकीय जनसंख्या से लिया जाता है . नमूने से परिकलित माध्य मान, , माध्य पर संबद्ध मानक त्रुटि होगी, , द्वारा दिए गए:[1]

.

व्यावहारिक रूप से यह हमें बताता है कि कारक के कारण जनसंख्या माध्य के मूल्य का अनुमान लगाने का प्रयास करते समय , अनुमान पर त्रुटि को दो के कारक से कम करने के लिए नमूने में चार गुना अधिक अवलोकन प्राप्त करने की आवश्यकता होती है; इसे दस के कारक से कम करने के लिए सौ गुना अधिक अवलोकन की आवश्यकता होती है।

अनुमान

मानक विचलन मानकनमूना ली जा रही जनसंख्या का शायद ही कभी पता चलता है। इसलिए, माध्य की मानक त्रुटि को सामान्यतः प्रतिस्थापित करके अनुमानित किया जाता है मानक विचलन के साथ # सही मानकनमूना मानक विचलन बजाय:

.

चूंकि यह वास्तविक मानक त्रुटि के लिए केवल एक अनुमानक है, यहां अन्य अंकन देखना आम है जैसे:

या वैकल्पिक रूप से .

भ्रम का एक सामान्य स्रोत तब होता है जब स्पष्ट रूप से अंतर करने में विफल रहता है:

  • जनसंख्या का मानक विचलन (),
  • नमूने का मानक विचलन (),
  • माध्य का मानक विचलन (, जो मानक त्रुटि है), और
  • माध्य के मानक विचलन का अनुमानक (, जो सबसे अधिक बार गणना की जाने वाली मात्रा है, और इसे अक्सर बोलचाल की भाषा में मानक त्रुटि भी कहा जाता है)।

अनुमानक की शुद्धता

जब मानकनमूना आकार छोटा होता है, तो जनसंख्या के वास्तविक मानक विचलन के बजाय नमूने के मानक विचलन का उपयोग करने से जनसंख्या मानक विचलन को व्यवस्थित रूप से कम करके आंका जाएगा, और इसलिए मानक त्रुटि भी। N = 2 के साथ, अवमूल्यन लगभग 25% है, लेकिन n = 6 के लिए, अवमूल्यन केवल 5% है। गुरलैंड और त्रिपाठी (1971) इस आशय के लिए एक सुधार और समीकरण प्रदान करते हैं।[3] सोकाल और रोहल्फ़ (1981) n <20 के छोटे नमूनों के लिए सुधार कारक का एक समीकरण देते हैं।[4] आगे की चर्चा के लिए मानक विचलन का निष्पक्ष अनुमान देखें।

व्युत्पत्ति

माध्य पर मानक त्रुटि स्वतंत्र यादृच्छिक चर के योग के विचरण से प्राप्त की जा सकती है,[5] प्रसरण#प्रसरण की परिभाषा और उसके कुछ सरल प्रसरण#गुण दिए गए हैं। अगर हैं माध्य के साथ जनसंख्या से स्वतंत्र नमूने और मानक विचलन , तो हम कुल परिभाषित कर सकते हैं

जो प्रसरण के कारण#असंबद्ध चरों का योग (Bienaymé सूत्र)|Bienaymé सूत्र, में विचरण होगा

जहां हमने जनसंख्या के मानक विचलन के लिए सर्वोत्तम मूल्य के साथ माप के मानक विचलन, यानी अनिश्चितताओं का अनुमान लगाया है। इन मापों का माध्य द्वारा ही दिया जाता है

.

माध्य का विचरण तब है

मानक त्रुटि, परिभाषा के अनुसार, का मानक विचलन है जो केवल विचरण का वर्गमूल है:

.

सहसंबद्ध यादृच्छिक चर के लिए मार्कोव श्रृंखला केंद्रीय सीमा प्रमेय के अनुसार मानकनमूना भिन्नता की गणना की जानी चाहिए।

=== यादृच्छिक मानकनमूना आकार === के साथ स्वतंत्र और समान रूप से वितरित यादृच्छिक चर ऐसे मामले होते हैं जब एक मानकनमूना पहले से जाने बिना लिया जाता है कि कितने अवलोकन किसी मानदंड के अनुसार स्वीकार्य होंगे। ऐसे मामलों में, मानकनमूना आकार एक यादृच्छिक चर है जिसकी भिन्नता की भिन्नता में जुड़ जाती है ऐसा है कि,

[6]

अगर एक पॉसॉन वितरण है, फिर अनुमानक के साथ . इसलिए का अनुमानक बन जाता है , मानक त्रुटि के लिए निम्नलिखित सूत्र का नेतृत्व करते हैं:

(चूँकि मानक विचलन प्रसरण का वर्गमूल है)

छात्र सन्निकटन जब σ मान अज्ञात है

कई व्यावहारिक अनुप्रयोगों में, σ का सही मान अज्ञात है। नतीजतन, हमें एक वितरण का उपयोग करने की आवश्यकता है जो खाते में संभावित σ के फैलाव को ध्यान में रखता है। जब सही अंतर्निहित वितरण गॉसियन के रूप में जाना जाता है, हालांकि अज्ञात σ के साथ, तब परिणामी अनुमानित वितरण छात्र टी-वितरण का अनुसरण करता है। मानक त्रुटि छात्र t-वितरण का मानक विचलन है। टी-वितरण गॉसियन से थोड़ा अलग हैं, और नमूने के आकार के आधार पर भिन्न होते हैं। छोटे नमूने कुछ हद तक जनसंख्या मानक विचलन को कम आंकने की संभावना रखते हैं और इसका एक मतलब है जो वास्तविक जनसंख्या माध्य से भिन्न होता है, और गॉसियन की तुलना में कुछ भारी पूंछ के साथ इन घटनाओं की संभावना के लिए छात्र टी-वितरण खाता है। छात्र टी-वितरण की मानक त्रुटि का अनुमान लगाने के लिए σ के बजाय मानकनमूना मानक विचलन s का उपयोग करना पर्याप्त है, और हम विश्वास अंतराल की गणना करने के लिए इस मान का उपयोग कर सकते हैं।

नोट: विद्यार्थी का t-वितरण|छात्र का प्रायिकता बंटन गाऊसी वितरण द्वारा अच्छी तरह से अनुमानित होता है जब मानकनमूना आकार 100 से अधिक होता है। ऐसे नमूनों के लिए बाद वाले वितरण का उपयोग किया जा सकता है, जो बहुत सरल है।

धारणाएं और उपयोग

कैसे का एक उदाहरण अज्ञात जनसंख्या माध्य के विश्वास अंतराल बनाने के लिए प्रयोग किया जाता है। यदि मानकनमूना वितरण सामान्य वितरण है, तो मानकनमूना माध्य, मानक त्रुटि, और सामान्य वितरण की मात्राओं का उपयोग सही जनसंख्या माध्य के लिए विश्वास अंतराल की गणना के लिए किया जा सकता है। निम्नलिखित अभिव्यक्तियों का उपयोग ऊपरी और निचली 95% विश्वास सीमा की गणना करने के लिए किया जा सकता है, जहाँ मानकनमूना माध्य के बराबर है, मानकनमूना माध्य के लिए मानक त्रुटि के बराबर है, और 1.96 सामान्य वितरण के 97.5 प्रतिशतक बिंदु का अनुमानित मान है:

ऊपरी 95% सीमा और
95% की सीमा कम करें

विशेष रूप से, एक मानकनमूना आँकड़ा (जैसे मानकनमूना माध्य) की मानक त्रुटि उस प्रक्रिया में मानकनमूना माध्य का वास्तविक या अनुमानित मानक विचलन है जिसके द्वारा इसे उत्पन्न किया गया था। दूसरे शब्दों में, यह प्रतिदर्श आँकड़ों के प्रतिचयन वितरण का वास्तविक या अनुमानित मानक विचलन है। मानक त्रुटि के लिए अंकन SE, SEM (माप या माध्य की मानक त्रुटि के लिए), या S में से कोई एक हो सकता हैE.

मानक त्रुटियाँ एक मूल्य में अनिश्चितता के सरल उपाय प्रदान करती हैं और अक्सर इसका उपयोग किया जाता है क्योंकि:

  • कई मामलों में, यदि कई अलग-अलग मात्राओं की मानक त्रुटि ज्ञात है, तो मात्राओं के कुछ फ़ंक्शन (गणित) की मानक त्रुटि की आसानी से गणना की जा सकती है;
  • जब मूल्य का संभाव्यता वितरण ज्ञात हो, तो इसका उपयोग सटीक विश्वास अंतराल की गणना के लिए किया जा सकता है;
  • जब प्रायिकता वितरण अज्ञात हो, तो चेबीशेव की असमानता या वायसोचान्स्की-पेटुनिन असमानता | वैसोचान्स्की-पेटुनिन असमानताओं का उपयोग रूढ़िवादी विश्वास अंतराल की गणना के लिए किया जा सकता है; और
  • जैसा कि मानकनमूना आकार अनंत की ओर जाता है, केंद्रीय सीमा प्रमेय गारंटी देता है कि माध्य का मानकनमूना वितरण असमान रूप से सामान्य वितरण है।

माध्य बनाम मानक विचलन की मानक त्रुटि

वैज्ञानिक और तकनीकी साहित्य में, प्रयोगात्मक डेटा को अक्सर या तो मानकनमूना डेटा के माध्य और मानक विचलन या मानक त्रुटि के साथ माध्य का उपयोग करके संक्षेपित किया जाता है। यह अक्सर उनके विनिमेयता के बारे में भ्रम पैदा करता है। हालाँकि, माध्य और मानक विचलन वर्णनात्मक आँकड़े हैं, जबकि माध्य की मानक त्रुटि यादृच्छिक नमूनाकरण प्रक्रिया का वर्णनात्मक है। मानकनमूना डेटा का मानक विचलन माप में भिन्नता का विवरण है, जबकि माध्य की मानक त्रुटि एक संभाव्य कथन है कि कैसे मानकनमूना आकार केंद्रीय सीमा के आलोक में जनसंख्या माध्य के अनुमानों पर बेहतर सीमा प्रदान करेगा। प्रमेय।[7] सीधे शब्दों में कहें, मानकनमूना माध्य की मानक त्रुटि इस बात का अनुमान है कि जनसंख्या माध्य से मानकनमूना माध्य कितनी दूर होने की संभावना है, जबकि नमूने का मानक विचलन वह डिग्री है जो नमूने के भीतर के व्यक्ति मानकनमूना माध्य से भिन्न होते हैं।[8] यदि जनसंख्या मानक विचलन परिमित है, तो नमूने के माध्य की मानक त्रुटि बढ़ते नमूने के आकार के साथ शून्य हो जाएगी, क्योंकि जनसंख्या के अनुमान में सुधार होगा, जबकि नमूने का मानक विचलन जनसंख्या मानक का अनुमान लगाएगा मानकनमूना आकार बढ़ने पर विचलन।

एक्सटेंशन

परिमित जनसंख्या सुधार (एफपीसी)

मानक त्रुटि के लिए ऊपर दिया गया सूत्र मानता है कि जनसंख्या अनंत है। फिर भी, यह अक्सर परिमित आबादी के लिए उपयोग किया जाता है, जब लोग उस प्रक्रिया को मापने में रुचि रखते हैं जो मौजूदा परिमित आबादी का निर्माण करती है (इसे एक विश्लेषणात्मक और गणनात्मक सांख्यिकीय अध्ययन कहा जाता है)। हालांकि उपरोक्त सूत्र बिल्कुल सही नहीं है जब जनसंख्या परिमित है, परिमित- और अनंत-जनसंख्या संस्करणों के बीच का अंतर छोटा होगा जब मानकनमूना अंश छोटा होगा (उदाहरण के लिए परिमित जनसंख्या का एक छोटा अनुपात अध्ययन किया जाता है)। इस मामले में लोग अक्सर परिमित जनसंख्या के लिए सही नहीं होते हैं, अनिवार्य रूप से इसे लगभग अनंत जनसंख्या के रूप में मानते हैं।

यदि कोई मौजूदा परिमित जनसंख्या को मापने में रुचि रखता है जो समय के साथ नहीं बदलेगा, तो जनसंख्या के आकार के लिए समायोजित करना आवश्यक है (जिसे विश्लेषणात्मक और गणनात्मक सांख्यिकीय अध्ययन कहा जाता है)। जब एक विश्लेषणात्मक और गणनात्मक सांख्यिकीय अध्ययन में मानकनमूना अंश (अक्सर एफ कहा जाता है) बड़ा (लगभग 5% या अधिक) होता है, तो मानक त्रुटि का अनुमान परिमित जनसंख्या सुधार से गुणा करके ठीक किया जाना चाहिए। (उर्फ: 'FPC'):[9] [10]

जो, बड़े एन के लिए:

आबादी के एक बड़े प्रतिशत के करीब नमूने लेने से प्राप्त अतिरिक्त सटीकता के लिए खाता। FPC का प्रभाव यह है कि त्रुटि शून्य हो जाती है जब मानकनमूना आकार n जनसंख्या आकार N के बराबर होता है।

यह सर्वेक्षण पद्धति में तब होता है जब मानकनमूना नमूनाकरण (सांख्यिकी)#चयनित इकाइयों का प्रतिस्थापन। यदि प्रतिस्थापन के साथ मानकनमूना लिया जाता है, तो एफपीसी काम में नहीं आता है।

नमूने में सहसंबंध के लिए सुधार

File:SampleBiasCoefficient.png
मानकनमूना पूर्वाग्रह गुणांक ρ के साथ n डेटा बिंदुओं के नमूने के लिए A के माध्य में अपेक्षित त्रुटि। निष्पक्ष 'मानक त्रुटि' लॉग-लॉग ढलान -½ के साथ ρ = 0 विकर्ण रेखा के रूप में प्लॉट करती है।

यदि मापी गई मात्रा A के मान सांख्यिकीय रूप से स्वतंत्र नहीं हैं, लेकिन पैरामीटर स्पेस 'x' में ज्ञात स्थानों से प्राप्त किए गए हैं, तो माध्य की वास्तविक मानक त्रुटि का एक निष्पक्ष अनुमान (वास्तव में मानक विचलन भाग पर एक सुधार) द्वारा प्राप्त किया जा सकता है नमूने की गणना की गई मानक त्रुटि को कारक f से गुणा करना:

जहां मानकनमूना पूर्वाग्रह गुणांक ρ व्यापक रूप से इस्तेमाल किया जाने वाला प्रैस-विन्स्टन अनुमान है। यह अनुमानित सूत्र मध्यम से बड़े मानकनमूना आकार के लिए है; संदर्भ किसी भी मानकनमूना आकार के लिए सटीक सूत्र देता है, और इसे वॉल स्ट्रीट स्टॉक कोट्स जैसी भारी स्वतः सहसंबद्ध समय श्रृंखला पर लागू किया जा सकता है। इसके अलावा, यह सूत्र सकारात्मक और नकारात्मक ρ के लिए समान रूप से काम करता है।[11] अधिक चर्चा के लिए मानक विचलन का निष्पक्ष अनुमान भी देखें। <!- जब यह अधिक अर्थपूर्ण हो तो टिप्पणी हटा दें

मानक त्रुटियां

यह भी देखें

संदर्भ

  1. 1.0 1.1 1.2 1.3 Altman, Douglas G; Bland, J Martin (2005-10-15). "मानक विचलन और मानक त्रुटियां". BMJ: British Medical Journal. 331 (7521): 903. doi:10.1136/bmj.331.7521.903. ISSN 0959-8138. PMC 1255808. PMID 16223828.
  2. Everitt, B. S. (2003). कैम्ब्रिज डिक्शनरी ऑफ स्टैटिस्टिक्स. CUP. ISBN 978-0-521-81099-9.
  3. Gurland, J; Tripathi RC (1971). "मानक विचलन के निष्पक्ष अनुमान के लिए एक सरल सन्निकटन". American Statistician. 25 (4): 30–32. doi:10.2307/2682923. JSTOR 2682923.
  4. Sokal; Rohlf (1981). Biometry: Principles and Practice of Statistics in Biological Research (2nd ed.). p. 53. ISBN 978-0-7167-1254-1.
  5. Hutchinson, T. P. (1993). Essentials of Statistical Methods, in 41 pages. Adelaide: Rumsby. ISBN 978-0-646-12621-0.
  6. Cornell, J R, and Benjamin, C A, Probability, Statistics, and Decisions for Civil Engineers, McGraw-Hill, NY, 1970, ISBN 0486796094, pp. 178–9.
  7. Barde, M. (2012). "What to use to express the variability of data: Standard deviation or standard error of mean?". Perspect. Clin. Res. 3 (3): 113–116. doi:10.4103/2229-3485.100662. PMC 3487226. PMID 23125963.
  8. Wassertheil-Smoller, Sylvia (1995). Biostatistics and Epidemiology : A Primer for Health Professionals (Second ed.). New York: Springer. pp. 40–43. ISBN 0-387-94388-9.
  9. Isserlis, L. (1918). "On the value of a mean as calculated from a sample". Journal of the Royal Statistical Society. 81 (1): 75–81. doi:10.2307/2340569. JSTOR 2340569. (Equation 1)
  10. Bondy, Warren; Zlot, William (1976). "The Standard Error of the Mean and the Difference Between Means for Finite Populations". The American Statistician. 30 (2): 96–97. doi:10.1080/00031305.1976.10479149. JSTOR 2683803. (Equation 2)
  11. Bence, James R. (1995). "Analysis of Short Time Series: Correcting for Autocorrelation". Ecology. 76 (2): 628–639. doi:10.2307/1941218. JSTOR 1941218.