मानक त्रुटि
एक आंकड़े की मानक त्रुटि (एसई)[1] (सामान्यतः एक सांख्यिकीय पैरामीटर का अनुमान) इसके नमूनाकरण वितरण का मानक विचलन [2] या उस मानक विचलन का अनुमान है। यदि आँकड़ा मानक माध्य है, तो इसे माध्य (एसईएम) की मानक त्रुटि कहा जाता है।[1]
माध्य का प्रतिचयन वितरण एक ही जनसंख्या से बार-बार प्रतिचयन द्वारा उत्पन्न होता है और प्रतिदर्श माध्य की रिकॉर्डिंग प्राप्त होती है। यह विभिन्न साधनों का वितरण बनाता है, और इस वितरण का अपना माध्य और विचरण होता है। गणितीय रूप से, प्राप्त मानक माध्य वितरण का विचरण मानक आकार द्वारा विभाजित जनसंख्या के विचरण के बराबर है। ऐसा इसलिए है क्योंकि जैसे-जैसे सैंपल का आकार बढ़ता है, सैंपल का मतलब जनसंख्या माध्य के आसपास अधिक निकट से एकत्र होता है।
इसलिए, माध्य की मानक त्रुटि और मानक विचलन के बीच संबंध ऐसा है कि, किसी दिए गए मानक के आकार के लिए, माध्य की मानक त्रुटि मानक आकार के वर्गमूल से विभाजित मानक विचलन के बराबर होती है।[1] दूसरे शब्दों में, माध्य की मानक त्रुटि जनसंख्या माध्य के आसपास मानक माध्य के प्रसार का माप है।
प्रतिगमन विश्लेषण में, शब्द मानक त्रुटि या तो घटे हुए ची-स्क्वायर आँकड़ों के वर्गमूल या किसी विशेष प्रतिगमन गुणांक के लिए मानक त्रुटि (जैसा कि, कहते हैं, विश्वास अंतराल में उपयोग किया जाता है) को संदर्भित करता है।
मानक माध्य की मानक त्रुटि
त्रुटिहीन मान
मान लीजिए कि प्रेक्षण का एक सांख्यिकीय रूप से स्वतंत्र मानक एक सांख्यिकीय जनसंख्या से के मानक विचलन के साथ लिया जाता है। मानक से परिकलित माध्य मान, , माध्य पर संबद्ध मानक त्रुटि होगी, , द्वारा दिए गए:[1]
- .
व्यावहारिक रूप से यह हमें बताता है कि के कारक के कारण जनसंख्या माध्य के मान का अनुमान लगाने का प्रयास करते समय, अनुमान पर त्रुटि को दो के कारक से कम करने के लिए मानक में चार गुना अधिक अवलोकन प्राप्त करने की आवश्यकता होती है; इसे दस के कारक से कम करने के लिए सौ गुना अधिक अवलोकन की आवश्यकता होती है।
अनुमान
प्रतिदर्शित की जा रही जनसंख्या का मानक विचलन सिग्मा संभवतः ही कभी जाना जाता है। इसलिए, माध्य की मानक त्रुटि को सामान्यतः को नमूना मानक विचलन के अतिरिक्त प्रतिस्थापित करके अनुमानित किया जाता है:
- .
चूंकि यह वास्तविक मानक त्रुटि के लिए केवल एक अनुमानक है, यहां अन्य अंकन देखना सामान्य है जैसे:
- या वैकल्पिक रूप से .
भ्रम का एक सामान्य स्रोत तब होता है जब स्पष्ट रूप से अंतर करने में विफल रहता है:
- जनसंख्या का मानक विचलन (),
- मानक का मानक विचलन (),
- माध्य का मानक विचलन (, जो मानक त्रुटि है), और
- माध्य के मानक विचलन का अनुमानक (, जो सबसे अधिक बार गणना की जाने वाली मात्रा है, और इसे अधिकांश बोलचाल की भाषा में मानक त्रुटि भी कहा जाता है)।
अनुमानक की शुद्धता
जब मानक आकार छोटा होता है, तो जनसंख्या के वास्तविक मानक विचलन के बजाय मानक के मानक विचलन का उपयोग करने से जनसंख्या मानक विचलन को व्यवस्थित रूप से कम करके आंका जाएगा, और इसलिए मानक त्रुटि भी। N = 2 के साथ, अवमानन लगभग 25% है, लेकिन n = 6 के लिए, अवमानन केवल 5% है। गुरलैंड और त्रिपाठी (1971) इस आशय के लिए एक सुधार और समीकरण प्रदान करते हैं।[3] सोकाल और रोहल्फ़ (1981) n <20 के छोटे नमूनों के लिए सुधार कारक का एक समीकरण देते हैं।[4] आगे की चर्चा के लिए मानक विचलन का निष्पक्ष अनुमान देखें।
व्युत्पत्ति
माध्य पर मानक त्रुटि स्वतंत्र यादृच्छिक चर के योग के विचरण से प्राप्त की जा सकती है,[5] प्रसरण#प्रसरण की परिभाषा और उसके कुछ सरल प्रसरण#गुण दिए गए हैं। अगर हैं माध्य के साथ जनसंख्या से स्वतंत्र मानक और मानक विचलन , तो हम कुल परिभाषित कर सकते हैं
जो प्रसरण के कारण#असंबद्ध चरों का योग (Bienaymé सूत्र)|Bienaymé सूत्र, में विचरण होगा
जहां हमने जनसंख्या के मानक विचलन के लिए सर्वोत्तम मान के साथ माप के मानक विचलन, यानी अनिश्चितताओं का अनुमान लगाया है। इन मापों का माध्य द्वारा ही दिया जाता है
- .
माध्य का विचरण तब है
मानक त्रुटि, परिभाषा के अनुसार, का मानक विचलन है जो केवल विचरण का वर्गमूल है:
- .
सहसंबद्ध यादृच्छिक चर के लिए मार्कोव श्रृंखला केंद्रीय सीमा प्रमेय के अनुसार मानक भिन्नता की गणना की जानी चाहिए।
=== यादृच्छिक मानक आकार === के साथ स्वतंत्र और समान रूप से वितरित यादृच्छिक चर ऐसे मामले होते हैं जब एक मानक पहले से जाने बिना लिया जाता है कि कितने अवलोकन किसी मानदंड के अनुसार स्वीकार्य होंगे। ऐसे मामलों में, मानक आकार एक यादृच्छिक चर है जिसकी भिन्नता की भिन्नता में जुड़ जाती है ऐसा है कि,