माध्यिका

From Vigyanwiki
File:Finding the median.png
मानों की विषम और सम संख्या वाले डेटा के सेट में माध्यिका ढूँढना

सांख्यिकी और संभाव्यता सिद्धांत में, माध्यिका वह मान होता है जो डेटा के निचले आधे हिस्से से उच्च आधे हिस्से को अलग करता है। डेटा सेट के लिए, इसे "मध्य" मान के रूप में माना जा सकता है। माध्य की तुलना में डेटा का वर्णन करने में माध्यिका की मूल विशेषता (अधिकांशतः इसे "औसत" के रूप में वर्णित किया जाता है) यह है कि यह बहुत बड़े या छोटे मूल्यों के एक छोटे अनुपात से तिरछा नहीं होता है, और इसलिए केंद्र का बेहतर प्रतिनिधित्व प्रदान करता है। औसत आय, उदाहरण के लिए, आय वितरण के केंद्र का वर्णन करने का एक बेहतर विधि हो सकती है क्योंकि अकेले सबसे बड़ी आय में वृद्धि का माध्यिका पर कोई प्रभाव नहीं पड़ता है। इस कारण से, प्रबल संख्याओं में माध्यिका का केंद्रीय महत्व होता है।

संख्याओंं का परिमित डेटा सेट

संख्याओंं की एक परिमित सूची का मध्य संख्या होता है, जब उन संख्याओंं को सबसे छोटे से सबसे बड़े क्रम में सूचीबद्ध किया जाता है।

यदि डेटा सेट में विषम संख्या में अवलोकन होता है, तो बीच का चयन किया जाता है। उदाहरण के लिए, सात संख्याओंं की निम्न सूची,

1, 3, 3, 6, 7, 8, 9

माध्यिका 6 है, जो चौथा मान है।

यदि डेटा सेट में टिप्पणियों की एक समान संख्या है, तो कोई विशिष्ट मध्य मान नहीं होता है और माध्यिका को सामान्यतः दो मध्य मानों के अंकगणितीय माध्य के रूप में परिभाषित किया जाता है।[1][2] उदाहरण के लिए, यह डेटा 8 अंकों का सेट है

1, 2, 3, 4, 5, 6, 8, 9

का माध्य मान 4.5 है, अर्थात . (अधिक तकनीकी शब्दों में, यह माध्यिका को पूरी तरह से ट्रिम किए गए अनुमानक मध्य-श्रेणी के रूप में व्याख्या करता है)।

सामान्यतः, इस सम्मेलन के साथ, माध्यिका को निम्नानुसार परिभाषित किया जा सकता है: डेटा सेट के लिए का तत्व, सबसे छोटे से सबसे बड़े के क्रम में,

यदि असामान्य है,
यदि सम है,
मूल्यों के सामान्य औसत की तुलना [ 1, 2, 2, 3, 4, 7, 9 ]
प्रकार विवरण उदाहरण परिणाम
मध्य स्तर किसी डेटा सेट के न्यूनतम और अधिकतम के बीच का मध्य बिंदु 1, 2, 2, 3, 4, 7, 9 5
अंकगणित औसत मानों की संख्या से विभाजित डेटा सेट के मानों का योग: (1 + 2 + 2 + 3 + 4 + 7 + 9) / 7 4
माध्यिका डेटा सेट के बड़े और छोटे हिस्सों को अलग करने वाला मध्य मान 1, 2, 2, 3, 4, 7, 9 3
मोड डेटा सेट में सबसे अधिक बार मान 1, 2, 2, 3, 4, 7, 9 2

औपचारिक परिभाषा

औपचारिक रूप से, संख्या का एक औसत कोई भी मूल्य होता है जैसे कि कम से कम आधी संख्या प्रस्तावित औसत से कम या उसके बराबर होता है और कम से कम आधी प्रस्तावित औसत से अधिक या उसके बराबर होता है। जैसा कि ऊपर देखा गया है, माध्यिकाएँ अद्वितीय नहीं हो सकती है। यदि प्रत्येक सेट में आधी से कम संख्या होती है, तो कुछ संख्या अद्वितीय माध्यिका के बिल्कुल बराबर होती है।

माध्यिका किसी भी कमजोर क्रम डेटा के लिए अच्छी तरह से परिभाषित होता है, और किसी भी दूरी मीट्रिक से स्वतंत्र होता है। माध्यिका को इस प्रकार उन कक्षाओं पर लागू किया जा सकता है जो रैंक वाली है लेकिन संख्यात्मक नहीं होता है (उदाहरण के लिए जब छात्रों को ए से एफ तक ग्रेड दिया जाता है तो माध्यिका ग्रेड निकालना), चूंकि स्थितियों की संख्या सम होने पर परिणाम कक्षाओं के बीच में आधा होता है।

दूसरी ओर, एक ज्यामितीय माध्य, किसी भी संख्या में आयामों में परिभाषित किया गया है। एक संबंधित अवधारणा, जिसमें परिणाम को नमूने के एक सदस्य के अनुरूप होने के लिए मजबूर किया जाता है।

माध्यिका के लिए कोई व्यापक रूप से स्वीकृत मानक संकेतन नहीं होता है, लेकिन कुछ लेखक एक चर x के माध्यिका का प्रतिनिधित्व या तो x͂ या μ1/2 के रूप में करते है[1]कभी-कभी एम.[3][4] इनमें से किसी भी स्थिति में, माध्यिका के लिए अन्य प्रतीकों के उपयोग को स्पष्ट रूप से परिभाषित करने की आवश्यकता होती है जब उन्हें प्रस्तुत किया जाता है।

माध्यिका अन्य स्थान पैरामीटर की एक विशेष स्थिति है: यह दूसरा चतुर्थक, 5वाँ दशमक और 50वाँ प्रतिशतक है।

महत्वपूर्ण

माध्यिका का उपयोग स्थान पैरामीटर के माप के रूप में किया जा सकता है, जब कोई अत्यधिक मूल्यों को कम महत्व देता है, सामान्यतः क्योंकि वितरण तिरछा होता है, मान ज्ञात नहीं होते है, या ग़ैर अविश्वसनीय होते है, अर्थात माप/प्रतिलेखन त्रुटियाँ होती है।

उदाहरण के लिए, बहुसेट पर विचार करें

1, 2, 2, 2, 3, 14।

इस स्थिति में माध्यिका 2 है, जैसा कि मोड (सांख्यिकी) है, और इसे 4 के अंकगणितीय माध्य की तुलना में केंद्रीय प्रवृत्ति के बेहतर संकेत के रूप में देखा जा सकता है, जो कि मूल्यों में से एक को छोड़कर सभी से बड़ा है। चूंकि, व्यापक रूप से उद्धृत अनुभवजन्य संबंध है कि माध्य की तुलना में माध्य को वितरण की पूंछ में आगे स्थानांतरित कर दिया जाता है, यह सामान्यतः सच नहीं है। अधिक से अधिक, कोई यह कह सकता है कि दो संख्या बहुत दूर नहीं हो सकते, § असमानता संबंधित साधन और माध्यिकाएँ नीचे देखे।[5]

चूंकि एक मध्यिका एक सेट में मध्य डेटा पर आधारित होती है, इसकी गणना करने के लिए चरम परिणामों के मूल्य को जानना आवश्यक नहीं होता है। उदाहरण के लिए, किसी समस्या को हल करने के लिए आवश्यक समय की जांच करने वाले मनोविज्ञान परीक्षण में, यदि बहुत कम संख्या में लोग दिए गए समय में समस्या को हल करने में विफल रहता है, तब भी माध्यिका की गणना की जा सकती है।[6]

क्योंकि मध्यिका समझने में आसान और गणना करने में आसान होती है, जबकि माध्य के लिए एक प्रबल सन्निकटन भी है, माध्यिका वर्णनात्मक संख्याओंं में एक लोकप्रिय सारांश संख्या है। इस संदर्भ में, परिवर्तनशीलता (सांख्यिकी) के माप के लिए कई विकल्प है: श्रेणी (सांख्यिकी), अंतःचतुर्थक श्रेणी, माध्य निरपेक्ष विचलन, और माध्य निरपेक्ष विचलन।

व्यावहारिक उद्देश्यों के लिए, स्थान और फैलाव के विभिन्न उपायों की तुलना अधिकांशतः इस आधार पर की जाती है कि डेटा के नमूने से संबंधित संख्या मूल्यों का कितना अच्छा अनुमान लगाया जा सकता है। माध्यिका, नमूना माध्यिका का उपयोग करके अनुमानित, इस संबंध में अच्छे गुण होते है। चूंकि यह सामान्यतः इष्टतम नहीं होता है यदि किसी दिए गए संख्या वितरण को मान लिया जाए, इसके गुण हमेशा यथोचित रूप से अच्छे होते है। उदाहरण के लिए, उम्मीदवार अनुमानकों की दक्षता (सांख्यिकी) की तुलना से पता चलता है कि नमूना माध्य अधिक सांख्यिकीय रूप से कुशल है कब—और केवल कब—डेटा वितरणों के मिश्रण से से असंदूषित है। फिर भी, माध्यिका में न्यूनतम-विचरण माध्य (बड़े सामान्य नमूनों के लिए) की तुलना में 64% दक्षता है, जिसका कहना है कि माध्यिका का प्रसरण माध्य के विचरण से ~50% अधिक होता है।[7][8]

संभाव्यता वितरण

File:Visualisation mode median mean.svg
मोड का ज्यामितीय विज़ुअलाइज़ेशन, माध्यिका और मनमाना संभाव्यता घनत्व फलन का माध्य[9]

संचयी वितरण फलन F के साथ किसी वास्तविक संख्या-मूल्यवान संभाव्यता वितरण के लिए, माध्यिका को किसी वास्तविक संख्या m के रूप में परिभाषित किया जाता है जो असमानताओं को संतुष्ट करता है

एक समतुल्य सूत्र F के अनुसार वितरित एक यादृच्छिक चर X का उपयोग करता है:
ध्यान दें कि इस परिभाषा के लिए एक्स को एक पूर्ण निरंतरता की आवश्यकता नहीं होती है (जिसकी प्रायिकता घनत्व फलन f है), और न ही इसे असतत वितरण की आवश्यकता होती है। पूर्व स्थिति में, असमानताओं को समानता में अपग्रेड किया जा सकता है: एक माध्यिका संतुष्ट करती है
आर पर किसी भी संभाव्यता वितरण में कम से कम एक माध्यिका होती है, लेकिन पैथोलॉजिकल स्थितियों में एक से अधिक माध्यिका हो सकती है: यदि 'एफ' एक अंतराल पर 1/2 स्थिर है (जिससे कि वहां एफ = 0 हो), तो उस अंतराल का कोई भी मान एक माध्यिका है।

विशेष वितरण के माध्यम

कुछ प्रकार के वितरणों के माध्यों की गणना उनके प्राचलों से आसानी से की जा सकती है, इसके अतिरिक्त, वे कुछ वितरणों के लिए भी उपस्थित है जिनमें एक अच्छी तरह से परिभाषित माध्य की कमी होती है, जैसे कॉची वितरण:

  • एक सममित वितरण का माध्य बहुलक के साथ मेल खाता है।
  • एक सममित वितरण का माध्यिका जिसका माध्य μ होता है, वह भी μ मान लेता है।
    • माध्य μ और प्रसरण σ2 के साथ एक सामान्य वितरण का माध्यिका μ है। वास्तव में, एक सामान्य वितरण के लिए, माध्य = माध्यिका = बहुलक।
    • अंतराल [ए, बी] में एक समान वितरण (निरंतर) का माध्यिका (ए+बी) /2 है, जो माध्य भी है।
  • स्थान पैरामीटर x0 के साथ कॉची वितरण की माध्यिका और स्केल पैरामीटर y x0 है।
  • एक ऊर्जा लॉ x−a का माध्यिका, घातांक a के साथ > 1, 21/(ए − 1)xmin होता है, जहां xmin न्यूनतम मूल्य है जिसके लिए ऊर्जा धारण करता है।[10]
  • दर पैरामीटर λ के साथ एक घातीय वितरण का माध्य 2 का प्राकृतिक लघुगणक दर पैरामीटर द्वारा विभाजित है: λ−1ln 2.
  • आकृति पैरामीटर k और स्केल पैरामीटर λ के साथ वेइबुल वितरण का माध्य λ(ln 2)1/k है।

गुण

अनुकूलता संपत्ति

यादृच्छिक चर X के संबंध में एक वास्तविक चर c की औसत पूर्ण त्रुटि है