गणितीय सांख्यिकी

गणितीय सांख्यिकी सांख्यिकीय डेटा एकत्र करने की तकनीकों के विपरीत, संभाव्यता सिद्धांत, गणित की शाखा, का सांख्यिकी में अनुप्रयोग है। इस प्रकार इसके लिए जो विशिष्ट गणितीय तकनीकों का उपयोग किया जाता है उनमें गणितीय विश्लेषण, रैखिक बीजगणित, स्टोकेस्टिक विश्लेषण, अंतर समीकरण और माप सिद्धांत सम्मिलित हैं।

परिचय
इस प्रकार सांख्यिकीय डेटा संग्रह का संबंध अध्ययन की योजना, विशेष रूप से प्रयोगों के डिजाइन और यादृच्छिक प्रारूप का उपयोग करके सांख्यिकीय सर्वेक्षण की योजना से है। डेटा का प्रारंभिक विश्लेषण अधिकांशतः अध्ययन किए जाने से पहले निर्दिष्ट अध्ययन प्रोटोकॉल का पालन करता है। इस प्रकार किसी अध्ययन के डेटा का विश्लेषण प्रारंभिक परिणामों से प्रेरित माध्यमिक परिकल्पनाओं पर विचार करने या नए अध्ययनों का विचार देने के लिए भी किया जा सकता है। नियोजित अध्ययन से प्राप्त डेटा का द्वितीयक विश्लेषण डेटा विश्लेषण के उपकरणों का उपयोग करता है, और ऐसा करने की प्रक्रिया गणितीय सांख्यिकी हैं।

डेटा विश्लेषण को इसमें विभाजित किया गया है:


 * वर्णनात्मक सांख्यिकी - सांख्यिकी का वह भाग जो डेटा का वर्णन करता है, अर्थात डेटा और उनके विशिष्ट गुणों का सारांश देता है।
 * अनुमानात्मक सांख्यिकी - सांख्यिकी का वह भाग जो डेटा से निष्कर्ष निकालता है (डेटा के लिए कुछ मॉडल का उपयोग करके): उदाहरण के लिए, अनुमानात्मक सांख्यिकी में डेटा के लिए मॉडल का चयन करता है, यह जाँचना कि क्या डेटा किसी विशेष मॉडल की नियमो को पूर्ण करता है, और मात्रा निर्धारित करना सम्मिलित है इसमें सम्मिलित अनिश्चितता (उदाहरण के लिए कॉन्फिडेंस अंतराल का उपयोग करना)।

जबकि डेटा विश्लेषण के उपकरण यादृच्छिक अध्ययन से प्राप्त डेटा पर सबसे अच्छा कार्य करते हैं, वह अन्य प्रकार के डेटा पर भी प्रयुक्त होते हैं। उदाहरण के लिए, प्राकृतिक प्रयोग और अवलोकन संबंधी अध्ययनों से, इस स्थिति में अनुमान सांख्यिकीविद् द्वारा चुने गए मॉडल पर निर्भर होता है, और इसलिए सब्जेक्टिव होता है।

विषय
गणितीय सांख्यिकी में कुछ महत्वपूर्ण विषय निम्नलिखित हैं:

संभाव्यता वितरण
इस प्रकार संभाव्यता वितरण फलन (गणित) है जो यादृच्छिक प्रयोग (संभाव्यता सिद्धांत), सर्वेक्षण पद्धति, या सांख्यिकीय अनुमान की प्रक्रिया के संभावित परिणामों के प्रत्येक माप (गणित) के लिए संभाव्यता प्रदान करता है। ऐसे प्रयोगों में उदाहरण पाए जाते हैं जिनका प्रारूप समष्टि गैर-संख्यात्मक है, जहां वितरण श्रेणीबद्ध वितरण होगा; ऐसे प्रयोग जिनका प्रारूप समष्टि असतत यादृच्छिक वैरिएबल द्वारा एन्कोड किया गया है, जहां वितरण को संभाव्यता द्रव्यमान फलन द्वारा निर्दिष्ट किया जा सकता है; और निरंतर यादृच्छिक वैरिएबल द्वारा एन्कोड किए गए प्रारूप समष्टि के साथ प्रयोग, जहां वितरण को संभाव्यता घनत्व फलन द्वारा निर्दिष्ट किया जा सकता है। इस प्रकार अधिक सम्मिश्र प्रयोग, जैसे कि सतत समय में परिभाषित स्टोकेस्टिक प्रक्रियाओं से जुड़े प्रयोग, अधिक सामान्य संभाव्यता उपायों के उपयोग की मांग कर सकते हैं।

इस प्रकार संभाव्यता वितरण या तो यूनीवेरिएट वितरण या बहुविकल्पीय वितरण हो सकता है। इस प्रकार अविभाज्य वितरण एकल यादृच्छिक वैरिएबल के विभिन्न वैकल्पिक मान लेने की संभाव्यताएँ देता है; बहुभिन्नरूपी वितरण ( संयुक्त संभाव्यता वितरण) यादृच्छिक सदिश की संभाव्यताएं देता है - दो या दो से अधिक यादृच्छिक वैरिएबल का सेट - मानों के विभिन्न संयोजनों पर आधारित महत्वपूर्ण और समष्टि सामने आने वाले अविभाज्य संभाव्यता वितरण में द्विपद वितरण, हाइपरज्यामितीय वितरण और सामान्य वितरण सम्मिलित हैं। बहुभिन्नरूपी सामान्य वितरण सामान्यतः पाया जाने वाला बहुभिन्नरूपी वितरण है।

विशेष वितरण

 * सामान्य वितरण सबसे सामान्य सतत वितरण है
 * इस प्रकार बर्नौली वितरण, एकल बर्नौली परीक्षण के परिणाम के लिए (जैसे सफलता/असफलता, हाँ/नहीं)
 * स्वतंत्र (सांख्यिकी) घटनाओं की निश्चित कुल संख्या दी गई धनात्मक घटनाओं (जैसे सफलताएं, हां वोट इत्यादि) की संख्या के लिए द्विपद वितरण है
 * इस प्रकार ऋणात्मक द्विपद वितरण, द्विपद-प्रकार के अवलोकनों के लिए किन्तु जहां ब्याज की मात्रा दी गई सफलताओं की संख्या होने से पहले विफलताओं की संख्या है
 * इस प्रकार ज्यामितीय वितरण, द्विपद-प्रकार के अवलोकनों के लिए, किन्तु जहां इंटरेस्ट की मात्रा पहली सफलता से पहले विफलताओं की संख्या है; ऋणात्मक द्विपद वितरण का विशेष मामला, जहां सफलताओं की संख्या है।
 * इस प्रकार मानो के सीमित सेट के लिए असतत समान वितरण है (उदाहरण के लिए निष्पक्ष पासे का परिणाम)
 * निरंतर वितरित मानो के लिए निरंतर समान वितरण है
 * पॉइसन वितरण, किसी निश्चित समयावधि में पॉइसन-प्रकार की घटना की घटनाओं की संख्या के लिए है
 * इस प्रकार पॉइसन-प्रकार की घटना घटित होने से पहले के समय के लिए घातीय वितरण है
 * गामा वितरण, पॉइसन-प्रकार की घटनाओं के घटित होने से पहले के समय के लिए
 * ची-वर्ग वितरण, वर्ग मानक सामान्य वैरिएबल के योग का वितरण है; उपयोगी उदाहरन सामान्य रूप से वितरित प्रारूपो के प्रारूप भिन्नता के संबंध में अनुमान के लिए (ची-स्क्वेर्ड परीक्षण देखें)
 * इस प्रकार स्टूडेंट टी वितरण, मानक सामान्य वैरिएबल के अनुपात का वितरण और स्केल किए गए ची वर्ग वितरण वैरिएबल का वर्गमूल; अज्ञात विचरण के साथ सामान्य रूप से वितरित प्रारूपो के माध्य के बारे में अनुमान लगाने के लिए उपयोगी (स्टूडेंट टी-परीक्षण देखें)
 * बीटा वितरण, एकल संभाव्यता के लिए (0 और 1 के मध्य वास्तविक संख्या); बर्नौली वितरण और द्विपद वितरण से संयुग्मित है

सांख्यिकीय अनुमान
इस प्रकार सांख्यिकीय अनुमान डेटा से निष्कर्ष निकालने की प्रक्रिया है जो यादृच्छिक भिन्नता के अधीन है, उदाहरण के लिए, अवलोकन संबंधी त्रुटियां या प्रारूप भिन्नता अनुमान और प्रेरक तर्क के लिए प्रक्रियाओं की ऐसी प्रणाली की प्रारंभिक आवश्यकताएं यह हैं कि प्रणाली को अच्छी तरह से परिभाषित स्थितियों पर प्रयुक्त होने पर उचित उत्तर देना चाहिए और यह विभिन्न स्थितियों में प्रयुक्त होने के लिए पर्याप्त सामान्य होना चाहिए। इस प्रकार अनुमानित सांख्यिकी का उपयोग परिकल्पनाओं का परीक्षण करने और प्रारूप डेटा का उपयोग करके अनुमान लगाने के लिए किया जाता है। जबकि वर्णनात्मक सांख्यिकी प्रारूप का वर्णन करते हैं, अनुमानात्मक सांख्यिकी उस बड़ी जनसंख्या के बारे में पूर्वानुमान करते हैं जिसका प्रारूप प्रतिनिधित्व करता है।

इस प्रकार सांख्यिकीय अनुमान का परिणाम इस प्रश्न का उत्तर हो सकता है कि आगे क्या किया जाना चाहिए? , जहां यह आगे के प्रयोग या सर्वेक्षण करने, या किसी संगठनात्मक या सरकारी नीति को प्रयुक्त करने से पहले निष्कर्ष निकालने के बारे में निर्णय हो सकता है। अधिकांश भाग के लिए, सांख्यिकीय अनुमान कुछ प्रकार के यादृच्छिक प्रारूप के माध्यम से इंटरेस्ट की जनसंख्या से निकाले गए डेटा का उपयोग करके जनसंख्या के बारे में प्रस्ताव देता है। इस प्रकार अधिक सामान्यतः, यादृच्छिक प्रक्रिया के बारे में डेटा सीमित अवधि के समय उसके देखे गए व्यवहार से प्राप्त किया जाता है। किसी मापदंड या परिकल्पना को देखते हुए जिसके बारे में कोई अनुमान लगाना चाहता है, सांख्यिकीय अनुमान सबसे अधिक बार उपयोग किया जाता है:
 * इस प्रकार यादृच्छिक प्रक्रिया का सांख्यिकीय मॉडल जो डेटा उत्पन्न करने वाला होता है, जिसे तब जाना जाता है जब यादृच्छिककरण का उपयोग किया गया हो, और
 * इस प्रकार यादृच्छिक प्रक्रिया का एक विशेष अनुभव अर्थात डेटा का एक सेट है।

प्रतिगमन
इस प्रकार सांख्यिकी में, प्रतिगमन विश्लेषण वैरिएबल के मध्य संबंधों का अनुमान लगाने के लिए सांख्यिकीय प्रक्रिया है। इसमें विभिन्न वैरिएबल के मॉडलिंग और विश्लेषण के विभिन्न विधि सम्मिलित हैं, जब फोकस डिपेन्डेन्ट वैरिएबल और या अधिक स्वतंत्र वैरिएबल के मध्य संबंध पर होता है। अधिक विशेष रूप से, प्रतिगमन विश्लेषण यह समझने में सहायता करता है कि डिपेन्डेन्ट वैरिएबल (या 'मानदंड वैरिएबल') का विशिष्ट मूल्य कैसे परिवर्तित होता है जब किसी स्वतंत्र वैरिएबल में भिन्नता होती है, जबकि अन्य स्वतंत्र वैरिएबल स्थिर रहते हैं। सामान्यतः, प्रतिगमन विश्लेषण स्वतंत्र वैरिएबल को देखते हुए डिपेन्डेन्ट वैरिएबल की नियमबद्ध अपेक्षा का अनुमान लगाता है - अर्थात, स्वतंत्र वैरिएबल तय होने पर डिपेन्डेन्ट वैरिएबल का औसत मूल्य सामान्यतः, ध्यान स्वतंत्र वैरिएबल को देखते हुए डिपेन्डेन्ट वैरिएबल के नियमबद्ध वितरण के मात्रात्मक या अन्य समष्टि मापदंड पर होता है। सभी स्थितियों में, अनुमान लक्ष्य स्वतंत्र वैरिएबल का फलन (गणित) है जिसे प्रतिगमन फलन कहा जाता है। इस प्रकार प्रतिगमन विश्लेषण में, प्रतिगमन फलन के निकट डिपेन्डेन्ट वैरिएबल की भिन्नता को चिह्नित करना भी रोचक है जिसे संभाव्यता वितरण द्वारा वर्णित किया जा सकता है।

इस प्रकार प्रतिगमन विश्लेषण करने के लिए विभिन्न तकनीकें विकसित की गई हैं। परिचित विधियाँ, जैसे कि रैखिक प्रतिगमन, पैरामीट्रिक सांख्यिकी हैं, जिसमें प्रतिगमन फलन को अज्ञात मापदंडों की सीमित संख्या के संदर्भ में परिभाषित किया जाता है जो डेटा से अनुमानित होते हैं (उदाहरण के लिए सामान्य न्यूनतम वर्गों का उपयोग करके)। नॉनपैरामीट्रिक प्रतिगमन उन तकनीकों को संदर्भित करता है जो प्रतिगमन फलन को फलन (गणित) के निर्दिष्ट सेट में असत्य बोलने की अनुमति देता है, जो आयाम या अनंत-आयामी हो सकता है।

नॉनपैरामीट्रिक सांख्यिकी
इस प्रकार नॉन-पैरामीट्रिक सांख्यिकी डेटा से इस तरह से गणना किए गए मान हैं जो संभाव्यता वितरण के सांख्यिकीय मापदंड वर्गों पर आधारित नहीं हैं। इनमें वर्णनात्मक सांख्यिकी और सांख्यिकीय अनुमान सांख्यिकी दोनों सम्मिलित हैं। विशिष्ट मापदंड माध्य, विचरण आदि हैं। इस प्रकार पैरामीट्रिक सांख्यिकी के विपरीत, नॉन-पैरामीट्रिक सांख्यिकी मूल्यांकन किए जा रहे वैरिएबल के संभाव्यता वितरण के बारे में कोई धारणा नहीं बनाते हैं।

इस प्रकार नॉन-पैरामीट्रिक विधियों का व्यापक रूप से उन जनसंख्या का अध्ययन करने के लिए उपयोग किया जाता है जो क्रमबद्ध क्रम में होती हैं (जैसे कि से चार स्टार प्राप्त करने वाली फिल्म समीक्षा)। नॉन-पैरामीट्रिक विधियों का उपयोग तब आवश्यक हो सकता है जब डेटा की रैंकिंग हो किन्तु कोई स्पष्ट संख्यात्मक व्याख्या न हो, जैसे कि प्राथमिकताओं का आकलन करते समय माप के स्तर के संदर्भ में, नॉन-पैरामीट्रिक विधियों से क्रमिक डेटा प्राप्त होता है।

चूंकि नॉन-पैरामीट्रिक विधियां कम धारणाएं बनाती हैं, इसलिए उनकी प्रयोज्यता संबंधित पैरामीट्रिक विधियों की तुलना में बहुत व्यापक है। विशेष रूप से, उन्हें उन स्थितियों में प्रयुक्त किया जा सकता है जहां प्रश्न में आवेदन के बारे में कम जानकारी है। साथ ही, कम मान्यताओं पर निर्भरता के कारण, नॉन-पैरामीट्रिक विधियाँ अधिक सशक्त सांख्यिकी परिचय हैं।

इस प्रकार नॉन-पैरामीट्रिक विधियों का दोष यह है कि चूंकि वह मान्यताओं पर विश्वास नहीं करते हैं, इसलिए वह समष्टि अपने पैरामीट्रिक समकक्षों की तुलना में परीक्षण की कम शक्ति वाले होते हैं। कम शक्ति वाले नॉन-पैरामीट्रिक परीक्षण समस्याग्रस्त हैं क्योंकि इन विधियों का सामान्य उपयोग तब होता है जब किसी प्रारूप का प्रारूप आकार कम होता है। नेमैन-पियर्सन लेम्मा और संभाव्यता-अनुपात परीक्षण जैसी विधियों के माध्यम से विभिन्न पैरामीट्रिक विधियां सबसे शक्तिशाली परीक्षण सिद्ध हुई हैं।

इस प्रकार नॉन-पैरामीट्रिक विधियों के उपयोग का अन्य औचित्य सरलता है। कुछ स्थितियों में, तथापि पैरामीट्रिक विधियों का उपयोग उचित हो, नॉन-पैरामीट्रिक विधियों का उपयोग करना सरल हो सकता है। इस सरलता और उनकी अधिक सशक्त दोनों के कारण, कुछ सांख्यिकीविदों द्वारा नॉन-पैरामीट्रिक विधियों को अनुचित उपयोग और गलतफहमी के लिए कम समष्टि छोड़ने के रूप में देखा जाता है।

सांख्यिकी, गणित, और गणितीय सांख्यिकी
इस प्रकार गणितीय सांख्यिकी सांख्यिकी के अनुशासन का प्रमुख उपसमुच्चय है। सांख्यिकीविद् गणित के साथ सांख्यिकीय प्रक्रियाओं का अध्ययन और सुधार करते हैं, और सांख्यिकीय अनुसंधान अधिकांशतः गणितीय प्रश्न उठाते हैं।

इस प्रकार गॉस, लाप्लास और चार्ल्स सैंडर्स पीयर्स या सी जैसे गणितज्ञ और सांख्यिकीविद् एस. पीयर्स ने संभाव्यता वितरण और हानि कार्यों (या उपयोगिता कार्यों) के साथ इष्टतम निर्णय का उपयोग किया था। सांख्यिकीय अनुमान के लिए निर्णय-सैद्धांतिक दृष्टिकोण को इब्राहीम का जन्म हुआ और उनके उत्तराधिकारियों द्वारा पुनर्जीवित किया गया था,      और वैज्ञानिक कंप्यूटिंग, गणितीय विश्लेषण और अनुकूलन (गणित) का व्यापक उपयोग करता है; इस प्रकार प्रयोगों के डिज़ाइन के लिए, सांख्यिकीविद् बीजगणितीय सांख्यिकी और संयोजनात्मक डिज़ाइन का उपयोग करते हैं। किन्तु जबकि सांख्यिकीय अभ्यास अधिकांशतः संभाव्यता सिद्धांत और इष्टतम निर्णय पर निर्भर करता है, उनका अनुप्रयोग विवादास्पद हो सकता है

यह भी देखें

 * असममित सिद्धांत (सांख्यिकी)

अग्रिम पठन

 * Borovkov, A. A. (1999). Mathematical Statistics. CRC Press. ISBN 90-5699-018-7
 * Virtual Laboratories in Probability and Statistics (Univ. of Ala.-Huntsville)
 * StatiBot, interactive online expert system on statistical tests.
 * ISBN 978-9383385188