सांख्यिकीय अनुमिति

सांख्यिकीय अनुमान एक अंतर्निहित संभाव्यता वितरण के गुणों का अनुमान लगाने के लिए डेटा विश्लेषण का उपयोग करने की प्रक्रिया है। आनुमानिक सांख्यिकीय विश्लेषण एक सांख्यिकीय आबादी के गुणों का अनुमान लगाता है, उदाहरण के लिए परिकल्पनाओं का परीक्षण करके और अनुमान प्राप्त करके। यह माना जाता है कि देखा गया डेटा सेट एक बड़ी आबादी से नमूनाकरण (सांख्यिकी) है।

अनुमानात्मक सांख्यिकी की तुलना वर्णनात्मक सांख्यिकी से की जा सकती है। वर्णनात्मक आँकड़े केवल देखे गए डेटा के गुणों से संबंधित हैं, और यह इस धारणा पर आधारित नहीं है कि डेटा एक बड़ी आबादी से आता है। मशीन लर्निंग में, शब्द निष्कर्ष का उपयोग कभी-कभी पहले से प्रशिक्षित मॉडल का मूल्यांकन करके भविष्यवाणी करने के लिए किया जाता है; इस संदर्भ में मॉडल के गुणों का उल्लेख प्रशिक्षण या सीखने (अनुमान के बजाय) के रूप में किया जाता है, और भविष्यवाणी के लिए एक मॉडल का उपयोग करने के लिए अनुमान (भविष्यवाणी के बजाय) के रूप में संदर्भित किया जाता है; भविष्य कहनेवाला अनुमान भी देखें।

परिचय
सांख्यिकीय अनुमान जनसंख्या के किसी प्रकार के नमूने (सांख्यिकी) के साथ जनसंख्या से प्राप्त आंकड़ों का उपयोग करके जनसंख्या के बारे में प्रस्ताव बनाता है। आबादी के बारे में एक परिकल्पना को देखते हुए, जिसके लिए हम अनुमान लगाना चाहते हैं, सांख्यिकीय अनुमान में (पहले) मॉडल चयन प्रक्रिया का एक सांख्यिकीय मॉडल होता है जो डेटा उत्पन्न करता है और (दूसरा) मॉडल से प्रस्तावों को घटाता है। कोनिशी और कितागावा राज्य, सांख्यिकीय अनुमान में अधिकांश समस्याओं को सांख्यिकीय मॉडलिंग से संबंधित समस्याओं के रूप में माना जा सकता है। संबंधित रूप से, डेविड कॉक्स (सांख्यिकीविद्) ने कहा है, विषय-वस्तु समस्या से सांख्यिकीय मॉडल में अनुवाद कैसे किया जाता है, यह अक्सर एक विश्लेषण का सबसे महत्वपूर्ण हिस्सा होता है। एक सांख्यिकीय अनुमान का तार्किक परिणाम एक सांख्यिकीय प्रस्ताव है। सांख्यिकीय प्रस्ताव के कुछ सामान्य रूप निम्नलिखित हैं:
 * एक बिंदु अनुमान, यानी एक विशेष मूल्य जो ब्याज के कुछ पैरामीटर का सबसे अच्छा अनुमान लगाता है;
 * एक अंतराल अनुमान, उदा। एक विश्वास अंतराल (या सेट एस्टीमेट), यानी एक आबादी से तैयार किए गए डेटासेट का उपयोग करके बनाया गया एक अंतराल, ताकि ऐसे डेटासेट के बार-बार नमूने के तहत, ऐसे अंतराल में बताए गए आत्मविश्वास का स्तर पर फ़्रीक्वेंसी प्रायिकता के साथ सही पैरामीटर मान हो;
 * एक विश्वसनीय अंतराल, यानी मूल्यों का एक सेट जिसमें उदाहरण के लिए, पश्च विश्वास का 95%;
 * एक सांख्यिकीय परिकल्पना परीक्षण की अस्वीकृति;
 * समूहों में डेटा बिंदुओं का क्लस्टर विश्लेषण या सांख्यिकीय वर्गीकरण।

मॉडल और धारणाएँ
किसी भी सांख्यिकीय अनुमान के लिए कुछ मान्यताओं की आवश्यकता होती है। एक सांख्यिकीय मॉडल देखे गए डेटा और समान डेटा की पीढ़ी से संबंधित मान्यताओं का एक समूह है। सांख्यिकीय मॉडल के विवरण आम तौर पर ब्याज की जनसंख्या मात्रा की भूमिका पर जोर देते हैं, जिसके बारे में हम अनुमान लगाना चाहते हैं। अधिक औपचारिक निष्कर्ष निकाले जाने से पहले वर्णनात्मक आँकड़े आमतौर पर प्रारंभिक चरण के रूप में उपयोग किए जाते हैं।

मॉडल/धारणाओं की डिग्री
सांख्यिकीविद् मॉडलिंग मान्यताओं के तीन स्तरों के बीच अंतर करते हैं;
 * पैरामीट्रिक मॉडल: डेटा-जेनरेशन प्रक्रिया का वर्णन करने वाले प्रायिकता वितरण को संभाव्यता वितरण के एक परिवार द्वारा पूरी तरह से वर्णित माना जाता है जिसमें केवल अज्ञात पैरामीटर शामिल होते हैं। उदाहरण के लिए, कोई यह मान सकता है कि जनसंख्या मूल्यों का वितरण वास्तव में सामान्य है, अज्ञात माध्य और विचरण के साथ, और यह कि डेटासेट सरल यादृच्छिक नमूना | 'सरल' यादृच्छिक नमूनाकरण द्वारा उत्पन्न होते हैं। सामान्यीकृत रैखिक मॉडल#मॉडल घटकों का परिवार पैरामीट्रिक मॉडल का व्यापक रूप से उपयोग किया जाने वाला और लचीला वर्ग है।
 * गैर-पैरामीट्रिक आंकड़े#गैर-पैरामीट्रिक मॉडल|गैर-पैरामीट्रिक: डेटा उत्पन्न करने की प्रक्रिया के बारे में धारणाएं पैरामीट्रिक आंकड़ों की तुलना में बहुत कम हैं और न्यूनतम हो सकती हैं। उदाहरण के लिए, प्रत्येक निरंतर संभाव्यता वितरण में एक माध्यिका होती है, जिसका अनुमान नमूना माध्यिका या हॉजेस-लेहमन अनुमानक | हॉजेस-लेहमन-सेन अनुमानक का उपयोग करके लगाया जा सकता है, जिसमें साधारण यादृच्छिक नमूने से डेटा उत्पन्न होने पर अच्छे गुण होते हैं।
 * सेमीपैरामेट्रिक मॉडल | सेमी-पैरामीट्रिक: यह शब्द आमतौर पर 'बीच में' पूरी तरह से और गैर-पैरामीट्रिक दृष्टिकोणों की धारणाओं को दर्शाता है। उदाहरण के लिए, कोई यह मान सकता है कि जनसंख्या वितरण का एक परिमित माध्य है। इसके अलावा, कोई यह मान सकता है कि जनसंख्या में औसत प्रतिक्रिया स्तर कुछ सहसंयोजक (एक पैरामीट्रिक धारणा) पर वास्तव में रैखिक तरीके से निर्भर करता है, लेकिन उस माध्य के आसपास के विचरण का वर्णन करने वाला कोई पैरामीट्रिक धारणा नहीं बनाता है (अर्थात किसी विषमलैंगिकता की उपस्थिति या संभावित रूप के बारे में) ). अधिक आम तौर पर, अर्ध-पैरामीट्रिक मॉडल को अक्सर 'संरचनात्मक' और 'यादृच्छिक भिन्नता' घटकों में अलग किया जा सकता है। एक घटक को पैरामीट्रिक रूप से और दूसरे को गैर-पैरामीट्रिक रूप से व्यवहार किया जाता है। प्रसिद्ध कॉक्स मॉडल अर्ध-पैरामीट्रिक मान्यताओं का एक समूह है।

मान्य मॉडल/धारणाओं का महत्व
किसी भी स्तर की धारणा बनाई जाती है, सामान्य रूप से सही ढंग से कैलिब्रेटेड अनुमान, इन धारणाओं को सही होने की आवश्यकता होती है; यानी कि डेटा-जनरेटिंग मैकेनिज्म वास्तव में सही ढंग से निर्दिष्ट किया गया है।

सरल यादृच्छिक नमूने की गलत मान्यताएँ|' सरल 'यादृच्छिक नमूनाकरण सांख्यिकीय अनुमान को अमान्य कर सकता है। अधिक जटिल अर्ध- और पूरी तरह से पैरामीट्रिक धारणाएं भी चिंता का कारण हैं। उदाहरण के लिए, गलत तरीके से कॉक्स मॉडल को मानने से कुछ मामलों में गलत निष्कर्ष निकल सकते हैं। जनसंख्या में सामान्यता की गलत धारणाएं प्रतिगमन-आधारित अनुमान के कुछ रूपों को भी अमान्य कर देती हैं। किसी भी पैरामीट्रिक मॉडल के उपयोग को मानव जनसंख्या के नमूने लेने में अधिकांश विशेषज्ञों द्वारा संशय की दृष्टि से देखा जाता है: अधिकांश नमूना सांख्यिकीविद, जब वे कॉन्फिडेंस इंटरवल से निपटते हैं, तो खुद को बहुत बड़े नमूनों के आधार पर [अनुमानकों] के बारे में बयानों तक सीमित रखते हैं, जहां केंद्रीय सीमा प्रमेय सुनिश्चित करता है। कि इन [अनुमानकों] के वितरण लगभग सामान्य होंगे। विशेष रूप से, एक सामान्य वितरण पूरी तरह से अवास्तविक और भयावह रूप से नासमझ धारणा होगी यदि हम किसी भी प्रकार की आर्थिक आबादी के साथ काम कर रहे हों। यहां, केंद्रीय सीमा प्रमेय बताता है कि बहुत बड़े नमूनों के लिए नमूना माध्य का वितरण लगभग सामान्य रूप से वितरित किया जाता है, यदि वितरण भारी-पूंछ वाला नहीं है।

अनुमानित वितरण
नमूना आँकड़ों के सटीक वितरण को निर्दिष्ट करने में कठिनाई को देखते हुए, इनका अनुमान लगाने के लिए कई तरीके विकसित किए गए हैं।

परिमित नमूनों के साथ, सन्निकटन सिद्धांत यह मापता है कि एक सीमित वितरण आँकड़ों के नमूना वितरण के कितने करीब है: उदाहरण के लिए, 10,000 स्वतंत्र नमूनों के साथ सामान्य वितरण लगभग (सटीकता के दो अंकों तक) नमूना का वितरण कई जनसंख्या वितरणों के लिए, बेरी द्वारा -एसेन प्रमेय। सिमुलेशन अध्ययन और सांख्यिकीविदों के अनुभव के अनुसार, फिर भी कई व्यावहारिक उद्देश्यों के लिए, सामान्य सन्निकटन नमूना-माध्य के वितरण के लिए एक अच्छा सन्निकटन प्रदान करता है, जब 10 (या अधिक) स्वतंत्र नमूने होते हैं। 1950 के दशक में कोलमोगोरोव के काम के बाद, उन्नत सांख्यिकी सन्निकटन की त्रुटि को निर्धारित करने के लिए सन्निकटन सिद्धांत और कार्यात्मक विश्लेषण का उपयोग करती है। इस दृष्टिकोण में, संभाव्यता बंटन की मीट्रिक ज्यामिति का अध्ययन किया जाता है; यह दृष्टिकोण अनुमानित त्रुटि को मापता है, उदाहरण के लिए, कुल्बैक-लीब्लर विचलन, ब्रैगमैन विचलन, और हेलिंगर दूरी। अनिश्चित रूप से बड़े नमूनों के साथ, स्पर्शोन्मुख सिद्धांत (सांख्यिकी) केंद्रीय सीमा प्रमेय की तरह नमूना आँकड़ों के सीमित वितरण का वर्णन करता है यदि कोई मौजूद है। सीमित परिणाम परिमित नमूनों के बारे में कथन नहीं हैं, और वास्तव में परिमित नमूनों के लिए अप्रासंगिक हैं।  हालांकि, परिमित नमूनों के साथ काम करने के लिए वितरण को सीमित करने के स्पर्शोन्मुख सिद्धांत को अक्सर लागू किया जाता है। उदाहरण के लिए, सीमित परिणाम अक्सर क्षणों की सामान्यीकृत विधि और सामान्यीकृत अनुमान समीकरणों के उपयोग को सही ठहराने के लिए लागू होते हैं, जो कि अर्थमिति और जैव-सांख्यिकी में लोकप्रिय हैं। सीमित वितरण और वास्तविक वितरण (औपचारिक रूप से, सन्निकटन की 'त्रुटि') के बीच अंतर के परिमाण का मूल्यांकन सिमुलेशन का उपयोग करके किया जा सकता है. परिमित नमूनों के परिणामों को सीमित करने का अनुमानी अनुप्रयोग कई अनुप्रयोगों में सामान्य अभ्यास है, विशेष रूप से लघु-आयामी अवतल कार्य के साथ निम्न-आयामी सांख्यिकीय मॉडल के साथ। लॉग-अवतल संभावना कार्य (जैसे एक-पैरामीटर घातीय परिवारों के साथ)।

यादृच्छिकीकरण आधारित मॉडल
किसी दिए गए डेटासेट के लिए जो एक यादृच्छिककरण डिज़ाइन द्वारा निर्मित किया गया था, एक सांख्यिकीय (शून्य-परिकल्पना के तहत) के यादृच्छिककरण वितरण को सभी योजनाओं के लिए परीक्षण आंकड़े का मूल्यांकन करके परिभाषित किया गया है जो कि यादृच्छिककरण डिज़ाइन द्वारा उत्पन्न किया जा सकता था। बारंबारतावादी अनुमान में, यादृच्छिककरण एक व्यक्तिपरक मॉडल के बजाय यादृच्छिककरण वितरण पर आधारित होने की अनुमति देता है, और यह विशेष रूप से सर्वेक्षण नमूनाकरण और प्रयोगों के डिजाइन में महत्वपूर्ण है। यादृच्छिक अध्ययन से सांख्यिकीय निष्कर्ष भी कई अन्य स्थितियों की तुलना में अधिक सीधा है।  बायेसियन अनुमान में, यादृच्छिककरण भी महत्वपूर्ण है: सर्वेक्षण नमूनाकरण में, प्रतिस्थापन के बिना नमूने का उपयोग जनसंख्या के साथ नमूने की विनिमयशीलता सुनिश्चित करता है; यादृच्छिक प्रयोगों में, यादृच्छिककरण कोवरिएट जानकारी के लिए यादृच्छिक धारणा पर लापता होने का वारंट करता है। वस्तुनिष्ठ यादृच्छिककरण ठीक से आगमनात्मक प्रक्रियाओं की अनुमति देता है। कई सांख्यिकीविद् डेटा के यादृच्छिककरण-आधारित विश्लेषण को पसंद करते हैं जो कि अच्छी तरह से परिभाषित यादृच्छिकीकरण प्रक्रियाओं द्वारा उत्पन्न किया गया था। (हालांकि, यह सच है कि विज्ञान के क्षेत्रों में विकसित सैद्धांतिक ज्ञान और प्रयोगात्मक नियंत्रण के साथ, यादृच्छिक प्रयोग अनुमानों की गुणवत्ता में सुधार किए बिना प्रयोग की लागत बढ़ा सकते हैं। ) इसी तरह, प्रमुख सांख्यिकीय अधिकारियों द्वारा यादृच्छिक प्रयोगों के परिणामों की सिफारिश की जाती है क्योंकि समान घटनाओं के अवलोकन संबंधी अध्ययनों की तुलना में अधिक विश्वसनीयता वाले अनुमानों की अनुमति होती है। हालांकि, एक अच्छा अवलोकन संबंधी अध्ययन एक खराब यादृच्छिक प्रयोग से बेहतर हो सकता है।

एक यादृच्छिक प्रयोग का सांख्यिकीय विश्लेषण प्रायोगिक प्रोटोकॉल में वर्णित यादृच्छिकीकरण योजना पर आधारित हो सकता है और इसके लिए व्यक्तिपरक मॉडल की आवश्यकता नहीं होती है। हालाँकि, किसी भी समय, कुछ परिकल्पनाओं का वस्तुनिष्ठ सांख्यिकीय मॉडल का उपयोग करके परीक्षण नहीं किया जा सकता है, जो यादृच्छिक प्रयोगों या यादृच्छिक नमूनों का सटीक वर्णन करते हैं। कुछ मामलों में, ऐसे यादृच्छिक अध्ययन असंवैधानिक या अनैतिक हैं।

यादृच्छिक प्रयोगों का मॉडल-आधारित विश्लेषण
यादृच्छिक प्रयोगों से डेटा का विश्लेषण करते समय एक सांख्यिकीय मॉडल, उदाहरण के लिए, एक रैखिक या रसद मॉडल को संदर्भित करना मानक अभ्यास है। हालाँकि, यादृच्छिककरण योजना एक सांख्यिकीय मॉडल की पसंद का मार्गदर्शन करती है। यादृच्छिकीकरण योजना को जाने बिना उपयुक्त मॉडल का चयन करना संभव नहीं है। प्रयोगात्मक प्रोटोकॉल की अनदेखी करते हुए यादृच्छिक प्रयोगों से डेटा का विश्लेषण करके गंभीर रूप से भ्रामक परिणाम प्राप्त किए जा सकते हैं; सामान्य गलतियों में एक प्रयोग में उपयोग किए गए अवरोधन को भूल जाना और एक ही प्रायोगिक इकाई पर बार-बार माप को अलग-अलग प्रायोगिक इकाइयों पर लागू उपचार की स्वतंत्र प्रतिकृति के साथ भ्रमित करना शामिल है।

मॉडल-मुक्त यादृच्छिककरण अनुमान
मॉडल-मुक्त तकनीकें मॉडल-आधारित विधियों का पूरक प्रदान करती हैं, जो वास्तविकता-सरलीकरण की न्यूनीकरणवादी रणनीतियों को नियोजित करती हैं। पूर्व संयोजन, विकास, पहनावा और एल्गोरिदम को गतिशील रूप से एक प्रक्रिया के प्रासंगिक समानता के अनुकूल बनाने और टिप्पणियों की आंतरिक विशेषताओं को सीखने के लिए। उदाहरण के लिए, मॉडल-मुक्त सरल रेखीय प्रतिगमन या तो पर आधारित है
 * एक यादृच्छिक डिजाइन, जहां टिप्पणियों के जोड़े $$(X_1,Y_1), (X_2,Y_2), \cdots, (X_n,Y_n)$$ स्वतंत्र और समान रूप से वितरित (आईआईडी) हैं, या
 * एक नियतात्मक डिजाइन, जहां चर $$X_1, X_2, \cdots, X_n$$ नियतात्मक हैं, लेकिन संबंधित प्रतिक्रिया चर $$Y_1,Y_2, \cdots, Y_n$$ एक सामान्य सशर्त वितरण के साथ यादृच्छिक और स्वतंत्र हैं, अर्थात, $$P\left (Y_j \leq y | X_j =x\right ) = D_x(y)$$, जो सूचकांक से स्वतंत्र है $$j$$.

किसी भी मामले में, सामान्य सशर्त वितरण की सुविधाओं के लिए मॉडल-मुक्त यादृच्छिककरण अनुमान $$D_x(.)$$ कुछ नियमितता स्थितियों पर निर्भर करता है, उदा। कार्यात्मक चिकनाई। उदाहरण के लिए, जनसंख्या सुविधा सशर्त माध्य के लिए मॉडल-मुक्त यादृच्छिककरण अनुमान, $$\mu(x)=E(Y | X = x)$$, अनुमान के तहत स्थानीय औसत या स्थानीय बहुपद फिटिंग के माध्यम से लगातार अनुमान लगाया जा सकता है $$\mu(x)$$ चिकना है। इसके अलावा, स्पर्शोन्मुख सामान्यता या पुनरुत्पादन पर भरोसा करते हुए, हम जनसंख्या विशेषता के लिए विश्वास अंतराल का निर्माण कर सकते हैं, इस मामले में, सशर्त माध्य, $$\mu(x)$$.

अनुमान के प्रतिमान
सांख्यिकीय अनुमान के विभिन्न स्कूल स्थापित हो गए हैं। ये स्कूल-या प्रतिमान-पारस्परिक रूप से अनन्य नहीं हैं, और जो तरीके एक प्रतिमान के तहत अच्छी तरह से काम करते हैं, उनकी अक्सर अन्य प्रतिमानों के तहत आकर्षक व्याख्या होती है।

बंद्योपाध्याय और फोस्टर चार प्रतिमानों का वर्णन करते हैं: क्लासिकल (या आवृत्तिवादी अनुमान) प्रतिमान, बायेसियन अनुमान प्रतिमान, संभावनावाद प्रतिमान, और एकाइके सूचना मानदंड | अकाइकेन-सूचना मानदंड-आधारित प्रतिमान।

आवृत्तिवादी अनुमान
यह प्रतिमान हाथ में एक के समान डेटासेट बनाने के लिए जनसंख्या वितरण के बार-बार नमूने पर विचार करके प्रस्तावों की संभाव्यता को जांचता है। दोहराए गए नमूने के तहत डेटासेट की विशेषताओं पर विचार करके, एक सांख्यिकीय प्रस्ताव के फ़्रीक्वेंटिस्ट गुणों को परिमाणित किया जा सकता है - हालांकि व्यवहार में यह परिमाणीकरण चुनौतीपूर्ण हो सकता है।

फ़्रीक्वेंटिस्ट अनुमान के उदाहरण

 * पी-वैल्यू | पी-वैल्यू
 * विश्वास अंतराल
 * अशक्त परिकल्पना महत्व परीक्षण

आवृत्तिवादी अनुमान, वस्तुनिष्ठता और निर्णय सिद्धांत
बारंबारतावादी अनुमान (या शास्त्रीय अनुमान) की एक व्याख्या यह है कि यह केवल आवृत्ति संभावना के संदर्भ में लागू होता है; यानी, किसी आबादी से बार-बार नमूने लेने के संदर्भ में। हालांकि, नेमन का दृष्टिकोण पूर्व-प्रयोग संभावनाओं के संदर्भ में इन प्रक्रियाओं को विकसित करता है। अर्थात्, एक प्रयोग करने से पहले, एक निष्कर्ष पर आने के लिए एक नियम तय करता है जैसे कि सही होने की संभावना को एक उपयुक्त तरीके से नियंत्रित किया जाता है: इस तरह की संभावना को बारंबारतावादी या बार-बार नमूना व्याख्या की आवश्यकता नहीं होती है। इसके विपरीत, बायेसियन अनुमान सशर्त संभावनाओं के संदर्भ में काम करता है (अर्थात देखे गए डेटा पर सशर्त संभावनाएं), सीमांत (लेकिन अज्ञात मापदंडों पर सशर्त) संभावनाओं की तुलना में लगातार दृष्टिकोण में उपयोग किया जाता है।

उपयोगिता कार्यों के संबंध में महत्व परीक्षण और विश्वास अंतराल की लगातार प्रक्रियाओं का निर्माण किया जा सकता है। हालाँकि, फ़्रीक्वेंटिस्ट सांख्यिकी के कुछ तत्व, जैसे कि सांख्यिकीय निर्णय सिद्धांत, उपयोगिता कार्यों को शामिल करते हैं। विशेष रूप से, इष्टतम अनुमान (जैसे न्यूनतम-विचरण निष्पक्ष अनुमानक, या समान रूप से सबसे शक्तिशाली परीक्षण) के लगातार विकास हानि कार्यों का उपयोग करते हैं, जो (नकारात्मक) उपयोगिता कार्यों की भूमिका निभाते हैं। सांख्यिकीय सिद्धांतकारों को यह साबित करने के लिए हानि कार्यों को स्पष्ट रूप से नहीं बताया जाना चाहिए कि एक सांख्यिकीय प्रक्रिया में इष्टतमता संपत्ति है। हालांकि, नुकसान-फ़ंक्शन अक्सर इष्टतम गुणों को बताते हुए उपयोगी होते हैं: उदाहरण के लिए, औसत-निष्पक्ष अनुमानक पूर्ण मूल्य हानि कार्यों के तहत इष्टतम होते हैं, जिसमें वे अपेक्षित हानि को कम करते हैं, और कम से कम वर्ग अनुमानक वर्ग त्रुटि हानि कार्यों के तहत इष्टतम होते हैं, जिसमें वे अपेक्षित नुकसान को कम करें।

जबकि बारंबारतावादी अनुमान का उपयोग करने वाले सांख्यिकीविदों को स्वयं के लिए रुचि के मापदंडों का चयन करना चाहिए, और उपयोग किए जाने वाले अनुमानक/परीक्षण आंकड़े#सामान्य परीक्षण आंकड़े, स्पष्ट रूप से स्पष्ट उपयोगिताओं और पूर्व वितरण की अनुपस्थिति ने आवृत्तिवादी प्रक्रियाओं को व्यापक रूप से 'उद्देश्य' के रूप में देखने में मदद की है।

बायेसियन अनुमान
बायेसियन कलन संभाव्यता की 'भाषा' का उपयोग करके विश्वास की डिग्री का वर्णन करता है; विश्वास सकारात्मक हैं, एक में एकीकृत होते हैं, और संभाव्यता स्वयंसिद्धों का पालन करते हैं। बायेसियन अनुमान सांख्यिकीय प्रस्ताव बनाने के आधार के रूप में उपलब्ध पश्च विश्वासों का उपयोग करता है। बायेसियन प्रायिकता हैं # बायेसियन दृष्टिकोण का उपयोग करने के लिए बायेसियन संभावनाओं का औचित्य।

बायेसियन अनुमान के उदाहरण

 * अंतराल अनुमान के लिए विश्वसनीय अंतराल
 * मॉडल तुलना के लिए बेयस कारक

बायेसियन अनुमान, व्यक्तिपरकता और निर्णय सिद्धांत
कई अनौपचारिक बायेसियन संदर्भ पश्च के सहज रूप से उचित सारांश पर आधारित हैं। उदाहरण के लिए, पश्च माध्य, मध्य और विधा, उच्चतम पश्च घनत्व अंतराल, और बेयस कारक सभी इस तरह से प्रेरित हो सकते हैं। हालांकि इस प्रकार के अनुमान के लिए एक उपयोगकर्ता के उपयोगिता कार्य को बताने की आवश्यकता नहीं है, ये सारांश पहले बताए गए विश्वासों पर निर्भर करते हैं (कुछ हद तक), और आम तौर पर व्यक्तिपरक निष्कर्ष के रूप में देखे जाते हैं। (पूर्व निर्माण की विधियाँ जिनमें बाहरी इनपुट की आवश्यकता नहीं होती है बायेसियन संभाव्यता # व्यक्तिगत संभावनाएँ और पुरोहितों के निर्माण के लिए वस्तुनिष्ठ विधियाँ हैं लेकिन अभी तक पूरी तरह से विकसित नहीं हुई हैं।)

औपचारिक रूप से, बायेसियन इंट्रेंस को स्पष्ट रूप से बताई गई उपयोगिता, या हानि फ़ंक्शन के संदर्भ में कैलिब्रेट किया जाता है; 'बेयस नियम' वह है जो अपेक्षित उपयोगिता को अधिकतम करता है, पश्च अनिश्चितता पर औसत। इसलिए औपचारिक बायेसियन अनुमान स्वचालित रूप से एक निर्णय सिद्धांत अर्थ में इष्टतम निर्णय प्रदान करता है। मान्यताओं, डेटा और उपयोगिता को देखते हुए, बायेसियन अनुमान अनिवार्य रूप से किसी भी समस्या के लिए बनाया जा सकता है, हालांकि हर सांख्यिकीय अनुमान की बायेसियन व्याख्या की आवश्यकता नहीं है। विश्लेषण जो औपचारिक रूप से बायेसियन नहीं हैं (तार्किक रूप से) सुसंगतता (सांख्यिकी) हो सकते हैं; बायेसियन प्रक्रियाओं की एक विशेषता जो उचित पुरोहितों का उपयोग करती है (अर्थात वे जो एक के लिए पूर्णांक हैं) यह है कि उन्हें सुसंगतता (सांख्यिकी) होने की गारंटी दी जाती है। बायेसियन अनुमान के कुछ पैरोकार दावा करते हैं कि इस निर्णय-सैद्धांतिक ढांचे में अनुमान लगाया जाना चाहिए, और बायेसियन अनुमान को बाद के विश्वासों के मूल्यांकन और सारांश के साथ समाप्त नहीं करना चाहिए।

संभावना आधारित अनुमान
संभावना फ़ंक्शन का उपयोग करके संभावनावाद आंकड़ों तक पहुंचता है। कुछ संभाव्यवादी आँकड़ों को साक्ष्य से केवल कंप्यूटिंग समर्थन के रूप में मानते हुए, अनुमान को अस्वीकार करते हैं। अन्य, हालांकि, संभावना समारोह के आधार पर अनुमान का प्रस्ताव करते हैं, जिनमें से सबसे प्रसिद्ध अधिकतम संभावना अनुमान है।

एआईसी आधारित अनुमान
Akaike सूचना मानदंड (AIC) डेटा के दिए गए सेट के लिए सांख्यिकीय मॉडल की सापेक्ष गुणवत्ता का एक अनुमानक है। डेटा के लिए मॉडलों के संग्रह को देखते हुए, एआईसी प्रत्येक मॉडल की गुणवत्ता का अनुमान लगाता है, प्रत्येक अन्य मॉडल के सापेक्ष। इस प्रकार, एआईसी मॉडल चयन के लिए एक साधन प्रदान करता है।

एआईसी सूचना सिद्धांत पर आधारित है: यह डेटा उत्पन्न करने वाली प्रक्रिया का प्रतिनिधित्व करने के लिए दिए गए मॉडल का उपयोग करते समय खोई हुई सापेक्ष जानकारी का अनुमान प्रदान करता है। (ऐसा करने में, यह मॉडल के फिट होने की अच्छाई और मॉडल की सादगी के बीच व्यापार-बंद से संबंधित है।)

न्यूनतम विवरण लंबाई
सूचना सिद्धांत में विचारों से न्यूनतम विवरण लंबाई (एमडीएल) सिद्धांत विकसित किया गया है  सूफी (2000)  और कोलमोगोरोव जटिलता का सिद्धांत। रेफरी नाम=एचवाई>हैनसेन एंड यू (2001) (एमडीएल) सिद्धांत सांख्यिकीय मॉडल का चयन करता है जो डेटा को अधिकतम रूप से संपीड़ित करता है; डेटा के लिए प्रतितथ्यात्मक या गैर-मिथ्या डेटा-जनरेटिंग तंत्र या संभाव्यता मॉडल को ग्रहण किए बिना अनुमान आगे बढ़ता है, जैसा कि फ़्रीक्वेंटिस्ट या बायेसियन दृष्टिकोणों में किया जा सकता है।

हालांकि, यदि कोई डेटा जनरेटिंग तंत्र वास्तविकता में मौजूद है, तो क्लाउड शैनन के स्रोत कोडिंग प्रमेय के अनुसार यह डेटा का एमडीएल विवरण प्रदान करता है, औसत और विषम रूप से। रेफ नाम = HY747> हैनसेन और यू (2001), पृष्ठ 747।  विवरण लंबाई (या वर्णनात्मक जटिलता) को कम करने में, एमडीएल अनुमान अधिकतम संभावना अनुमान और अधिकतम पोस्टरियरी अनुमान के समान है (अधिकतम एंट्रॉपी संभाव्यता वितरण का उपयोग करके। अधिकतम) -एन्ट्रॉपी बायेसियन प्रायिकता)। हालाँकि, MDL यह मानने से बचता है कि अंतर्निहित संभावना मॉडल ज्ञात है; एमडीएल सिद्धांत को बिना किसी धारणा के भी लागू किया जा सकता है, जैसे डेटा स्वतंत्र नमूने से उत्पन्न हुआ। एमडीएल सिद्धांत संचार-कोडिंग सिद्धांत में सूचना सिद्धांत में, रैखिक प्रतिगमन में लागू किया गया है, और डेटा माइनिंग में।

एमडीएल-आधारित अनुमानित प्रक्रियाओं का मूल्यांकन अक्सर कम्प्यूटेशनल जटिलता सिद्धांत से तकनीकों या मानदंडों का उपयोग करता है।

प्रत्ययी अनुमान
प्रत्ययी अनुमान, प्रत्ययी संभाव्यता पर आधारित सांख्यिकीय अनुमान के लिए एक दृष्टिकोण था, जिसे प्रत्ययी वितरण के रूप में भी जाना जाता है। बाद के काम में, इस दृष्टिकोण को खराब परिभाषित, प्रयोज्यता में बेहद सीमित और यहां तक ​​कि भ्रामक कहा गया है। हालाँकि यह तर्क वही है जो दिखाता है कि एक तथाकथित विश्वास वितरण एक वैध प्रायिकता डिस्ट्रीब्यूशन नहीं है और चूंकि इसने कॉन्फिडेंस इंटरवल्स के आवेदन को अमान्य नहीं किया है, यह आवश्यक रूप से फिडुशियल तर्कों से निकाले गए निष्कर्षों को अमान्य नहीं करता है। ऊपरी और निचली संभावनाओं का उपयोग करते हुए एक अनुमान सिद्धांत के एक विशेष मामले के रूप में फिशर की फिदुकियल संभावना के शुरुआती कार्य की पुनर्व्याख्या करने का प्रयास किया गया था।

संरचनात्मक अनुमान
1938 से 1939 तक फिशर और पिटमैन के विचारों का विकास, जॉर्ज ए बरनार्ड ने संरचनात्मक अनुमान या निर्णायक अनुमान विकसित किया, समूह परिवार पर हार उपाय का उपयोग कर एक दृष्टिकोण। बरनार्ड ने मॉडलों के एक प्रतिबंधित वर्ग पर प्रत्ययी अनुमान के पीछे के तर्कों को सुधारा, जिस पर प्रत्ययी प्रक्रियाएं अच्छी तरह से परिभाषित और उपयोगी होंगी। डोनाल्ड ए एस फ्रेजर ने संरचनात्मक अनुमान के लिए एक सामान्य सिद्धांत विकसित किया समूह सिद्धांत के आधार पर और इसे रैखिक मॉडल पर लागू किया। फ्रेजर द्वारा तैयार किए गए सिद्धांत में निर्णय सिद्धांत और बायेसियन सांख्यिकी के निकट संबंध हैं और यदि वे मौजूद हैं तो इष्टतम फ़्रीक्वेंटिस्ट निर्णय नियम प्रदान कर सकते हैं।

निष्कर्ष विषय
नीचे दिए गए विषयों को आमतौर पर सांख्यिकीय अनुमान के क्षेत्र में शामिल किया जाता है।
 * 1) सांख्यिकीय धारणाएँ
 * 2) सांख्यिकीय निर्णय सिद्धांत
 * 3) अनुमान सिद्धांत
 * 4) सांख्यिकीय परिकल्पना परीक्षण
 * 5) आंकड़ों में राय संशोधित करना
 * 6) प्रयोगों का डिजाइन, विचरण का विश्लेषण और प्रतिगमन विश्लेषण
 * 7) सर्वे सैंपलिंग
 * 8) सांख्यिकीय डेटा का सारांश

भविष्य कहनेवाला अनुमान
भविष्य कहनेवाला निष्कर्ष सांख्यिकीय अनुमान के लिए एक दृष्टिकोण है जो पिछले टिप्पणियों के आधार पर भविष्य की टिप्पणियों की भविष्यवाणी पर जोर देता है।

प्रारंभ में, भविष्य कहनेवाला अनुमान अवलोकन योग्य मापदंडों पर आधारित था और यह संभाव्यता का अध्ययन करने का मुख्य उद्देश्य था, लेकिन 20वीं शताब्दी में ब्रूनो डी फिनेची द्वारा पेश किए गए एक नए पैरामीट्रिक दृष्टिकोण के कारण यह समर्थन से बाहर हो गया। त्रुटि के साथ देखी गई भौतिक प्रणाली के रूप में दृष्टिकोण ने घटना को प्रतिरूपित किया (उदाहरण के लिए, आकाशीय यांत्रिकी)। डि फिनेटी का विनिमेयता का विचार - कि भविष्य की टिप्पणियों को पिछली टिप्पणियों की तरह व्यवहार करना चाहिए - उनके 1937 के पेपर के फ्रेंच से 1974 के अनुवाद के साथ अंग्रेजी बोलने वाली दुनिया का ध्यान आया, और तब से सीमोर गीजर जैसे सांख्यिकीविदों द्वारा प्रतिपादित किया गया है।

यह भी देखें

 * एल्गोरिथम निष्कर्ष
 * प्रेरण (दर्शन)
 * अनौपचारिक अनुमान तर्क
 * सूचना क्षेत्र सिद्धांत
 * जनसंख्या अनुपात
 * सांख्यिकी का दर्शन
 * भविष्यवाणी अंतराल
 * भविष्य बतानेवाला विश्लेषक
 * भविष्य कहनेवाला मॉडलिंग
 * स्टाइलोमेट्री

स्रोत

 * डेविड आर कॉक्स | कॉक्स, डी आर (2006)। सांख्यिकीय निष्कर्ष के सिद्धांत, कैम्ब्रिज यूनिवर्सिटी प्रेस। ISBN 0-521-68567-2.
 * रोनाल्ड ए. फिशर|फिशर, आर.ए. (1955), स्टैटिस्टिकल मेथड्स एंड साइंटिफिक इंडक्शन, रॉयल स्टैटिस्टिकल सोसाइटी का जर्नल, सीरीज बी, 17, 69-78। (जॉर्ज नेमन और अब्राहम का जन्म हुआ के सांख्यिकीय सिद्धांतों की आलोचना)
 * डेविड ए. फ्रीडमैन | फ्रीडमैन, डी. ए. (2010)। सांख्यिकीय मॉडल और आकस्मिक निष्कर्ष: सामाजिक विज्ञान के साथ एक संवाद (डेविड कोलियर (राजनीतिक वैज्ञानिक), जसजीत एस. सेखों और फिलिप बी. स्टार्क द्वारा संपादित), कैम्ब्रिज यूनिवर्सिटी प्रेस।
 * के रूप में पुनर्मुद्रित
 * कोनिशी एस., कितागावा जी. (2008), इंफॉर्मेशन क्राइटेरिया एंड स्टैटिस्टिकल मॉडलिंग, स्प्रिंगर।
 * लुसिएन ले कैम|ले कैम, लुसियान। (1986) एसिम्प्टोटिक मेथड्स ऑफ स्टैटिस्टिकल डिसीजन थ्योरी, स्प्रिंगर। ISBN 0-387-96307-3
 * डेविड एस. मूर|मूर, डी.एस.; मैककेबे, जी.पी.; क्रेग, बी.ए. (2015), सांख्यिकी के अभ्यास का परिचय, आठवां संस्करण, मैकमिलन।
 * (फिशर 1955 का उत्तर)
 * चार्ल्स सैंडर्स पियर्स|पियर्स, सी. एस. (1877-1878), इलस्ट्रेशन्स ऑफ़ लॉजिक ऑफ़ साइंस (सीरीज़), लोकप्रिय विज्ञान मासिक, वॉल्यूम। 12-13। प्रासंगिक व्यक्तिगत कागजात:
 * (1878 मार्च), द डॉक्ट्रिन ऑफ चांस, पॉपुलर साइंस मंथली, वी. 12, मार्च अंक, पीपी. 604-615। इंटरनेट आर्काइव Eprint।
 * (1878 अप्रैल), द प्रोबेबिलिटी ऑफ इंडक्शन, पॉपुलर साइंस मंथली, वी. 12, पीपी. 705–718. इंटरनेट आर्काइव Eprint।
 * (1878 जून), द ऑर्डर ऑफ नेचर, पॉपुलर साइंस मंथली, वी. 13, पीपी. 203–217.इंटरनेट आर्काइव [https: //archive.org/stream/popularsciencemo13newy#page/203/mode/1up Eprint]।
 * (1878 अगस्त), डिडक्शन, इंडक्शन और हाइपोथीसिस, पॉपुलर साइंस मंथली, वी. 13, पीपी. 470-482। इंटरनेट आर्काइव Eprint।
 * चार्ल्स सैंडर्स पियर्स | पियर्स, सी.एस. (1883), संभावित अनुमान का सिद्धांत, तर्कशास्त्र में अध्ययन, पीपी। कंपनी। (1983 में पुनर्मुद्रित, जॉन बेंजामिन पब्लिशिंग कंपनी, ISBN 90-272-3271-7)
 * (फिशर 1955 का उत्तर)
 * चार्ल्स सैंडर्स पियर्स|पियर्स, सी. एस. (1877-1878), इलस्ट्रेशन्स ऑफ़ लॉजिक ऑफ़ साइंस (सीरीज़), लोकप्रिय विज्ञान मासिक, वॉल्यूम। 12-13। प्रासंगिक व्यक्तिगत कागजात:
 * (1878 मार्च), द डॉक्ट्रिन ऑफ चांस, पॉपुलर साइंस मंथली, वी. 12, मार्च अंक, पीपी. 604-615। इंटरनेट आर्काइव Eprint।
 * (1878 अप्रैल), द प्रोबेबिलिटी ऑफ इंडक्शन, पॉपुलर साइंस मंथली, वी. 12, पीपी. 705–718. इंटरनेट आर्काइव Eprint।
 * (1878 जून), द ऑर्डर ऑफ नेचर, पॉपुलर साइंस मंथली, वी. 13, पीपी. 203–217.इंटरनेट आर्काइव [https: //archive.org/stream/popularsciencemo13newy#page/203/mode/1up Eprint]।
 * (1878 अगस्त), डिडक्शन, इंडक्शन और हाइपोथीसिस, पॉपुलर साइंस मंथली, वी. 13, पीपी. 470-482। इंटरनेट आर्काइव Eprint।
 * चार्ल्स सैंडर्स पियर्स | पियर्स, सी.एस. (1883), संभावित अनुमान का सिद्धांत, तर्कशास्त्र में अध्ययन, पीपी। कंपनी। (1983 में पुनर्मुद्रित, जॉन बेंजामिन पब्लिशिंग कंपनी, ISBN 90-272-3271-7)

अग्रिम पठन

 * Casella, G., Berger, R. L. (2002). Statistical Inference. Duxbury Press. ISBN 0-534-24312-6
 * Held L., Bové D.S. (2014). Applied Statistical Inference—Likelihood and Bayes (Springer).
 * Rahlf, Thomas (2014). "Statistical Inference", in Claude Diebolt, and Michael Haupert (eds.), "Handbook of Cliometrics ( Springer Reference Series)", Berlin/Heidelberg: Springer. http://www.springerreference.com/docs/html/chapterdbid/372458.html
 * Sagitov, Serik (2022). "Statistical Inference". Wikibooks. http://upload.wikimedia.org/wikipedia/commons/f/f9/Statistical_Inference.pdf
 * Young, G.A., Smith, R.L. (2005). Essentials of Statistical Inference, CUP. ISBN 0-521-83971-8
 * Rahlf, Thomas (2014). "Statistical Inference", in Claude Diebolt, and Michael Haupert (eds.), "Handbook of Cliometrics ( Springer Reference Series)", Berlin/Heidelberg: Springer. http://www.springerreference.com/docs/html/chapterdbid/372458.html
 * Sagitov, Serik (2022). "Statistical Inference". Wikibooks. http://upload.wikimedia.org/wikipedia/commons/f/f9/Statistical_Inference.pdf
 * Young, G.A., Smith, R.L. (2005). Essentials of Statistical Inference, CUP. ISBN 0-521-83971-8
 * Young, G.A., Smith, R.L. (2005). Essentials of Statistical Inference, CUP. ISBN 0-521-83971-8

इस पेज में लापता आंतरिक लिंक की सूची

 * प्रायिकता वितरण
 * सांख्यिकीय जनसंख्या
 * बिंदु लागत
 * आवृत्ति संभावना
 * नमूना माध्य
 * ब्रेगमैन विचलन
 * जैव सांख्यिकी
 * संभावना समारोह
 * लघुगणकीय रूप से अवतल कार्य
 * बायेसियन निष्कर्ष
 * यादृच्छिक रूप से लापता
 * विनिमय योग्यता
 * प्रतिस्थापन के बिना नमूनाकरण
 * एकैके सूचना मानदंड
 * शून्य परिकल्पना
 * उपयोगिता समारोह
 * लॉस फंकशन
 * आकलनकर्ता
 * निरपेक्ष मूल्य
 * कम से कम वर्गों
 * बायस कारक
 * जुटना (सांख्यिकी)
 * स्वस्थ रहने के फायदे
 * क़ीमत लगानेवाला
 * पश्च अनुमान से अधिकतम
 * बायेसियन संभावना
 * अधिकतम एन्ट्रापी संभाव्यता वितरण
 * रेखीय प्रतिगमन
 * प्रत्ययी संभावना
 * ऊपरी और निचली संभावनाएँ
 * उसका नाप
 * सांख्यिकी में राय को संशोधित करना
 * भिन्नता का विश्लेषण
 * प्रयोगों की रूप रेखा
 * संभावना

बाहरी संबंध

 * Statistical Inference lecture on the MIT OpenCourseWare platform
 * Statistical Inference lecture by the National Programme on Technology Enhanced Learning