कम्प्यूटेशनल आँकड़े



कम्प्यूटेशनल सांख्यिकी, या सांख्यिकीय कंप्यूटिंग, सांख्यिकी और कंप्यूटर विज्ञान के बीच का बंधन है। इसका अर्थ यह है कि सांख्यिकीय विधियाँ जो कम्प्यूटेशनल विधियों का उपयोग करके सक्षम की जाती हैं। यह सांख्यिकी के गणितीय विज्ञान के लिए विशिष्ट कम्प्यूटेशनल विज्ञान (या वैज्ञानिक कंप्यूटिंग) का क्षेत्र है। यह क्षेत्र भी तेजी से विकसित हो रहा है, जिसके कारण यह मांग उठने लगी है कि कंप्यूटिंग की व्यापक अवधारणा को सामान्य सांख्यिकीय शिक्षा के हिस्से के रूप में पढ़ाया जाना चाहिए।

मौलिक सांख्यिकी की तरह लक्ष्य को असंसाधित्र आँकड़ा (रॉ डाटा) को ज्ञान में बदलना है, परन्तु यहाँ ध्यान कंप्यूटर-गहन सांख्यिकीय तरीकों पर है, जैसे कि बहुत बड़े प्रतिदर्श आमाप (सैंपल साइज) और गैर-सजातीय डेटा सेट वाले मामले में हैं।

शब्द 'कम्प्यूटेशनल स्टैटिस्टिक्स' और 'स्टैटिस्टिकल कंप्यूटिंग' का प्रयोग प्रायः एक दूसरे के स्थान पर किया जाता है, हालांकि कार्लो लॉरो (सांख्यिकीय कंप्यूटिंग के लिए इंटरनेशनल एसोसिएशन के एक पूर्व अध्यक्ष) ने सांख्यिकी के लिए कंप्यूटर विज्ञान के अनुप्रयोग के रूप में 'सांख्यिकीय कंप्यूटिंग' को परिभाषित करते हुए एक अंतर बनाने का प्रस्ताव दिया था। और 'कम्प्यूटेशनल सांख्यिकी' को लागू करने के लिए एल्गोरिथम के डिजाइन के लक्ष्य के रूप में कंप्यूटर पर सांख्यिकीय तरीके, कंप्यूटर से पहले अकल्पनीय सहित उम्र (जैसे बूटस्ट्रैपिंग (सांख्यिकी), मोंटे कार्लो सिमुलेशन), साथ ही साथ विश्लेषणात्मक रूप से जटिल समस्याओं से निपटने के लिए [sic]।

'कम्प्यूटेशनल सांख्यिकी' और 'सांख्यिकीय कंप्यूटिंग' शब्द प्रायः एक दूसरे के स्थान पर उपयोग किए जाते हैं, हालांकि कार्लो लॉरो (इंटरनेशनल एसोसिएशन फॉर स्टैटिस्टिकल कंप्यूटिंग के पूर्व अध्यक्ष) ने 'सांख्यिकीय कंप्यूटिंग' को "सांख्यिकी के लिए कंप्यूटर विज्ञान के अनुप्रयोग" के रूप में परिभाषित करते हुए एक अंतर बनाने का प्रस्ताव दिया। ", और 'कम्प्यूटेशनल आँकड़े' का उद्देश्य "कंप्यूटर पर सांख्यिकीय तरीकों को लागू करने के लिए एक एल्गोरिदम के डिजाइन का लक्ष्य रखना है, जिसमें कंप्यूटर युग से पहले अकल्पनीय (जैसे बूटस्ट्रैपिंग (सांख्यिकी), सिमुलेशन) सम्मिलित हैं, साथ ही विश्लेषणात्मक रूप से कठिन समस्याओं से निपटना भी सम्मिलित है" [sic]।

'कम्प्यूटेशनल सांख्यिकी' शब्द का उपयोग कम्प्यूटेशनल रूप से गहन सांख्यिकीय तरीकों को संदर्भित करने के लिए भी किया जा सकता है, जिसमें पुनः प्रतिचयन विधियां, मार्कोव चेन मोंटे कार्लो, स्थानीय प्रतिगमन, कर्नेल घनत्व अनुमान, कृत्रिम तंत्रिका नेटवर्क और सामान्यीकृत योजक मॉडल सम्मिलित हैं।

इतिहास
हालाँकि कम्प्यूटेशनल आँकड़ों का आज व्यापक रूप से उपयोग किया जाता है, लेकिन वास्तव में सांख्यिकी समुदाय में इसकी स्वीकृति का इतिहास अपेक्षाकृत छोटा है। अधिकांश भाग के लिए, सांख्यिकी के क्षेत्र के संस्थापक कम्प्यूटेशनल सांख्यिकीय पद्धति के विकास में गणित और स्पर्शोन्मुख अनुमानों पर निर्भर थे।

सांख्यिकीय क्षेत्र में, "कंप्यूटर" शब्द का पहला उपयोग 1891 में रॉबर्ट पी. पोर्टर द्वारा जर्नल ऑफ़ द अमेरिकन स्टैटिस्टिकल एसोसिएशन आर्काइव्स के एक लेख में मिलता है। लेख में 11वीं जनगणना में हरमन होलेरिथ की मशीन के उपयोग पर चर्चा की गई है। हरमन होलेरिथ की मशीन, जिसे टेबुलेटिंग मशीन भी कहा जाता है, एक इलेक्ट्रोमैकेनिकल मशीन थी जिसे छिद्रित कार्डों पर संग्रहीत जानकारी को संक्षेप में प्रस्तुत करने में सहायता के लिए डिज़ाइन किया गया था। इसका आविष्कार एक अमेरिकी व्यवसायी, आविष्कारक और सांख्यिकीविद् हरमन होलेरिथ (29 फरवरी, 1860 - 17 नवंबर, 1929) द्वारा किया गया था। पंच कार्ड टेबुलेटिंग मशीन के उनके आविष्कार का 1884 में पेटेंट कराया गया था, और बाद में संयुक्त राज्य अमेरिका की 1890 की जनगणना में इसका इस्तेमाल किया गया था। प्रौद्योगिकी के लाभ तुरंत स्पष्ट हो गए। 1880 की जनगणना, लगभग 50 मिलियन लोगों के साथ, और इसे सारणीबद्ध करने में 7 साल से अधिक का समय लगा। जबकि 1890 की जनगणना में 62 मिलियन से अधिक लोगों को सम्मिलित करने में एक वर्ष से भी कम समय लगा। यह मशीनीकृत कम्प्यूटेशनल सांख्यिकी और अर्धस्वचालित डेटा प्रोसेसिंग सिस्टम के युग की प्रारंभ का प्रतीक है।

1908 में, विलियम सीली गॉसेट ने अपनी अब तक की प्रसिद्ध मोंटे कार्लो पद्धति का अनुकरण किया, जिसके परिणामस्वरूप छात्र के टी-वितरण की खोज हुई। कम्प्यूटेशनल तरीकों की मदद से, उनके पास संबंधित सैद्धांतिक वितरणों पर आच्छादित अनुभवजन्य वितरणों के प्लॉट भी हैं। कंप्यूटर ने सिमुलेशन में क्रांति ला दी है और गॉसेट के प्रयोग की प्रतिकृति को एक अभ्यास से थोड़ा अधिक बना दिया है।

बाद में, वैज्ञानिकों ने छद्म-यादृच्छिक विचलन उत्पन्न करने के कम्प्यूटेशनल तरीकों को सामने रखा, व्युत्क्रम संचयी वितरण फलन या स्वीकृति-अस्वीकृति विधियों का उपयोग करके समान विचलन को अन्य वितरण रूपों में परिवर्तित करने के तरीकों का प्रदर्शन किया, और मार्कोव श्रृंखला मोंटे कार्लो के लिए स्थिति-अंतरिक्ष पद्धति विकसित की थी। पूरी तरह से स्वचालित तरीके से यादृच्छिक अंक उत्पन्न करने के पहले प्रयासों में से एक 1947 में रैंड कॉपोरेशन (RAND Corporation) द्वारा किया गया था। उत्पादित तालिकाओं को 1955 में एक पुस्तक के रूप में और पंच कार्ड की एक श्रृंखला के रूप में भी प्रकाशित किया गया था।

वर्ष 1950 के दशक के मध्य तक, यादृच्छिक संख्या जनरेटर के लिए उपकरणों के लिए कई लेख और पेटेंट प्रस्तावित किए गए थे।। इन उपकरणों का विकास सांख्यिकीय विश्लेषण में सिमुलेशन और अन्य मूलभूत घटकों को निष्पादित करने के लिए यादृच्छिक अंकों का उपयोग करने की आवश्यकता से प्रेरित था। ऐसे उपकरणों में सबसे प्रसिद्ध में से एक ERNIE है, जो यादृच्छिक संख्याएँ उत्पन्न करता है जो यूनाइटेड किंगडम में जारी लॉटरी बांड, प्रीमियम बॉन्ड के विजेताओं का निर्धारण करता है। 1958 में, जॉन टुकी का जैकनाइफ़ विकसित किया गया था। यह गैर-मानक परिस्थितियों में नमूनों में पैरामीटर अनुमानों के पूर्वाग्रह को कम करने की एक विधि के रूप में है। इसके व्यावहारिक कार्यान्वयन के लिए कंप्यूटर की आवश्यकता होती है। अब तक, कंप्यूटर ने कई कठिन सांख्यिकीय अध्ययनों को संभव बना दिया है।

अधिकतम संभावना अनुमान
अधिकतम संभावना अनुमान का उपयोग कुछ देखे गए डेटा को देखते हुए, अनुमानित संभाव्यता वितरण के मापदंडों का अनुमान लगाने के लिए किया जाता है। यह एक संभाविता फलन को अधिकतम करके प्राप्त किया जाता है ताकि अनुमानित सांख्यिकीय मॉडल के तहत मनाया गया डेटा सबसे अधिक संभावित हो।

मोंटे कार्लो विधि
मोंटे कार्लो एक सांख्यिकीय विधि है जो संख्यात्मक परिणाम प्राप्त करने के लिए बार-बार यादृच्छिक नमूने पर निर्भर करती है। अवधारणा यह है कि उन समस्याओं को हल करने के लिए यादृच्छिकता का उपयोग किया जाए जो सिद्धांत रूप में नियतात्मक हो सकती हैं। इन्हें प्रायः भौतिक और गणितीय समस्याओं में उपयोग किया जाता है और जब अन्य तरीकों का उपयोग करना मुश्किल होता है तो ये सबसे उपयोगी होते हैं। मोंटे कार्लो विधियों का उपयोग मुख्य रूप से तीन समस्या वर्गों में किया जाता है: अनुकूलन, संख्यात्मक एकीकरण, और संभाव्यता वितरण से ड्रॉ उत्पन्न करना है।

मार्कोव चेन मोंटे कार्लो
मार्कोव श्रृंखला मोंटे कार्लो विधि एक निरंतर यादृच्छिक चर से नमूने बनाती है, जिसमें संभाव्यता घनत्व एक ज्ञात फलन के लिए आनुपातिक होता है। इन नमूनों का उपयोग उस चर पर एक अभिन्न अंग का उसके अपेक्षित मूल्य या भिन्नता के रूप में मूल्यांकन करने के लिए किया जा सकता है। जितने अधिक चरण सम्मिलित किए जाते हैं, नमूने का वितरण वास्तविक वांछित वितरण से उतना ही अधिक मेल खाता है।

अनुप्रयोग

 * कम्प्यूटेशनल बायोलॉजी
 * अभिकलनात्मक भाषाविज्ञान
 * कम्प्यूटेशनल भौतिकी
 * कम्प्यूटेशनल गणित
 * कम्प्यूटेशनल सामग्री विज्ञान

कम्प्यूटेशनल सांख्यिकी जर्नल

 * सांख्यिकी में संचार - अनुकरण और संगणना
 * कम्प्यूटेशनल सांख्यिकी
 * कम्प्यूटेशनल सांख्यिकी और डेटा विश्लेषण
 * कम्प्यूटेशनल और ग्राफिकल सांख्यिकी का जर्नल
 * जर्नल ऑफ स्टैटिस्टिकल कंप्यूटेशन एंड सिमुलेशन
 * जर्नल ऑफ स्टैटिस्टिकल सॉफ्टवेयर
 * द आर जर्नल


 * द स्टाटा जर्नल


 * सांख्यिकी और कम्प्यूटिंग
 * विले अंतःविषय समीक्षा कम्प्यूटेशनल सांख्यिकी

एसोसिएशन

 * सांख्यिकीय कंप्यूटिंग के लिए अंतर्राष्ट्रीय संघ

यह भी देखें

 * सांख्यिकीय वर्गीकरण के लिए एल्गोरिदम
 * डेटा विज्ञान
 * आर्टिफिशियल इंटेलिजेंस#सांख्यिकीय
 * मुफ्त सांख्यिकीय सॉफ्टवेयर
 * सांख्यिकीय एल्गोरिदम की सूची
 * सांख्यिकीय पैकेजों की सूची
 * यंत्र अधिगम

एसोसिएशन

 * इंटरनेशनल एसोसिएशन फॉर स्टैटिस्टिकल कंप्यूटिंग
 * अमेरिकन स्टैटिस्टिकल एसोसिएशन का स्टैटिस्टिकल कंप्यूटिंग सेक्शन

पत्रिकाओं

 * Computational Statistics & Data Analysis
 * Journal of Computational & Graphical Statistics
 * Statistics and Computing