सांख्यिकीय यादृच्छिकता

एक संख्यात्मक अनुक्रम को सांख्यिकीय रूप से यादृच्छिक कहा जाता है जब इसमें कोई पहचानने योग्य पैटर्न या नियमितता नहीं होती है; अनुक्रम जैसे आदर्श पासा के परिणाम या pi|π के अंक सांख्यिकीय यादृच्छिकता प्रदर्शित करते हैं।

सांख्यिकीय यादृच्छिकता आवश्यक रूप से वास्तविक यादृच्छिकता, अर्थात वस्तुनिष्ठ अप्रत्याशितता का संकेत नहीं देती है। छद्म यादृच्छिकता कई उपयोगों के लिए पर्याप्त है, जैसे आँकड़े, इसलिए नाम सांख्यिकीय यादृच्छिकता है।

वैश्विक यादृच्छिकता और स्थानीय यादृच्छिकता अलग हैं। यादृच्छिकता की अधिकांश दार्शनिक अवधारणाएं वैश्विक हैं - क्योंकि वे इस विचार पर आधारित हैं कि लंबे समय में क्रम वास्तव में यादृच्छिक दिखता है, तथापि कुछ उप-अनुक्रम यादृच्छिक न दिखें। पर्याप्त लंबाई की संख्याओं के वास्तव में यादृच्छिक अनुक्रम में, उदाहरण के लिए, यह संभव है कि संख्याओं को दोहराने के अतिरिक्त कुछ भी नहीं होगा, चूँकि पूरे क्रम में यादृच्छिक हो सकता है। स्थानीय यादृच्छिकता इस विचार को संदर्भित करती है कि न्यूनतम अनुक्रम लंबाई हो सकती है जिसमें यादृच्छिक वितरण अनुमानित होते हैं। समान संख्याओं के लंबे खंड, यहां तक ​​​​कि वास्तव में यादृच्छिक प्रक्रियाओं द्वारा उत्पन्न किए गए, नमूने की स्थानीय यादृच्छिकता को कम कर देंगे (यह केवल 10,000 संख्याओं के अनुक्रम के लिए स्थानीय रूप से यादृच्छिक हो सकता है; 1,000 से कम के अनुक्रम लेना बिल्कुल भी यादृच्छिक नहीं लग सकता है, के लिए उदाहरण)।

एक पैटर्न प्रदर्शित करने वाला अनुक्रम इस प्रकार सांख्यिकीय रूप से यादृच्छिक नहीं सिद्ध होता है। रैमसे सिद्धांत के सिद्धांतों के अनुसार, पर्याप्त रूप से बड़ी वस्तुओं में आवश्यक रूप से दी गई संरचना होनी चाहिए (पूर्ण विकार असंभव है)।

जुए से संबंधित कानून स्लॉट मशीन पर सांख्यिकीय यादृच्छिकता के कुछ मानकों को लागू करता है।

टेस्ट
यादृच्छिक संख्याओं के लिए पहला परीक्षण एम.जी. द्वारा प्रकाशित किया गया था। 1938 में रॉयल स्टैटिस्टिकल सोसाइटी के जर्नल में केंडल और बर्नार्ड बबिंगटन स्मिथ। वे पियर्सन के ची-स्क्वेर्ड टेस्ट जैसे सांख्यिकीय उपकरणों पर बनाए गए थे जिन्हें यह भेद करने के लिए विकसित किया गया था कि प्रायोगिक घटनाएं उनकी सैद्धांतिक संभावनाओं से मेल खाती हैं या नहीं। पियर्सन ने अपने परीक्षण को मूल रूप से यह दिखाते हुए विकसित किया कि W.F.R द्वारा कई पासा प्रयोग। वेल्डन ने यादृच्छिक व्यवहार प्रदर्शित नहीं किया।

केंडल और स्मिथ के मूल चार परीक्षण सांख्यिकीय परिकल्पना परीक्षण थे, जिन्होंने अपनी शून्य परिकल्पना के रूप में इस विचार को लिया कि किसी दिए गए यादृच्छिक अनुक्रम में प्रत्येक संख्या के होने की समान संभावना थी, और यह कि डेटा में विभिन्न अन्य पैटर्न भी समान रूप से वितरित किए जाने चाहिए।


 * आवृत्ति परीक्षण, बहुत ही मूलभूत था: यह सुनिश्चित करने के लिए जाँच करना कि 0s, 1s, 2s, 3s, आदि की संख्या लगभग समान थी।
 * धारावाहिक परीक्षण, एक ही काम किया किंतु समय में दो अंकों के अनुक्रमों के लिए (00, 01, 02, आदि), उनकी देखी गई आवृत्तियों की तुलना उनके काल्पनिक भविष्यवाणियों से करते हुए वे समान रूप से वितरित किए गए थे।
 * पोकर परीक्षण, गेम पोकर में हाथों के आधार पर एक समय में पांच नंबरों के कुछ अनुक्रमों (AAAAA, AAAAB, AAABB, आदि) के लिए परीक्षण किया गया।
 * अंतराल परीक्षण, शून्य के बीच की दूरी पर देखा गया (00 0 की दूरी होगी, 030 1 की दूरी होगी, 02250 3 की दूरी होगी, आदि)।

यदि दिया गया अनुक्रम इन सभी परीक्षणों को महत्व की डिग्री (सामान्यतः 5%) के अन्दर पारित करने में सक्षम था, तो यह उनके शब्दों में स्थानीय रूप से यादृच्छिक होने का निर्णय किया गया था। केंडल और स्मिथ ने स्थानीय यादृच्छिकता को वास्तविक यादृच्छिकता से अलग किया, जिसमें वास्तव में यादृच्छिक विधियों से उत्पन्न कई अनुक्रम स्थानीय यादृच्छिकता को किसी दिए गए डिग्री तक प्रदर्शित नहीं कर सकते - बहुत बड़े अनुक्रमों में एक अंक की कई पंक्तियाँ हो सकती हैं। यह पूरे अनुक्रम के पैमाने पर यादृच्छिक हो सकता है, किंतु छोटे ब्लॉक में यह यादृच्छिक नहीं होगा (यह उनके परीक्षण पास नहीं करेगा), और कई सांख्यिकीय अनुप्रयोगों के लिए निष्क्रिय होगा।

चूंकि यादृच्छिक संख्या सेट अधिक से अधिक सामान्य हो गए, बढ़ते परिष्कार के अधिक परीक्षणों का उपयोग किया गया। कुछ आधुनिक परीक्षण यादृच्छिक अंकों को त्रि-आयामी विमान पर अंक के रूप में प्लॉट करते हैं, जिसे छिपे हुए पैटर्न को देखने के लिए घुमाया जा सकता है। 1995 में, सांख्यिकीविद् जॉर्ज मार्सग्लिया ने परीक्षणों का सेट बनाया, जिसे कठोर परीक्षण के रूप में जाना जाता है, जिसे वह 5 अरब छद्म यादृच्छिक संख्याओं के सीडी रॉम के साथ वितरित करता है। 2015 में, योंग वांग ने जावा सॉफ्टवेयर पैकेज वितरित किया सांख्यिकीय रूप से दूरी आधारित यादृच्छिकता परीक्षण के लिए।

छद्म यादृच्छिक संख्या जनरेटर को उनकी यादृच्छिकता के लिए विशेष सत्यापन के रूप में परीक्षणों की आवश्यकता होती है, क्योंकि वे निश्चित रूप से यादृच्छिक प्रक्रियाओं द्वारा नहीं किंतु नियतात्मक एल्गोरिदम द्वारा निर्मित होते हैं। यादृच्छिक संख्या पीढ़ी के इतिहास में, संख्या के कई स्रोत जो परीक्षण के अनुसार यादृच्छिक प्रतीत होते थे, बाद में कुछ प्रकार के परीक्षणों के अधीन होने पर बहुत गैर-यादृच्छिक होने की खोज की गई। अर्ध-यादृच्छिक संख्याओं की धारणा को इन समस्याओं में से कुछ को दूर करने के लिए विकसित किया गया था, चूँकि कई अनुप्रयोगों में छद्म यादृच्छिक संख्या जनरेटर अभी भी बड़े पैमाने पर उपयोग किए जाते हैं (यहां तक ​​​​कि जिन्हें अत्यधिक गैर-यादृच्छिक भी कहा जाता है), क्योंकि वे अधिकांश अनुप्रयोगों के लिए पर्याप्त हैं।

अन्य परीक्षण:
 * मोनोबिट परीक्षण यादृच्छिक संख्या जनरेटर के प्रत्येक आउटपुट बिट को सिक्का फ्लिप परीक्षण के रूप में मानता है, और यह निर्धारित करता है कि हेड और टेल की देखी गई संख्या अपेक्षित 50% आवृत्ति के निकट है या नहीं। सिक्का फ्लिप ट्रेल में प्रमुखों की संख्या द्विपद वितरण बनाती है।
 * वाल्ड-वोल्फोवित्ज़ 0 बिट्स और 1 बिट्स के बीच बिट ट्रांज़िशन की संख्या के लिए परीक्षण परीक्षण चलाता है, यादृच्छिक बिट अनुक्रम की अपेक्षित आवृत्ति के साथ प्रेक्षित आवृत्तियों की तुलना करता है।
 * सूचना एन्ट्रापी
 * स्वतः सहसंबंध परीक्षण
 * कोलमोगोरोव-स्मिर्नोव परीक्षण
 * सांख्यिकीय रूप से दूरी आधारित यादृच्छिकता परीक्षण। योंगगे वांग ने दिखाया कि NIST SP800-22 परीक्षण मानक यादृच्छिकता जनरेटर और प्रस्तावित सांख्यिकीय रूप से दूरी आधारित यादृच्छिकता परीक्षण में कुछ कमजोरी का पता लगाने के लिए पर्याप्त नहीं हैं।
 * वर्णक्रमीय घनत्व अनुमान - गैर-यादृच्छिक दोहराव वाले रुझानों का पता लगाने के लिए यादृच्छिक संकेत पर फूरियर रूपांतरण करना इसे आवधिक कार्यों के योग में बदल देता है
 * मौरर का सार्वभौमिक सांख्यिकीय परीक्षण
 * द डेडहार्ड टेस्ट

यह भी देखें

 * एल्गोरिथम यादृच्छिकता
 * चेक (यूनिट टेस्टिंग फ्रेमवर्क) आईएनजी
 * पूर्ण स्थानिक यादृच्छिकता
 * सामान्य संख्या
 * एक समय पैड
 * कोई भी त्रुटि
 * यादृच्छिकता
 * यादृच्छिकता परीक्षण
 * सांख्यिकीय परिकल्पना परीक्षण
 * यादृच्छिकता की सात अवस्थाएँ
 * परीक्षणU01

बाहरी संबंध

 * DieHarder: A free (GPL) C Random Number Test Suite.
 * Generating Normal Distributed Random Numbers