बाइनरी डेटा

बाइनरी डेटा वह डेटा है जिसकी इकाई केवल दो संभावित अवस्थाओं को ग्रहण कर सकती है। इन्हें अक्सर बाइनरी अंक प्रणाली और बूलियन बीजगणित के अनुसार 0 और 1 के रूप में लेबल किया आंकड़े है।

बाइनरी डेटा कई अलग-अलग तकनीकी और वैज्ञानिक क्षेत्रों में होता है, जहां इसे कंप्यूटर विज्ञान में  अंश  (बाइनरी डिजिट), गणितीय तर्क और संबंधित डोमेन में सत्य मूल्य और #इन सहित विभिन्न नामों से पुकारा जा सकता है। आँकड़ों में '' आँकड़े।

गणितीय और संयोजक नींव
एक परिमित सेट चर जो केवल एक राज्य ले सकता है में शून्य सूचनात्मक एन्ट्रॉपी होता है, और 1 के बाद अगली प्राकृतिक संख्या है। यही कारण है कि बिट, केवल दो संभावित मानों वाला एक चर, सूचना की एक मानक प्राथमिक इकाई है।

का एक संग्रह $n$ बिट्स हो सकते हैं $2^{n}$ बताता है: विवरण के लिए बाइनरी संख्या  देखें। असतत चरों के संग्रह के राज्यों की संख्या चरों की संख्या पर घातीय कार्य पर निर्भर करती है, और केवल प्रत्येक चर के राज्यों की संख्या पर एक शक्ति कानून के रूप में। दस बिट्स अधिक हैं  तीन दशमलव अंकों की तुलना में बताता है. $10k$ बिट्स एक सूचना (एक संख्या या कुछ और) का प्रतिनिधित्व करने के लिए पर्याप्त से अधिक हैं जिसकी आवश्यकता है $3k$ दशमलव अंक, इसलिए त्रैमासिक अंक प्रणाली, 4, 5, 6, 7, 8, 9, Neper... राज्यों के साथ असतत चर में निहित जानकारी को कभी भी दो, तीन, या चार गुना अधिक बिट्स आवंटित करके बदला जा सकता है। इसलिए, 2 के अलावा किसी अन्य छोटी संख्या का उपयोग लाभ प्रदान नहीं करता है।

इसके अलावा, बूलियन बीजगणित बिट्स के संग्रह के लिए एक सुविधाजनक गणितीय संरचना प्रदान करता है, जिसमें प्रस्तावित चर के संग्रह का शब्दार्थ है। कंप्यूटर विज्ञान में बूलियन बीजगणित संचालन को बिटवाइज़ संचालन के रूप में जाना जाता है। बूलियन समारोह का सैद्धांतिक रूप से अच्छी तरह से अध्ययन किया जाता है और आसानी से लागू किया जा सकता है, या तो कंप्यूटर प्रोग्राम के साथ या डिजिटल इलेक्ट्रॉनिक्स में तथाकथित लॉजिक गेट्स द्वारा। यह विभिन्न डेटा का प्रतिनिधित्व करने के लिए बिट्स के उपयोग में योगदान देता है, यहां तक ​​​​कि मूल रूप से बाइनरी नहीं।

सांख्यिकी में
आँकड़ों में, बाइनरी डेटा एक सांख्यिकीय डेटा प्रकार होता है जिसमें स्पष्ट डेटा होता है जो ए और बी, या सिर और पूंछ जैसे दो संभावित मान ले सकता है। इसे द्विभाजित डेटा भी कहा जाता है, और एक पुराना शब्द क्वांटल डेटा है। दो मूल्यों को अक्सर सामान्य रूप से सफलता और असफलता के रूप में संदर्भित किया जाता है। श्रेणीबद्ध डेटा के एक रूप के रूप में, बाइनरी डेटा नाममात्र डेटा है, जिसका अर्थ है कि मान गुणात्मक गुण हैं और संख्यात्मक रूप से तुलना नहीं की जा सकती। हालाँकि, मानों को अक्सर 1 या 0 के रूप में दर्शाया जाता है, जो एकल परीक्षण में सफलताओं की संख्या की गणना के अनुरूप होता है: 1 (सफलता) या 0 (विफलता); देखना.

अक्सर, बाइनरी डेटा का उपयोग दो वैचारिक रूप से विपरीत मानों में से एक का प्रतिनिधित्व करने के लिए किया जाता है, जैसे:
 * एक प्रयोग के परिणाम (सफलता या असफलता)
 * हाँ-नहीं प्रश्न का उत्तर (हाँ या नहीं)
 * कुछ विशेषता की उपस्थिति या अनुपस्थिति (मौजूद है या मौजूद नहीं है)
 * किसी प्रस्ताव की सच्चाई या झूठ (सही या गलत, सही या गलत)

हालाँकि, इसका उपयोग उन डेटा के लिए भी किया जा सकता है, जिन्हें केवल दो संभावित मान माना जाता है, भले ही वे वैचारिक रूप से विरोध न करते हों या अवधारणात्मक रूप से अंतरिक्ष में सभी संभावित मूल्यों का प्रतिनिधित्व करते हों। उदाहरण के लिए, संयुक्त राज्य अमेरिका, यानी रिपब्लिकन पार्टी (संयुक्त राज्य) या डेमोक्रेटिक पार्टी (संयुक्त राज्य) में चुनावों में मतदाताओं की पार्टी की पसंद का प्रतिनिधित्व करने के लिए अक्सर बाइनरी डेटा का उपयोग किया जाता है। इस मामले में, कोई अंतर्निहित कारण नहीं है कि क्यों केवल दो राजनीतिक दलों का अस्तित्व होना चाहिए, और वास्तव में, अन्य पार्टियां अमेरिका में मौजूद हैं, लेकिन वे इतने छोटे हैं कि उन्हें आम तौर पर अनदेखा कर दिया जाता है। विश्लेषण उद्देश्यों के लिए द्विआधारी चर के रूप में मॉडलिंग निरंतर डेटा (या 2 से अधिक श्रेणियों का श्रेणीबद्ध डेटा) को विवेकीकरण (एक द्विभाजन बनाना) कहा जाता है। सभी विवेक की तरह, इसमें विवेक की त्रुटि शामिल है, लेकिन लक्ष्य त्रुटि के बावजूद कुछ मूल्यवान सीखना है: इसे विकट के रूप में मानना: हाथ में उद्देश्य के लिए नगण्य, लेकिन यह याद रखना कि इसे सामान्य रूप से नगण्य नहीं माना जा सकता है।

द्विआधारी चर
एक द्विआधारी चर द्विआधारी प्रकार का एक यादृच्छिक चर है, जिसका अर्थ है दो संभावित मान। स्वतंत्र और समान रूप से वितरित यादृच्छिक चर (i.i.d.) बाइनरी चर बर्नौली वितरण का पालन करते हैं, लेकिन सामान्य बाइनरी डेटा में i.i.d से आने की आवश्यकता नहीं होती है। चर। आई.आई.डी. की कुल संख्या द्विआधारी चर (समतुल्य रूप से, 1 या 0 के रूप में कोडित i.i.d. द्विआधारी चर के योग) एक द्विपद वितरण का पालन करते हैं, लेकिन जब द्विआधारी चर i.i.d नहीं होते हैं, तो वितरण को द्विपद होने की आवश्यकता नहीं होती है।

गिनती
श्रेणीबद्ध डेटा की तरह, बाइनरी डेटा को प्रत्येक संभावित मान के लिए एक निर्देशांक लिखकर, और होने वाले मान के लिए 1 की गिनती करके, और न होने वाले मान के लिए 0 की गणना करके डेटा की एक सरणी डेटा संरचना में परिवर्तित किया जा सकता है। उदाहरण के लिए, यदि मान A और B हैं, तो डेटा सेट A, A, B को (1, 0), (1, 0), (0, 1) के रूप में गिनती में दर्शाया जा सकता है। एक बार गणना में परिवर्तित हो जाने पर, बाइनरी डेटा को समूहीकृत डेटा और जोड़े गए काउंट्स में शामिल किया जा सकता है। उदाहरण के लिए, यदि समुच्चय A, A, B को समूहीकृत किया जाता है, तो कुल संख्याएँ (2, 1): 2 A's और 1 B (3 परीक्षणों में से) हैं।

चूंकि केवल दो संभावित मान हैं, इसे एक मान को सफलता और दूसरे को विफलता के रूप में मानते हुए, सफलता के मान को 1 के रूप में और विफलता को 0 के रूप में कोडित करके एकल गणना (एक स्केलर मान) के लिए सरल बनाया जा सकता है (केवल का उपयोग करके) सफलता मूल्य के लिए समन्वय, विफलता मूल्य के लिए समन्वय नहीं)। उदाहरण के लिए, यदि मान A को सफलता माना जाता है (और इस प्रकार B को विफलता माना जाता है), तो डेटा सेट A, A, B को 1, 1, 0 के रूप में दर्शाया जाएगा। जब इसे समूहीकृत किया जाता है, तो मान जोड़े जाते हैं, जबकि संख्या परीक्षण का आम तौर पर निहित ट्रैक किया जाता है। उदाहरण के लिए, A, A, B को 1 + 1 + 0 = 2 सफलताओं के रूप में समूहीकृत किया जाएगा (इनमें से $$n = 3$$ परीक्षण)। दूसरी तरफ जाकर, डेटा को गिनें $$n = 1$$ बाइनरी डेटा है, जिसमें दो वर्ग 0 (विफलता) या 1 (सफलता) हैं।

आई.आई.डी. द्विआधारी चर एक द्विपद वितरण का पालन करते हैं, साथ $n$ परीक्षणों की कुल संख्या (समूहित डेटा में अंक)।

प्रतिगमन
अनुमानित परिणामों पर प्रतिगमन विश्लेषण जो द्विआधारी चर हैं, द्विआधारी प्रतिगमन के रूप में जाना जाता है; जब बाइनरी डेटा को काउंट डेटा में परिवर्तित किया जाता है और i.i.d के रूप में मॉडलिंग की जाती है। चर (इसलिए उनका द्विपद वितरण है), द्विपद प्रतिगमन का उपयोग किया जा सकता है। बाइनरी डेटा के लिए सबसे आम प्रतिगमन विधियाँ संभार तन्त्र परावर्तन,  प्रोबिट प्रतिगमन  या संबंधित प्रकार के द्विआधारी विकल्प मॉडल हैं।

इसी तरह आई.आई.डी. दो से अधिक श्रेणियों वाले श्रेणीबद्ध चर को एक बहुराष्ट्रीय प्रतिगमन के साथ प्रतिरूपित किया जा सकता है। गैर-आई.आई.डी. बाइनरी डेटा को अधिक जटिल वितरणों द्वारा प्रतिरूपित किया जा सकता है, जैसे कि बीटा-द्विपद वितरण (एक यौगिक वितरण)। वैकल्पिक रूप से, रिश्ते को सामान्यीकृत रैखिक मॉडल, जैसे अर्ध-संभावना और अर्ध-समानता मॉडल से तकनीकों का उपयोग करके आउटपुट चर के वितरण को स्पष्ट रूप से मॉडल करने की आवश्यकता के बिना मॉडल किया जा सकता है; देखना.

कंप्यूटर विज्ञान में


आधुनिक कंप्यूटरों में, बाइनरी डेटा किसी भी डेटा को उच्च स्तर पर व्याख्या करने या किसी अन्य रूप में डेटा रूपांतरण के बजाय बाइनरी रूप में प्रदर्शित करने के लिए संदर्भित करता है। निम्नतम स्तर पर, बिट्स को एक bstability  डिवाइस जैसे फ्लिप-फ्लॉप (इलेक्ट्रॉनिक्स) | फ्लिप-फ्लॉप में संग्रहित किया जाता है। जबकि अधिकांश बाइनरी डेटा का प्रतीकात्मक अर्थ होता है (परवाह नहीं करने के अलावा) सभी बाइनरी डेटा संख्यात्मक नहीं होते हैं। कुछ बाइनरी डेटा इंस्ट्रक्शन (कंप्यूटर साइंस) से मेल खाते हैं, जैसे कि प्रोसेसर रजिस्टरों के डेटा को  नियंत्रण यूनिट  द्वारा डिकोड किया जाता है, जो कि लाने-डिकोड-निष्पादित चक्र के साथ होता है। प्रदर्शन कारणों से कंप्यूटर शायद ही कभी अलग-अलग बिट्स को संशोधित करते हैं। इसके बजाय, डेटा निश्चित संख्या में बिट्स के समूहों में डेटा संरचना संरेखण है, आमतौर पर 1 बाइट (8 बिट)। इसलिए, कंप्यूटर में बाइनरी डेटा वास्तव में बाइट्स के अनुक्रम होते हैं। उच्च स्तर पर, 32-बिट सिस्टम के लिए 1 शब्द (कंप्यूटर आर्किटेक्चर) (4 बाइट्स) के समूहों में और 64-बिट सिस्टम के लिए 2 शब्दों में डेटा एक्सेस किया जाता है।

निर्देश (कंप्यूटर विज्ञान) और सूचना प्रौद्योगिकी क्षेत्र में, बाइनरी डेटा शब्द अक्सर टेक्स्ट-आधारित डेटा के विपरीत होता है, जो किसी भी प्रकार के डेटा का संदर्भ देता है जिसे टेक्स्ट के रूप में व्याख्या नहीं किया जा सकता है। पाठ बनाम बाइनरी भेद कभी-कभी फ़ाइल की सिमेंटिक सामग्री को संदर्भित कर सकता है (उदाहरण के लिए एक लिखित दस्तावेज़ बनाम एक डिजिटल छवि)। हालांकि, यह अक्सर विशेष रूप से संदर्भित करता है कि फ़ाइल के अलग-अलग बाइट टेक्स्ट के रूप में व्याख्या करने योग्य हैं (अक्षरों को सांकेतिक अक्षरों में बदलना देखें) या व्याख्या नहीं की जा सकती है। जब यह अंतिम अर्थ अभिप्रेत है, तो अधिक विशिष्ट शब्द बाइनरी प्रारूप और पाठ (यूएल) प्रारूप कभी-कभी उपयोग किए जाते हैं। सिमेंटिकली टेक्स्टुअल डेटा को बाइनरी फॉर्मेट में प्रदर्शित किया जा सकता है (उदाहरण के लिए जब कंप्रेस किया जाता है या कुछ फॉर्मेट में जो विभिन्न प्रकार के फॉर्मेटिंग कोड को इंटरमिक्स करते हैं, जैसा कि माइक्रोसॉफ्ट वर्ड द्वारा उपयोग किए जाने वाले डॉक्टर (कंप्यूटिंग)  में होता है); इसके विपरीत, छवि डेटा को कभी-कभी पाठ्य प्रारूप में दर्शाया जाता है (उदाहरण के लिए एक्स विंडो सिस्टम में उपयोग किया जाने वाला X PixMap छवि प्रारूप)।

1 और 0 और कुछ नहीं बल्कि सिर्फ दो अलग-अलग वोल्टेज स्तर हैं। आप कंप्यूटर को उच्च वोल्टेज के लिए 1 और निम्न वोल्टेज के लिए 0 समझा सकते हैं। दो वोल्टेज स्तरों को स्टोर करने के कई अलग-अलग तरीके हैं। यदि आपने फ़्लॉपी देखा है, तो आपको एक चुंबकीय टेप मिलेगा जिसमें फेरोमैग्नेटिक सामग्री का लेप होता है, यह एक प्रकार का पैरामैग्नेटिक पदार्थ होता है, जिसमें सामग्री के माध्यम से धाराओं को हटाने के बाद भी अवशेष चुंबकीय क्षेत्र देने के लिए एक विशेष दिशा में डोमेन संरेखित होते हैं या चुंबकीय क्षेत्र। चुंबकीय टेप में डेटा लोड करने के दौरान, डोमेन के सहेजे गए अभिविन्यास को कॉल करने के लिए चुंबकीय क्षेत्र को एक दिशा में पारित किया जाता है और चुंबकीय क्षेत्र को दूसरी दिशा में पारित किया जाता है, तो डोमेन का सहेजा गया अभिविन्यास 0 होता है। इस तरह, आम तौर पर, 1 और 0 डेटा संग्रहीत होते हैं।

यह भी देखें

 * बिट सरणी
 * बरनौली वितरण
 * बूलियन डेटा प्रकार
 * स्मृति
 * सुस्पष्ट डेटा
 * गुणात्मक तथ्य