8-बिट क्लीन

8-बिट क्लीन कंप्यूटर प्रणाली, संचार चैनल और अन्य उपकरणों और सॉफ़्टवेयर की एक विशेषता है, जो 8-बिट कंप्यूटिंग|8-बिट  अक्षरों को सांकेतिक अक्षरों में बदलना  को सही ढंग से संभालती है। ऐसी एन्कोडिंग में ISO 8859 श्रृंखला और यूनिकोड की UTF-8 एन्कोडिंग शामिल है।

इतिहास
1990 के दशक की प्रारम्भ तक, कई प्रोग्राम और डेटा ट्रांसमिशन चैनल करैक्टर ओरिएंटेड थे और कुछ कैरेक्टर, जैसे, ईटीएक्स, को कंट्रोल कैरेक्टर के रूप में मानते थे। अन्य ने 0 और 127 के बीच मानों के साथ सात-बिट कैरेक्टर की एक स्रोत मान ली, उदाहरण के लिए, ASCII मानक डेटा ट्रांसमिशन लागत को बचाने के लिए 8-बिट प्रतिनिधित्व से बचते हुए, प्रति कैरेक्टर केवल 7 बिट्स का उपयोग करता है। 8-बिट बाइट्स का उपयोग करने वाले कंप्यूटर और डेटा लिंक पर इसने प्रत्येक बाइट के शीर्ष बिट को पैरीटी फ़्लैग बिट या मेटा डेटा नियंत्रण बिट के रूप में उपयोग के लिए स्वतंत्र छोड़ दिया। 7-बिट सिस्टम और डेटा लिंक अधिक काम्प्लेक्स कैरेक्टर कोड को सीधे संभालने में असमर्थ हैं जो बड़े कैरेक्टर वाले दूसरे-अंग्रेजी भाषा-भाषी देशों में सामान्य हैं।

ऑक्टेट की बाइनरी फ़ाइलें 7-बिट डेटा चैनलों के माध्यम से सीधे ट्रांसमिटेड नहीं की जा सकतीं। इसके आसपास काम करने के लिए, बाइनरी-टू-टेक्स्ट एन्कोडिंग तैयार की गई है जो केवल 7-बिट ASCII कैरेक्टर का उपयोग करती है। इनमें से कुछ एन्कोडिंग यूयूएन्कोडिंग, एएससीआईआई85( Ascii85), एसआरईसी (फ़ाइल प्रारूप), बिनहेक्स, केर्मिट और एमआईएमई का बेस 64 हैं।  EBCDIC -आधारित सिस्टम यूयूएनकोडेड डेटा में उपयोग किए गए सभी कैरेक्टर को संभाल नहीं सकते हैं। यद्यपि, बेस 64 एन्कोडिंग में यह समस्या नहीं है।

एसएमटीपी और एनएनटीपी 8-बिट सफाई
ऐतिहासिक रूप से, संदेशों को स्थानांतरित करने के लिए विभिन्न मीडिया का उपयोग किया जाता था, उनमें से कुछ केवल 7-बिट डेटा का समर्थन करते थे, इसलिए 20वीं शताब्दी में ट्रांसमिशन के दौरान 8-बिट संदेश के मोजिबेक होने की उच्च संभावना थी। लेकिन कुछ कार्यान्वयनों ने वास्तव में 8-बिट डेटा को औपचारिक रूप से हतोत्साहित करने की परवाह नहीं की और उच्च बिट सेट बाइट्स को पारित करने की अनुमति दी। ऐसे कार्यान्वयन को 8-बिट साफ़ कहा जाता है। सामान्य तौर पर, एक संचार प्रोटोकॉल को 8-बिट क्लीन कहा जाता है यदि यह संचार प्रक्रिया में प्रत्येक बाइट के उच्च बिट से सही ढंग से गुजरता है।

कई प्रारंभिक संचार प्रोटोकॉल मानक, जैसे (एसएमटीपी के लिए),  (एनएनटीपी के लिए) और, ऐसे 7-बिट संचार लिंक पर काम करने के लिए डिज़ाइन किए गए थे। उन्हें विशेष रूप से 8-बिट बाइट के रूप में प्रसारित ASCII कैरेक्टर सेट के उपयोग की आवश्यकता होती है,  "उच्च-क्रम बिट को शून्य पर साफ़ करने के साथ 8-बिट बाइट के रूप में प्रेषित"  और इनमें से कुछ स्पष्ट रूप से सभी डेटा को 7-बिट वर्णों तक सीमित करते हैं।

ईमेल नेटवर्क के पहले कुछ दशकों (1971 से 1990 के प्रारंभ तक) में, अधिकांश ईमेल संदेश 7-बिट यूएस-एएससीआईआई वर्ण सेट में सादे पाठ थे।

SMTP की RFC 788 परिभाषा, अपने पूर्ववर्ती की तरह, इंटरनेट मेल को 7-बिट US-ASCII कैरेक्टर की पंक्तियों (1000 कैरेक्टर या उससे कम) तक सीमित करता है।

बाद में उन संदेशों का समर्थन करने के लिए ईमेल संदेशों के प्रारूप को फिर से परिभाषित किया गया जो पूरी तरह से यूएस-एएससीआईआई टेक्स्ट नहीं हैं (यूएस-एएससीआईआई के अलावा अन्य वर्ण सेट में टेक्स्ट संदेश, और गैर-टेक्स्ट संदेश, जैसे ऑडियो और छवियां)।

निर्दिष्ट करता है कि एनएनटीपी किसी भी विश्वसनीय द्वि-दिशात्मक 8-बिट-वाइड डेटा स्ट्रीम चैनल पर संचालित होता है। और कमांड के लिए सेट किए गए कैरेक्टर को UTF-8 में बदल देता है। यद्यपि, अभी भी कैरेक्टर सेट को ASCII तक सीमित करता है, जिसमें  और  गैर-ASCII डेटा की MIME एन्कोडिंग सम्मिलित है।

इंटरनेट समुदाय सामान्य तौर पर विस्तार द्वारा सुविधाओं को जोड़ता है, जिससे उन्नत मशीनों और अभी तक अपग्रेड नहीं की गई मशीनों के बीच दोनों दिशाओं में संचार की अनुमति मिलती है, न कि पहले के मानकों के अनुरूप विरासत सॉफ़्टवेयर को तोड़ने की घोषणा करने और इस बात पर ज़ोर देने के लिए कि दुनिया भर के सभी सॉफ़्टवेयर को नवीनतम मानक में अपग्रेड किया जाए। 1990 के दशक के मध्य में, लोग सिर्फ 8 बिट्स (को) भेजने पर आपत्ति जताई एसएमटीपी सर्वर), शायद इस धारणा के कारण कि केवल 8 बिट भेजना एक अंतर्निहित घोषणा है कि आईएसओ 8859-1 नया मानक एन्कोडिंग बन गया है, जो दुनिया में सभी को समान वर्ण सेट का उपयोग करने के लिए मजबूर करता है। इसके बजाय, मशीनों के बीच 8-बिट-क्लीन लिंक का लाभ उठाने का अनुशंसित तरीका ईएसएमटीपी का उपयोग करना है 8 बिटमाइम एक्सटेंशन  संदेश निकायों और SMTP SMTPUTF8 के लिए संदेश शीर्षलेखों के लिए एक्सटेंशन. इसके बावजूद, कुछ  मेल स्थानांतरण एजेंट, विशेष रूप से एग्जिम और  yamail , उन सर्वरों पर मेल रिले करते हैं जो आवश्यक 7-बिट एमआईएमई (सामान्यतौर पर उद्धृत-मुद्रण योग्य, क्यू-पी रूपांतरण) में रूपांतरण किए बिना 8BITMIME का विज्ञापन नहीं करते हैं।. यह जस्ट-सेंड-8 रवैया वास्तव में व्यवहार में समस्या पैदा नहीं करता है, क्योंकि वस्तुतः सभी आधुनिक ईमेल सर्वर 8-बिट साफ़ हैं।

यह भी देखें

 * 32-बिट साफ़