यूनिसिटी दूरी

क्रिप्टोग्राफी में, यूनिसिटी दूरी एक मूल सिफरटेक्स्ट की लंबाई है जो एक क्रूर बल के हमले में संभावित नकली कुंजियों की संख्या को शून्य तक कम करके सिफर को तोड़ने के लिए आवश्यक है। यानी, हर संभव कुंजी (क्रिप्टोग्राफी) को आज़माने के बाद, केवल एक डिक्रिप्शन होना चाहिए जो समझ में आता है, यानी कुंजी को पूरी तरह से निर्धारित करने के लिए आवश्यक सिफरटेक्स्ट की अपेक्षित मात्रा, यह मानते हुए कि अंतर्निहित संदेश में अतिरेक है। क्लाउड शैनन ने अपने 1949 के पेपर गोपनीयता प्रणालियों का संचार सिद्धांत में यूनिसिटी दूरी को परिभाषित किया।

पांच अक्षर वाली कुंजी के साथ विगेनियर सिफर का उपयोग करके एन्क्रिप्टेड सिफरटेक्स्ट स्ट्रिंग WNAIW पर हमले पर विचार करें। संभवतः, इस स्ट्रिंग को किसी अन्य स्ट्रिंग में समझा जा सकता है - नदी और पानी दोनों कुछ कुंजियों के लिए संभावनाएं हैं। यह क्रिप्ट विश्लेषण का एक सामान्य नियम है: बिना किसी अतिरिक्त जानकारी के इस संदेश को डिकोड करना असंभव है।

निःसंदेह, इस मामले में भी, अंग्रेजी शब्दों में केवल पांच अक्षर वाली कुंजियों की एक निश्चित संख्या ही परिणामित होगी। सभी संभावित कुंजियाँ आज़माने से हमें न केवल नदी और पानी मिलेगा, बल्कि SXOOS और KHDOP भी मिलेंगे। कार्यशील कुंजियों की संख्या संभवतः सभी संभावित कुंजियों के सेट से बहुत कम होगी। समस्या यह जानने की है कि इनमें से कौन सी कार्यशील कुंजी सही है; बाकी सब नकली हैं.

कुंजी आकार और संभावित सादेपाठ के साथ संबंध
सामान्य तौर पर, कुंजी के आकार और संभावित संदेशों की संख्या के बारे में विशेष धारणाओं को देखते हुए, एक औसत सिफरटेक्स्ट लंबाई होती है जहां केवल एक कुंजी होती है (औसतन) जो एक पढ़ने योग्य संदेश उत्पन्न करेगी। उपरोक्त उदाहरण में हम केवल अपरकेस  अंग्रेजी वर्ण देखते हैं, इसलिए यदि हम मान लें कि सादे पाठ का यह रूप है, तो स्ट्रिंग में प्रत्येक स्थिति के लिए 26 संभावित अक्षर हैं। इसी प्रकार यदि हम पाँच-वर्ण वाली अपर केस कुंजियाँ मान लें, तो K=26 हैं5संभावित कुंजियाँ, जिनमें से अधिकांश काम नहीं करेंगी।

संभावित संदेशों की एक जबरदस्त संख्या, एन, वर्णों के इस सीमित सेट का उपयोग करके भी उत्पन्न की जा सकती है: एन = 26L, जहां L संदेश की लंबाई है। हालाँकि, भाषा के नियमों के कारण उनमें से केवल एक छोटा सेट ही पठनीय है, शायद उनमें से एम, जहां एम एन की तुलना में बहुत छोटा होने की संभावना है। इसके अलावा, एम का संख्या के साथ एक-से-एक संबंध है काम करने वाली कुंजियों की संख्या, इसलिए K संभावित कुंजियाँ दी गई हैं, उनमें से केवल K × (M/N) ही काम करेगी। इनमें से एक सही कुंजी है, बाकी सब नकली हैं।

चूंकि संदेश की लंबाई एल बढ़ने पर एम/एन मनमाने ढंग से छोटा हो जाता है, अंततः कुछ एल होता है जो इतना बड़ा होता है कि नकली कुंजियों की संख्या शून्य के बराबर हो जाती है। मोटे तौर पर कहें तो, यह वह L है जो KM/N=1 बनाता है। यह एल एकसिटी दूरी है।

कुंजी एन्ट्रापी और प्लेनटेक्स्ट अतिरेक के साथ संबंध
यूनिसिटी दूरी को समान रूप से अद्वितीय एन्क्रिप्शन कुंजी को पुनर्प्राप्त करने के लिए कम्प्यूटेशनल रूप से असीमित प्रतिद्वंद्वी को अनुमति देने के लिए आवश्यक सिफरटेक्स्ट की न्यूनतम मात्रा के रूप में परिभाषित किया जा सकता है।

तब अपेक्षित एकत्व दूरी को इस प्रकार दिखाया जा सकता है:


 * $$U = H(k) / D$$

जहां यू एकसिटी दूरी है, एच(के) मुख्य स्थान की एन्ट्रापी है (उदाहरण के लिए 2 के लिए 128)128 समसंभाव्य कुंजियाँ, बल्कि कम यदि कुंजी एक याद किया गया पास-वाक्यांश है)। डी को प्रति वर्ण बिट्स में प्लेनटेक्स्ट रिडंडेंसी के रूप में परिभाषित किया गया है।

अब 32 अक्षरों की वर्णमाला में प्रति अक्षर 5 बिट जानकारी हो सकती है (जैसे 32 = 2)।5). सामान्यतः प्रति वर्ण सूचना के बिट्स की संख्या होती है $log_{2}(N)$, जहां N वर्णमाला में वर्णों की संख्या है और $log_{2}$ बाइनरी लघुगणक है. इसलिए अंग्रेजी के लिए प्रत्येक अक्षर संप्रेषित कर सकता है $log_{2}(26) = 4.7$ जानकारी के अंश।

हालाँकि, सार्थक अंग्रेजी पाठ में प्रति वर्ण वास्तविक जानकारी की औसत मात्रा केवल 1.5 बिट प्रति वर्ण है। तो सादा पाठ अतिरेक D = 4.7 − 1.5 = 3.2 है।

मूलतः एकसिटी की दूरी जितनी बड़ी होगी उतना बेहतर होगा। असीमित आकार के वन टाइम पैड के लिए, मुख्य स्थान की असीमित एन्ट्रॉपी को देखते हुए, हमारे पास है $$U = \infty$$, जो वन-टाइम पैड के अटूट होने के अनुरूप है।

प्रतिस्थापन सिफर की एकसिटी दूरी
एक साधारण प्रतिस्थापन सिफर के लिए, संभावित कुंजियों की संख्या है $26! = 4.0329 × 10^{26} = 2^{88.4}$, उन तरीकों की संख्या जिनसे वर्णमाला को क्रमबद्ध किया जा सकता है। यह मानते हुए कि सभी कुंजियाँ समान रूप से संभावित हैं, $H(k) = log_{2}(26!) = 88.4$ बिट्स. अंग्रेजी पाठ के लिए $D = 3.2$, इस प्रकार $U = 88.4/3.2 = 28$.

इसलिए सिफरटेक्स्ट के 28 अक्षरों को देखते हुए एक अंग्रेजी प्लेनटेक्स्ट और इसलिए कुंजी पर काम करना सैद्धांतिक रूप से संभव होना चाहिए।

व्यावहारिक अनुप्रयोग
यूनिसिटी दूरी एक उपयोगी सैद्धांतिक माप है, लेकिन वास्तविक दुनिया (सीमित) संसाधनों वाले किसी प्रतिद्वंद्वी द्वारा हमला किए जाने पर यह ब्लॉक सिफर की सुरक्षा के बारे में बहुत कुछ नहीं कहता है। तीन सिफरटेक्स्ट ब्लॉकों की यूनिसिटी दूरी वाले एक ब्लॉक सिफर पर विचार करें। यद्यपि सही कुंजी (सरल विस्तृत खोज) खोजने के लिए कम्प्यूटेशनल रूप से असीमित प्रतिद्वंद्वी के लिए स्पष्ट रूप से पर्याप्त जानकारी है, यह व्यवहार में कम्प्यूटेशनल रूप से असंभव हो सकता है।

प्लेनटेक्स्ट अतिरेक को कम करके यूनिसिटी दूरी को बढ़ाया जा सकता है। ऐसा करने का एक तरीका एन्क्रिप्शन से पहले डेटा संपीड़न तकनीकों को तैनात करना है, उदाहरण के लिए पठनीयता बनाए रखते हुए अनावश्यक स्वरों को हटाकर। वैसे भी यह एक अच्छा विचार है, क्योंकि यह एन्क्रिप्ट किए जाने वाले डेटा की मात्रा को कम कर देता है।

यूनिसिटी दूरी से अधिक सिफरटेक्स्ट को केवल एक सार्थक डिक्रिप्शन माना जा सकता है। यूनिसिटी दूरी से छोटे सिफरटेक्स्ट में कई प्रशंसनीय डिक्रिप्शन हो सकते हैं। यूनिसिटी दूरी इस बात का माप नहीं है कि क्रिप्टोएनालिसिस के लिए कितना सिफरटेक्स्ट आवश्यक है, लेकिन क्रिप्टोएनालिसिस के लिए केवल एक उचित समाधान होने के लिए कितने सिफरटेक्स्ट की आवश्यकता है।

बाहरी संबंध

 * Bruce Schneier: How to Recognize Plaintext (Crypto-Gram Newsletter December 15, 1998)
 * Unicity Distance computed for common ciphers