आवृत्ति विश्लेषण

क्रिप्ट समीक्षा में, आवृत्ति विश्लेषण (गिनती अक्षरों के रूप में भी जाना जाता है) एक सिफरटेक्स्ट में अक्षर आवृत्तियों या अक्षरों के समूह का अध्ययन है। विधि का उपयोग पारम्परिक संकेताक्षर को तोड़ने में सहायता के रूप में किया जाता है।

बारंबारता विश्लेषण इस तथ्य पर आधारित है कि, लिखित भाषा के किसी भी खंड में, कुछ अक्षर और अक्षरों के संयोजन अलग-अलग आवृत्तियों के साथ होते हैं। इसके अतिरिक्त, अक्षरों का एक विशिष्ट वितरण है जो उस भाषा के लगभग सभी प्रतिरूपों के लिए लगभग समान है। उदाहरण के लिए, अंग्रेजी भाषा के एक खंड को देखते हुए, E, T, A और O सबसे सामान्य हैं, जबकि Z, Q, X और J दूर्लभ हैं। वैसे ही, TH, ER, ON, और AN अक्षरों के सबसे सामान्य जोड़े हैं (जिन्हें बाइग्राम या द्विवर्ण कहा जाता है), और SS, EE, TT, और FF सबसे सामान्य दोहराव हैं। निरर्थक वाक्यांश एटाओइन श्रदलू विशिष्ट अंग्रेजी भाषा के पाठ में 12 सबसे अधिक बार आने वाले अक्षरों का प्रतिनिधित्व करता है।

कुछ संकेताक्षर में, प्राकृतिक भाषा के सादे पाठ के ऐसे गुणों को सिफरटेक्स्ट में संरक्षित किया जाता है, और इन प्रतिरूपों में सिफरटेक्स्ट-ओनली अटैक में शोषण किए जाने की क्षमता होती है।

सरल प्रतिस्थापन संकेताक्षर के लिए आवृत्ति विश्लेषण
एक साधारण प्रतिस्थापन संकेताक्षर में, सादे पाठ के प्रत्येक अक्षर को दूसरे से बदल दिया जाता है, और सादे पाठ में कोई भी विशेष अक्षर हमेशा सिफरटेक्स्ट में उसी अक्षर में रूपांतरित हो जाएगा। उदाहरण के लिए, यदि पत्र की सभी घटनाएँ e अक्षर में बदलें X, एक सिफरटेक्स्ट संदेश जिसमें पत्र के कई उदाहरण हैं X एक क्रिप्ट एनालिस्ट को सुझाव देगा कि X प्रतिनिधित्व eकरता है।

आवृत्ति विश्लेषण का मूल उपयोग पहले सिफरटेक्स्ट अक्षरों की आवृत्ति को गिनना है और फिर उनके साथ अनुमानित सादे टेक्स्ट अक्षरों को जोड़ना है। अधिक Xs सिफरटेक्स्ट में है जो किसी और चीज से पता चलता है X से मेल खाती है e सादा पाठ में, लेकिन यह निश्चित नहीं है; t और a अंग्रेजी में भी बहुत सामान्य हैं, इसलिए X उनमें से कोई भी हो सकता है। यह एक सादा पाठ होने की संभावना नहीं है z या q जो कम सामान्य हैं। इस प्रकार क्रिप्ट एनालिस्ट को सिफरटेक्स्ट और सादे पाठ अक्षरों के बीच मैपिंग के कई संयोजनों को आज़माने की आवश्यकता हो सकती है।

आँकड़ों के अधिक जटिल उपयोग की कल्पना की जा सकती है, जैसे कि अक्षरों के जोड़े (बिग्राम), ट्रिपल (ट्रिग्राम), और इसी तरह की गिनती पर विचार करना। यह क्रिप्ट एनालिस्ट को अधिक जानकारी प्रदान करने के लिए किया जाता है, उदाहरण के लिए, Q और U अंग्रेजी में लगभग हमेशा उसी क्रम में एक साथ होते हैं, भले ही Q दुर्लभ है।

एक उदाहरण
मान लीजिए कि ऐलिस और बॉब ने नीचे बीज लेख को अंतर्ग्रहण किया है, और इसे एक साधारण प्रतिस्थापन संकेताक्षर का उपयोग करके गूढलेखित किया जाना जाना जाता है: LIVITCSWPIYVEWHEVSRIQMXLEYVEOIEWHRXEXIPFEMVEWHKVSTYLXZIXLIKIIXPIJVSZEYPERRGERIM WQLMGLMXQERIWGPSRIHMXQEREKIETXMJTPRGEVEKEITREWHEXXLEXXMZITWAWSQWXSWEXTVEPMRXRSJ GSTVRIEYVIEXCVMUIMWERGMIWXMJMGCSMWXSJOMIQXLIVIQIVIXQSVSTWHKPEGARCSXRWIEVSWIIBXV IZMXFSJXLIKEGAEWHEPSWYSWIWIEVXLISXLIVXLIRGEPIRQIVIIBGIIHMWYPFLEVHEWHYPSRRFQMXLE PPXLIECCIEVEWGISJKTVWMRLIHYSPHXLIQIMYLXSJXLIMWRIGXQEROIVFVIZEVAEKPIEWHXEAMWYEPP XLMWYRMWXSGSWRMHIVEXMSWMGSTPHLEVHPFKPEZINTCMXIVJSVLMRSCMWMSWVIRCIGXMWYMX इस उदाहरण के लिए, अपरकेस अक्षरों का उपयोग सिफरटेक्स्ट को निरूपित करने के लिए किया जाता है, लोअरकेस अक्षरों का उपयोग सादे पाठ (या अनुमान लगाने) के लिए किया जाता है, और X~t का उपयोग यह अनुमान लगाने के लिए किया जाता है कि सिफरटेक्स्ट अक्षर X सादे पाठ अक्षर t का प्रतिनिधित्व करता है।

ईव निम्नलिखित पंक्तियों के साथ संदेश को हल करने में सहायता के लिए आवृत्ति विश्लेषण का उपयोग कर सकता है: क्रिप्टोग्राम में अक्षरों की संख्या दर्शाती है कि I सबसे सामान्य एकल अक्षर है, XL सबसे सामान्य बिग्राम, और XLI सबसे सामान्य त्रिग्राम है। e अंग्रेजी भाषा का सबसे सामान्य अक्षर है, th सबसे सामान्य बिग्राम है, और the सबसे सामान्य ट्रिग्राम है। यह दृढ़ता से सुझाव देता है कि X~t, L~h और I~eहै। बीजलेख में दूसरा सबसे सामान्य अक्षर E है; चूंकि अंग्रेजी भाषा में पहले और दूसरे सबसे अधिक बार आने वाले अक्षर, e और t का हिसाब है, ईव का अनुमान E~aहै, तीसरा सबसे अधिक बार आने वाला अक्षर। इन धारणाओं को अस्थायी रूप से बनाते हुए, निम्न आंशिक विगुढ़न संदेश प्राप्त होता है।

heVeTCSWPeYVaWHaVSReQMthaYVaOeaWHRtatePFaMVaWHKVSTYhtZetheKeetPeJVSZaYPaRRGaReM WQhMGhMtQaReWGPSReHMtQaRaKeaTtMJTPRGaVaKaeTRaWHatthattMZeTWAWSQWtSWatTVaPMRtRSJ GSTVReaYVeatCVMUeMWaRGMeWtMJMGCSMWtSJOMeQtheVeQeVetQSVSTWHKPaGARCStRWeaVSWeeBtV eZMtFSJtheKaGAaWHaPSWYSWeWeaVtheStheVtheRGaPeRQeVeeBGeeHMWYPFhaVHaWHYPSRRFQMtha PPtheaCCeaVaWGeSJKTVWMRheHYSPHtheQeMYhtSJtheMWReGtQaROeVFVeZaVAaKPeaWHtaAMWYaPP thMWYRMWtSGSWRMHeVatMSWMGSTPHhaVHPFKPaZeNTCMteVJSVhMRSCMWMSWVeRCeGtMWYMt

इन प्रारंभिक अनुमानों का उपयोग करते हुए, हव्वा उन पतिरूप को खोज सकती है जो उसकी पसंद की पुष्टि करते हैं, जैसेthat है। इसके अतिरिक्त, अन्य पतिरूप आगे के अनुमानों का सुझाव देते हैं।Rtate state हो सकता है, जिसका अर्थ R~s होगा। उसी प्रकारatthattMZeको atthattimeके रूप में अनुमान लगाया जा सकता है। आगे,heVe here हो सकता है, V~rदिया गया है। इन अनुमानों को भरते हुए ईव को मिलता है:

hereTCSWPeYraWHarSseQithaYraOeaWHstatePFairaWHKrSTYhtmetheKeetPeJrSmaYPassGasei WQhiGhitQaseWGPSseHitQasaKeaTtiJTPsGaraKaeTsaWHatthattimeTWAWSQWtSWatTraPistsSJ GSTrseaYreatCriUeiWasGieWtiJiGCSiWtSJOieQthereQeretQSrSTWHKPaGAsCStsWearSWeeBtr emitFSJtheKaGAaWHaPSWYSWeWeartheStherthesGaPesQereeBGeeHiWYPFharHaWHYPSssFQitha PPtheaCCearaWGeSJKTrWisheHYSPHtheQeiYhtSJtheiWseGtQasOerFremarAaKPeaWHtaAiWYaPP thiWYsiWtSGSWsiHeratiSWiGSTPHharHPFKPameNTCiterJSrhisSCiWiSWresCeGtiWYit

बदले में, ये अनुमान अभी भी दूसरों का सुझाव देते हैं (उदाहरण के लिए,remarA remark हो सकता है, जिसका अर्थA~kहै) और इसी तरह, और बाकी के अक्षरों को निकालना अपेक्षाकृत सरल है, अंततः सादे पाठ की उपज है।

hereuponlegrandarosewithagraveandstatelyairandbroughtmethebeetlefromaglasscasei nwhichitwasencloseditwasabeautifulscarabaeusandatthattimeunknowntonaturalistsof courseagreatprizeinascientificpointofviewthereweretworoundblackspotsnearoneextr emityofthebackandalongoneneartheotherthescaleswereexceedinglyhardandglossywitha lltheappearanceofburnishedgoldtheweightoftheinsectwasveryremarkableandtakingall thingsintoconsiderationicouldhardlyblamejupiterforhisopinionrespectingit

इस बिंदु पर, ईव के लिए रिक्त स्थान और विराम चिह्न सम्मिलित करना एक अच्छा विचार होगा:

इसके बाद लेग्रैंड एक गंभीर और भव्य वायु के साथ उठे, और मुझे एक कांच कोष्ठ से भृंग लाए जिसमें यह संलग्न था। यह एक सुंदर स्कारबियस था, और उस समय, प्रकृतिवादियों के लिए अज्ञात था - निश्चित रूप से वैज्ञानिक दृष्टिकोण से एक बड़ा पुरस्कार है। पीठ के एक छोर के पास दो गोल काले धब्बे थे, और दूसरे के पास एक लंबा काला धब्बा था। तराजू अत्यधिक कठोर और चमकदार थे, जिसमें सभी चमकते हुए सोने की तरह दिखते थे। कीट का वजन बहुत ही उल्लेखनीय था, और, सभी बातों को ध्यान में रखते हुए, मैं शायद ही बृहस्पति को उसके सम्मान के लिए दोष दे सकता था।

द गोल्ड-बग के इस उदाहरण में ईव के सभी अनुमान सही थे। हालांकि, हमेशा ऐसा नहीं होगा; अलग-अलग सादे पाठों के आंकड़ों में भिन्नता का अर्थ यह हो सकता है कि प्रारंभिक अनुमान गलत हैं। उपरोक्त उदाहरण में दिए गए कुछ सरलीकृत औचित्य की तुलना में गलत अनुमानों को पीछे हटाना या उपलब्ध आंकड़ों का अधिक गहराई से विश्लेषण करना आवश्यक हो सकता है।

यह भी संभव है कि सादा पाठ अक्षर आवृत्तियों के अपेक्षित वितरण को प्रदर्शित न करे। छोटे संदेशों में अधिक भिन्नता दिखाने की संभावना होती है। कृत्रिम रूप से टेढ़े-मेढ़े ग्रंथों का निर्माण भी संभव है। उदाहरण के लिए, पूरे उपन्यास लिखे गए हैं जो अक्षर e को छोड़ देते हैं, कुल मिलाकर — साहित्य का एक रूप लिपोग्राम के रूप में जाना जाता है।

इतिहास और उपयोग


आवृति समीक्षा (वास्तव में, किसी भी प्रकार के क्रिप्ट समीक्षा) का पहला ज्ञात अभिलेखबद्ध स्पष्टीकरण 9वीं शताब्दी में अल-किंडी, एक अरब बहुश्रुत द्वारा ए मैनुस्क्रिप्ट ऑन डिक्रिफ़रिंग गूढ़लेखन सन्देश में दिया गया था। यह सुझाव दिया गया है कि कुरान के करीबी पाठ्य अध्ययन ने पहली बार प्रकाश में लाया कि अरबी भाषा में एक विशिष्ट अक्षर आवृत्ति है। इसका उपयोग विस्तारित हो गया, और पुनर्जागरण के समय तक यूरोपीय स्तिथियों में समान प्रणालियों का व्यापक रूप से उपयोग किया जाने लगा। 1474 तक, सिस्को सिमोनिटा ने लैटिन भाषा और इतालवी भाषा के पाठ के गूढ़ रहस्य पर एक नियमावली लिखी थी। सरल प्रतिस्थापन कूट लेखन में इस परिक्षीणता को दूर करने के लिए बीजलेखक द्वारा कई योजनाओं का आविष्कार किया गया था। इनमें सम्मिलित हैं:


 * समस्वरीय प्रतिस्थापन : समस्वर का उपयोग - अन्यथा मोनोअल्फाबेटिक प्रतिस्थापन संकेताक्षर में सबसे सामान्य अक्षरों के लिए कई विकल्प हैं। उदाहरण के लिए, अंग्रेजी के लिए, X और Y सिफरटेक्स्ट दोनों का अर्थ सादा पाठ E हो सकता है।
 * बहु वर्णी संकेताक्षर, यानी, कई अक्षरों का उपयोग - मिश्रित, कम या ज्यादा कुटिल तरीकों से चुना गया (लियो अल्बर्टी इसे प्रस्तावित करने वाले पहले व्यक्ति थे); और
 * बहुकर्तृक प्रतिस्थापन, योजनाएँ जहाँ सादे पाठ अक्षरों के जोड़े या त्रयी को एकल अक्षरों के स्थान पर प्रतिस्थापन के लिए इकाइयों के रूप में माना जाता है, उदाहरण के लिए, 19 वीं शताब्दी के मध्य में चार्ल्स व्हीटस्टोन द्वारा आविष्कार किया गया प्लेफेयर संकेताक्षर है।

आवृति गणना आक्षेप को विफल करने के इन सभी प्रयासों की एक हानि यह है कि यह कूटलेखन और गूढ़लेख दोनों की जटिलता को बढ़ाता है, जिससे गलतियाँ होती हैं। कहा जाता है कि एक ब्रिटिश विदेश सचिव ने प्लेफेयर संकेताक्षर को अस्वीकार कर दिया था, क्योंकि भले ही स्कूल के लड़के व्हीटस्टोन और प्लेफेयर के रूप में सफलतापूर्वक सामना कर सकते थे, "हमारे अटैचस इसे कभी नहीं सीख सकते थे! "।

20वीं शताब्दी के पूर्वार्द्ध की घूर्णक मशीन (उदाहरण के लिए, गूढ़ मशीन) स्पष्ट आवृत्ति विश्लेषण के लिए अनिवार्य रूप से प्रतिरक्षित थीं।

हालांकि, अन्य प्रकार के विश्लेषण (आक्षेप) ने उनमें से कुछ मशीनों से संदेशों को सफलतापूर्वक कूटानुवाद किया।

बारंबारता विश्लेषण के लिए सादे पाठ भाषा के आंकड़ों की बुनियादी समझ और कुछ समस्या सुलझाने के कौशल की आवश्यकता होती है, और यदि हाथ से किया जाता है, तो व्यापक पत्र बहीखाता पद्धति के लिए सहिष्णुता की आवश्यकता होती है। द्वितीय विश्व युद्ध (द्वितीय विश्व युद्ध) के उपरान्त, यूनाइटेड किंगडम और संयुक्त राज्य अमेरिका दोनों ने प्रमुख समाचार पत्रों में वर्ग पहेली डालकर और उन्हें सबसे तीव्रता से हल करने वाले लोगों के लिए प्रतियोगिता चलाकर कोडब्रेकर्स की भर्ती की थी। एक्सिस शक्तियों द्वारा उपयोग किए जाने वाले कई संकेताक्षर आवृत्ति विश्लेषण का उपयोग करके भंग करने योग्य थे, उदाहरण के लिए, जापानी द्वारा उपयोग किए जाने वाले कुछ वाणिज्यदूतीय संकेताक्षर थे। पत्र गणना और सांख्यिकीय विश्लेषण के यांत्रिक तरीकों (सामान्यतः आईबीएम कार्ड प्रकार मशीनरी) का उपयोग द्वितीय विश्व युद्ध में संभवतः अमेरिकी सेना की SIS द्वारा किया गया था। आज अक्षरों की गिनती और विश्लेषण की कड़ी मेहनत की जगह कंप्यूटर सॉफ़्टवेयर ने ले ली है, जो सेकंडों में इस तरह के विश्लेषण को पूर्ण कर सकता है। आधुनिक कंप्यूटिंग शक्ति के साथ, पारम्परिक संकेताक्षर गोपनीय डेटा के लिए कोई वास्तविक सुरक्षा प्रदान करने की संभावना नहीं है।

कल्पना में आवृत्ति विश्लेषण
कल्पना में आवृत्ति विश्लेषण का वर्णन किया गया है। एडगर एलन पो की द गोल्ड-बग और सर आर्थर कॉनन डॉयल की शर्लक होम्स की कहानी द एडवेंचर ऑफ़ द डांसिंग मेन उन कहानियों के उदाहरण हैं जो सरल प्रतिस्थापन संकेताक्षर पर हमला करने के लिए आवृत्ति विश्लेषण के उपयोग का वर्णन करती हैं। पो कहानी में संकेताक्षर कई अलंकृत उपायों से घिरा हुआ है, लेकिन गूढ़लेखन रूप से महत्वपूर्ण किसी भी चीज़ की तुलना में यह एक साहित्यिक उपकरण है।

यह भी देखें

 * एटाओइन श्रदलू
 * पत्र आवृत्तियों
 * अरबी पत्र आवृत्ति
 * संयोग का सूचकांक
 * गूढ़लेखन में विषय
 * जिपफ का नियम
 * ए वॉयड, जॉर्ज पेरेक का उपन्यास। मूल फ्रांसीसी पाठ ई अक्षर के बिना लिखा गया है, जैसा कि अंग्रेजी अनुवाद है। स्पैनिश संस्करण में कोई नहीं है।
 * गडस्बी (उपन्यास), अर्नेस्ट विन्सेंट राइट का एक उपन्यास। उपन्यास लिपोग्राम के रूप में लिखा गया है, जिसमें ई अक्षर वाले शब्द सम्मिलित नहीं हैं।

अग्रिम पठन

 * हेलेन फूचे गेंस, "क्रिप्टैनालिसिस", 1939, Dover. ISBN 0-486-20097-3
 * अब्राहम सिंकोव, "एलिमेंटरी क्रिप्टैनालिसिस: ए मैथमेटिकल एप्रोच", द मैथमेटिकल एसोसिएशन ऑफ अमेरिका, 1966. ISBN 0-88385-622-0.

बाहरी संबंध

 * Online frequency analysis tool
 * Character and syllable frequencies of 41 languages and a portable tool to create frequency and syllable distributions
 * Arabic letter frequency analysis
 * Conditional probabilities for characters in English text
 * Czech letter/bigram/त्रिग्राम frequency