स्टाइलोमेट्री

स्टाइलोमेट्री सामान्यतः लिखित भाषा में स्टाइलिस्टिक्स (भाषाविज्ञान) का अनुप्रयोग है। इस प्रकार इसे संगीत पर भी सफलतापूर्वक क्रियान्वित किया गया है, चित्रों, और शतरंज. अन्य अवधारणा इसे भाषाई अनुशासन के रूप में परिभाषित करती है जो किसी लेखक की शैली का मूल्यांकन उनके कार्य के लिए सांख्यिकीय विश्लेषण के अनुप्रयोग के माध्यम से करता है।

स्टाइलोमेट्री का उपयोग अधिकांशतः अज्ञात कार्य या विवादित दस्तावेज़ों को लेखकत्व देने के लिए किया जाता है। इसमें नियमबद्ध के साथ-साथ अकादमिक और साहित्यिक अनुप्रयोग भी हैं, जिसमें शेक्सपियर एट्रिब्यूशन अध्ययन के प्रश्न से लेकर फोरेंसिक भाषा विज्ञान तक शेक्सपियर के कार्यों के लेखकत्व और टेक्स्ट पठनीयता के विश्लेषण के साथ पद्धतिगत समानताएं हैं।

इस प्रकार स्टाइलोमेट्री का उपयोग छद्म नाम वाले या अज्ञात लेखकों को अनावृत करने के लिए, या पूर्ण पहचान के अभाव में लेखक के बारे में कुछ जानकारी प्रकट करने के लिए किया जा सकता है। इस प्रकार लेखक अपने संचार की सार्थक पदार्थ को बदले बिना अपनी स्वयं की शैलीगत विशेषताओं को समाप्त करके इस पहचान का विरोध करने के लिए प्रतिकूल शैलीमिति का उपयोग कर सकते हैं। इस प्रकार यह उन विश्लेषणों को पराजित कर सकता है जो इसकी संभावना को ध्यान में नहीं रखते हैं, किन्तु प्रतिकूल वातावरण में स्टाइलोमेट्री की अंतिम प्रभावशीलता अनिश्चित है: स्टाइलोमेट्रिक पहचान विश्वसनीय नहीं हो सकती है, किन्तु न ही गैर-पहचान की गारंटी दी जा सकती है; प्रतिकूल शैलीमिति का अभ्यास स्वयं पता लगाने योग्य हो सकता है।

इतिहास
इस प्रकार प्रामाणिकता, लेखक की पहचान और अन्य प्रश्नों के प्रमाण के लिए ग्रंथों का विश्लेषण करने की पुरानी तकनीकों से स्टाइलोमेट्री का विकास हुआ था।

अनुशासन के आधुनिक अभ्यास को अंग्रेजी पुनर्जागरण नाटक में लेखकीय समस्याओं के अध्ययन से प्रचार मिला था । इस प्रकार शोधकर्ताओं और पाठकों ने देखा कि उस युग के कुछ नाटककारों की भाषा प्राथमिकताओं के विशिष्ट क्रम थे, और उन्होंने अनिश्चित या सहयोगात्मक कार्यों के लेखकों की पहचान करने के लिए उन क्रम का उपयोग करने का प्रयास किया। प्रारंभिक प्रयास सदैव सफल नहीं रहे: 1901 में, शोधकर्ता ने जॉन फ्लेचर (नाटककार) या जॉन फ्लेचर की पसंद ⁠ ⁠'em को, उनके संकुचनात्मक रूप को, उनके सहयोग में फ्लेचर और फिलिप मासिंगर के बीच अंतर करने के लिए मार्कर के रूप में उपयोग करने का प्रयास किया था किन्तु उन्होंने गलती से मैसिंगर के कार्यों का संस्करण नियोजित कर दिया जिसमें संपादक ने ⁠ ⁠'em के सभी उदाहरणों का विस्तार किया था।

स्टाइलोमेट्री की मूल बातें पोलिश दार्शनिक विंसेंटी लुटोस्लाव्स्की द्वारा प्रिंसिपेस डी स्टाइलोमेट्री (1890) में स्थापित की गई थीं। इस प्रकार लुटोस्लाव्स्की ने प्लेटो के संवादों का कालक्रम विकसित करने के लिए इस पद्धति का उपयोग किया।

इस प्रकार बड़ी मात्रा में डेटा का विश्लेषण करने के लिए कंप्यूटर और उनकी क्षमताओं के विकास ने इस प्रकार के प्रयास को परिमाण के क्रम में बढ़ाया। चूंकि, डेटा विश्लेषण के लिए कंप्यूटर की महान क्षमता अच्छी गुणवत्ता वाले आउटपुट की गारंटी नहीं देती है। 1960 के दशक की प्रारंभिक में, रेव. ए. क्यू. मॉर्टन ने सेंट पॉल को उत्तरदायी ठहराते हुए न्यू टेस्टामेंट के चौदह पत्रों का कंप्यूटर विश्लेषण तैयार किया, जिसने संकेत दिया कि छह अलग-अलग लेखकों ने उस कार्य को लिखा था। जेम्स जॉयस के कार्यों पर क्रियान्वित की गई उनकी पद्धति की जांच से यह परिणाम मिला कि यूलिसिस (उपन्यास), जॉयस का बहु-परिप्रेक्ष्य, बहु-शैली उपन्यास, पांच अलग-अलग व्यक्तियों द्वारा रचा गया था, इस प्रकार जिनमें से किसी का भी स्पष्ट रूप से क्राफ्टिंग में कोई भाग नहीं था। जॉयस का पहला उपन्यास, युवा व्यक्ति के रूप में कलाकार का चित्र चूंकि, समय के साथ और अभ्यास के साथ, शोधकर्ताओं और विद्वानों ने उत्तम परिणाम प्राप्त करने के लिए अपने विधियों को परिष्कृत किया है। उल्लेखनीय प्रारंभिक सफलता फ्रेडरिक मोस्टेलर और डेविड वालेस द्वारा द फेडरलिस्ट पेपर्स के बारह के विवादित लेखकत्व का समाधान था। चूंकि प्रारंभिक मान्यताओं और विधियों से संबंधित अभी भी प्रश्न हैं (और, संभवतः, सदैव रहेंगे), इस प्रकार अब कुछ लोग इस मूल आधार पर विवाद करते हैं कि लिखित ग्रंथों का भाषाई विश्लेषण मूल्यवान जानकारी और अंतर्दृष्टि उत्पन्न कर सकता है। (वास्तव में, यह कंप्यूटर के आगमन से पहले भी स्पष्ट था: साइरस होय और अन्य लोगों द्वारा फ्लेचर कैनन में पाठ्य/भाषाई विश्लेषण के सफल अनुप्रयोग से 1950 के दशक के अंत और 1960 के दशक की प्रारंभिक में स्पष्ट परिणाम मिले।)

अनुप्रयोग
स्टाइलोमेट्री के अनुप्रयोगों में साहित्यिक अध्ययन, ऐतिहासिक अध्ययन, सामाजिक अध्ययन, सूचना पुनर्प्राप्ति और कई फोरेंसिक स्थितियों और अध्ययन सम्मिलित हैं। इसे कोड स्टाइलोमेट्री पर भी क्रियान्वित किया जा सकता है और पदार्थ समानता का पता लगाना या स्टाइलोमेट्री, जो दस्तावेज़ के अंदर लेखन शैली में परिवर्तन के आधार पर साहित्यिक चोरी का पता लगाना है। इस प्रकार स्टाइलोमेट्री का उपयोग यह अनुमान लगाने के लिए भी किया जा सकता है कि कोई व्यक्ति अपनी कीस्ट्रोक गतिशीलता के आधार पर अंग्रेजी बोलने वाला है या नहीं बोलने वाला है।

एक विधि के रूप में स्टाइलोमेट्री पुनरीक्षण के समय टेक्स्ट के विरूपण के प्रति संवेदनशील है। लेखक द्वारा अपने करियर के समय विभिन्न शैलियों को अपनाने का भी स्थिति है, जैसा कि प्लेटो के स्थितियों में प्रदर्शित किया गया था, जिन्होंने सुकराती समस्या को संबोधित करने वाले प्रारंभिक और मध्य संवादों के लिए अपनाई गई विभिन्न शैलीगत नीतियों को चुना था।

सुविधाएँ
लेखकीय विशेषता के लिए इंटरेस्ट की पाठ्य विशेषताएं ओर विशिष्ट अभिव्यक्तियों या निर्माणों की घटनाओं की गणना करना है (उदाहरण के लिए यह जांचना कि लेखक इंटरपंक्शन का उपयोग कैसे करता है या कितनी बार लेखक एजेंट रहित निष्क्रिय निर्माणों का उपयोग करता है) और दूसरी ओर पठनीयता विश्लेषण के लिए उपयोग किए जाने वाले समान हैं जैसे शाब्दिक भिन्नता और वाक्यविन्यास भिन्नता के उपाय है चूंकि लेखकों के पास अधिकांशतः कुछ विषयों के लिए प्राथमिकताएं होती हैं, इसलिए लेखकत्व गुण में शोध प्रयोग फीचर समूह से संज्ञा, विशेषण और क्रिया जैसे पदार्थ शब्दों को हटा देते हैं, केवल टेक्स्ट के संरचनात्मक तत्वों को बनाए रखते हैं जिससे लेखक की विशेषताओं के अतिरिक्त विषय पर उनके मॉडल को ओवरफिट करने से बचा जा सकता है। इस प्रकार शैलीगत विशेषताओं की गणना अधिकांशतः किसी टेक्स्ट या किसी लेखक के संपूर्ण एकत्रित कार्यों के औसत के रूप में की जाती है, जिससे औसत शब्द लंबाई या औसत वाक्य लंबाई जैसे माप प्राप्त होते हैं। यह मॉडल को उन लेखकों की पहचान करने में सक्षम बनाता है जिनके पास शब्दाडंबरपूर्ण या संक्षिप्त वाक्यों के लिए स्पष्ट प्राथमिकता है किन्तु भिन्नता छिपाते हैं: लंबे और छोटे वाक्यों के मिश्रण वाले लेखक का औसत निरंतर मध्य-लंबाई वाले वाक्यों वाले लेखक के समान होता है। इस तरह की भिन्नता को पकड़ने के लिए, कुछ प्रयोग औसत देखी गई आवृत्तियों के अतिरिक्त अवलोकनों पर अनुक्रमों या क्रम का उपयोग करते हैं, उदाहरण के लिए नोटिंग कि लेखक निश्चित तनाव या बल क्रम के लिए प्राथमिकता दिखाता है,  या कि लेखक छोटे वाक्य के साथ लंबे वाक्यों का क्रम अपनाता है।  इस प्रकार मेंडेनहॉल द्वारा लेखकत्व की पहचान के सबसे पहले विधियों में से एक, अपने अवलोकनों को बिना औसत किए एकत्रित करना कहा जा सकता है।

वर्तमान लेखकत्व एट्रिब्यूशन मॉडल लेखक की शैली के लिए जो विशिष्ट है उसे स्वचालित रूप से कैप्चर करने के लिए शब्द एम्बेडिंग का उपयोग करते हैं, इस प्रकार किन्तु वे अधिक पारंपरिक मॉडल के समान कारणों से विवेकपूर्ण फीचर इंजीनियरिंग पर भी विश्वास करते हैं।

एडवर्सरियल स्टाइलोमेट्री
एडवरसैरियल स्टाइलोमेट्री लेखक की पहचान या उनकी विशेषताओं की खोज करने के लिए स्टाइलोमेट्री की क्षमता को कम करने के लिए लेखन शैली को बदलने का अभ्यास है। इस कार्य को लेखकत्व अस्पष्टता या लेखकत्व अज्ञातीकरण के रूप में भी जाना जाता है। स्टाइलोमेट्री अस्पष्ट लेखकों को अनावृत करने या छद्म नामों को किसी लेखक की अन्य पहचान से जोड़ने की क्षमता में महत्वपूर्ण गोपनीयता चुनौती प्रस्तुत करती है, जो, उदाहरण के लिए, व्हिसिलब्लोअर के लिए कठिनाइयाँ उत्पन्न करता है, कार्यकर्ता, और धोखाधड़ी करने वाले और धोखेबाज़ यंत्र अधिगम तकनीक और टेक्स्ट निगम विकसित होने के कारण गोपनीयता कठिन परिस्थिति बढ़ने की उम्मीद है।

सभी प्रतिकूल शैलीमिति स्रोत टेक्स्ट को ईमानदारी से व्याख्या (कम्प्यूटेशनल भाषाविज्ञान) करने के मूल विचार को साझा करती है जिससे अर्थ अपरिवर्तित रहे किन्तु शैलीगत संकेत अस्पष्ट रहें है। इस प्रकार ऐसा विश्वसनीय पैराफ़्रेज़ स्टाइलोमेट्रिक क्लासिफायरियर के लिए प्रतिकूल उदाहरण है। इसके लिए कई व्यापक दृष्टिकोण उपस्थित हैं, कुछ ओवरलैप के साथ: नकल, लेखक की अपनी शैली को दूसरे की शैली से प्रतिस्थापित करता है; अनुवाद, मशीनी अनुवाद को इस आशा के साथ क्रियान्वित करना कि यह स्रोत टेक्स्ट में विशिष्ट शैली को समाप्त कर देता है; और अस्पष्टता, किसी टेक्स्ट की शैली को साभिप्राय संशोधित करना जिससे वह लेखक की अपनी शैली से मेल नही खाते है।

शैली को मैन्युअल रूप से अस्पष्ट करना संभव है, किन्तु श्रमसाध्य; कुछ परिस्थितियों में, यह उत्तम या आवश्यक है। स्वचालित टूलींग, या तो अर्ध- या पूर्ण-स्वचालित, लेखक की सहायता कर सकती है। इस प्रकार कार्य को सर्वोत्तम विधि से कैसे निष्पादित किया जाए और ऐसे उपकरणों का डिज़ाइन संवृत शोध प्रश्न है। जबकि कुछ दृष्टिकोणों को विशेष स्टाइलोमेट्रिक विश्लेषणों को पराजित करने में सक्षम दिखाया गया है, विशेष रूप से वे जो प्रतिकूलता की संभावना को ध्यान में नहीं रखते हैं, अज्ञात विश्लेषणों के सामने सुरक्षा स्थापित करना कथन है। पैराफ़्रेज़ की विश्वसनीयता सुनिश्चित करना स्वचालित उपकरणों के लिए महत्वपूर्ण चुनौती है।

यह अनिश्चित है कि प्रतिकूल स्टाइलोमेट्री का अभ्यास अपने आप में पता लगाने योग्य है या नहीं है। कुछ अध्ययनों में पाया गया है कि विशेष विधियों ने आउटपुट टेक्स्ट में सिग्नल उत्पन्न किए हैं, किन्तु स्टाइलोमेट्रिस्ट जो अनिश्चित है कि किन विधियों का उपयोग किया गया था, वह विश्वसनीय रूप से उनका पता लगाने में सक्षम नहीं हो सकता है।

वर्तमान शोध
आधुनिक स्टाइलोमेट्री सांख्यिकीय विश्लेषण के लिए कंप्यूटर का उपयोग करती है, और कृत्रिम बुद्धि और इंटरनेट के माध्यम से उपलब्ध ग्रंथों के बढ़ते टेक्स्ट संग्रह तक पहुंच का उपयोग करती है। सॉफ्टवेयर सिस्टम जैसे सिग्नेचर (ऑक्सफोर्ड विश्वविद्यालय के डॉ. पीटर मिलिकन द्वारा निर्मित फ्रीवेयर), जेजीएएपी (जावा ग्राफिकल ऑथरशिप एट्रिब्यूशन प्रोग्राम-डुक्सेन विश्वविद्यालय के डॉ. पैट्रिक जुओला द्वारा निर्मित फ्रीवेयर), स्टाइलो (विभिन्न प्रकार के स्टाइलोमेट्रिक विश्लेषणों के लिए ओपन-सोर्स आर पैकेज, जिसमें ऑथरशिप एट्रिब्यूशन भी सम्मिलित है, इस प्रकार जिसे मैसीज एडर, जान रयबिकी और माइक केस्टेमोंट द्वारा विकसित किया गया है) और स्टाइलिन डचों के लिए (एंटवर्प विश्वविद्यालय के प्रोफेसर वाल्टर डेलेमैन्स और गेन्ट विश्वविद्यालय के डॉ. वेरोनिक होस्टे द्वारा ऑनलाइन फ्रीवेयर) इसके उपयोग को गैर-विशेषज्ञों के लिए भी तेजी से व्यावहारिक बनाता है।

शैक्षणिक समिष्ट और आयोजन
स्टाइलोमेट्रिक विधियों का उपयोग कई शैक्षणिक विषयों के लिए किया जाता है, जैसे भाषाविज्ञान, कोशलेखन, या साहित्यिक अध्ययन के अनुप्रयोग के रूप में, प्राकृतिक भाषा प्रसंस्करण और मशीन लर्निंग के संयोजन में, और साहित्यिक चोरी का पता लगाने, लेखकत्व विश्लेषण, या सूचना पुनर्प्राप्ति के लिए क्रियान्वित किया जाता है।

फोरेंसिक भाषाविज्ञान
फोरेंसिक भाषाविदों का अंतर्राष्ट्रीय संघ (आईएएफएल) इंटरनेशनल एसोसिएशन ऑफ फोरेंसिक लिंग्विस्ट्स के द्विवार्षिक सम्मेलन (पोर्ट में 2016 में 13वां संस्करण) का आयोजन करता है और अपने केंद्रीय विषयों में से के रूप में फोरेंसिक स्टाइलिस्टिक्स के साथ द इंटरनेशनल जर्नल ऑफ स्पीच, लैंग्वेज एंड द लॉ प्रकाशित करता है।

एएएआई
आर्टिफिशियल इंटेलिजेंस की उन्नति के लिए एसोसिएशन (एएएआई) ने टेक्स्ट के व्यक्तिपरक और शैलीगत विश्लेषण पर कई आयोजनों की होस्ट की है।

पैन
पैन कार्यशालाएँ (मूल रूप से, साहित्यिक चोरी विश्लेषण, लेखकत्व की पहचान, और निकट-डुप्लिकेट का पता लगाना, बाद में साहित्यिक चोरी, लेखकत्व और सामाजिक सॉफ़्टवेयर के दुरुपयोग को प्रदर्शित करने पर अधिक सामान्यतः कार्यशाला) 2007 से मुख्य रूप से सूचना पहुंच सम्मेलनों जैसे सूचना पर एसीएम विशेष इंटरेस्ट समूह के संयोजन में आयोजित की गईं थी। इस प्रकार पुनर्प्राप्ति, सूचना पुनर्प्राप्ति मूल्यांकन के लिए फ़ोरम, और मूल्यांकन फ़ोरम के सम्मेलन और प्रयोगशालाएँ पैन साहित्यिक चोरी का पता लगाने के लिए साझा चुनौती कार्य तैयार करता है, लेखकत्व की पहचान, लेखक लिंग पहचान, लेखक प्रोफाइलिंग, बर्बरता का पता लगाना, और अन्य संबंधित टेक्स्ट विश्लेषण कार्य, जिनमें से कई स्टाइलोमेट्री पर निर्भर हैं।

इंटरेस्ट का केस अध्ययन

 * 1439 में, लोरेंजो वल्ला ने दिखाया कि कॉन्स्टेंटाइन का दान जालसाजी था, यह तर्क आंशिक रूप से चौथी शताब्दी के प्रामाणिक दस्तावेजों में प्रयुक्त लैटिन के साथ तुलना पर आधारित था।
 * 1952 में, स्वीडिश पादरी डिक हेलैंडर को स्ट्रांगनास का बिशप चुना गया था। अभियान प्रतिस्पर्धी था और इस प्रकार हेलैंडर पर स्ट्रांगनास के बिशप पद के मतदाताओं के लिए अन्य उम्मीदवारों के बारे में सैकड़ों अस्पष्ट अपमानजनक पत्रों की श्रृंखला लिखने का आरोप लगाया गया था। हेलैंडर को पहले पत्र लिखने का दोषी ठहराया गया और बिशप के रूप में अपना पद खो दिया था, इस प्रकार किन्तु बाद में आंशिक रूप से दोषमुक्त कर दिया गया था। पत्रों का अध्ययन कई स्टाइलोमेट्रिक उपायों (और टाइपराइटर विशेषताओं) और विभिन्न अदालती स्थितियों और आगे की परीक्षाओं का उपयोग करके किया गया था, जिनमें से कई को 1978 में उनकी मृत्यु तक हेलैंडर द्वारा स्वयं अनुबंधित किया गया था, स्टाइलोमेट्रिक विधि और साक्ष्य के रूप में इसके मूल्य पर कुछ विस्तार से चर्चा की गई थी।.
 * 1975 में, रोनाल्ड रीगन के कैलिफ़ोर्निया के गवर्नर के रूप में कार्य करने के बाद, उन्होंने सैकड़ों स्टेशनों को सिंडिकेटेड साप्ताहिक रेडियो कमेंट्री देना प्रारंभ किया था। इस प्रकार 2001 में उनके 90वें जन्मदिन पर उनके व्यक्तिगत नोट्स सार्वजनिक होने के बाद, अध्ययन में स्टाइलोस्टैटिस्टिकल विधियों का उपयोग करके यह निर्धारित किया गया कि उनमें से कौन सी इंटरैक्शन उनके द्वारा लिखी गई थी और कौन सी उनके विभिन्न सहयोगियों द्वारा लिखी गई थी।
 * 1996 में, वासर कॉलेज के प्रोफेसर डोनाल्ड फोस्टर (प्रोफेसर) द्वारा प्रस्तुत विवादास्पद, छद्म नाम से लिखी गई पुस्तक प्राथमिक रंग (उपन्यास) का स्टाइलोमेट्रिक विश्लेषण लेखक की सही पहचान जो क्लेन के रूप में करने के बाद विषय को व्यापक दर्शकों के ध्यान में लाया गया। (हस्तलेख विश्लेषण द्वारा लेखकत्व की पुष्टि के बाद ही यह स्थिति सुलझाया गया।)
 * 1996 में, यूनाबॉम्बर घोषणापत्र की तुलना संदिग्धों में से एक, थिओडोर कैज़िंस्की द्वारा लिखे गए पत्रों के साथ करने के लिए स्टाइलोमेट्रिक विधियों का उपयोग किया गया था, जिसके परिणामस्वरूप काकज़िनस्की की आशंका हुई और बाद में उसे दोषी ठहराया गया था।
 * अप्रैल 2015 में, स्टाइलोमेट्री तकनीकों का उपयोग करने वाले शोधकर्ताओं ने विलियम शेक्सपियर के कार्य के रूप में नाटक, दोहरा झूठ की पहचान की थी। शोधकर्ताओं ने शेक्सपियर और जॉन फ्लेचर (नाटककार) के 54 नाटकों का विश्लेषण किया, और औसत वाक्य लंबाई की तुलना की, असामान्य शब्दों के उपयोग का अध्ययन किया था और इस प्रकार उनकी भाषा की जटिलता और मनोवैज्ञानिक वैधता (भाषा विज्ञान) की मात्रा निर्धारित की थी।
 * 2016 में, मैकडोनाल्ड पी. जैक्सन, न्यूजीलैंड के ऑकलैंड विश्वविद्यालय में अंग्रेजी के एमेरिटस प्रोफेसर और न्यूजीलैंड की रॉयल सोसाइटी के फेलो, जिन्होंने अपना पूरा शैक्षणिक करियर लेखकत्व गुण का विश्लेषण करते हुए बिताया था, ने हू वॉट्ट द नाम से किताब लिखी थी। क्रिसमस से पहले की रात?: क्लेमेंट क्लार्क मूर बनाम का विश्लेषण हेनरी लिविंगस्टन प्रश्न, जिसमें वह विरोधी तर्कों का मूल्यांकन करता है और, पहली बार, लंबे समय से चले आ रहे विवाद की जांच करने के लिए आधुनिक कम्प्यूटेशनल शैली विज्ञान की लेखक-एट्रिब्यूशन तकनीकों का उपयोग करता है। जैक्सन कई प्रकार के परीक्षणों को नियोजित करता है और नया, स्वरों का सांख्यिकीय विश्लेषण प्रस्तुत करता है; उन्होंने निष्कर्ष निकाला कि लिविंगस्टन क्लासिक कार्य के सच्चे लेखक हैं।
 * 2017 में, साइमन फुलर और जेम्स ओ'सुल्लीवन (आयरिश अकादमिक) या जेम्स ओ'सुल्लीवन ने अध्ययन प्रकाशित किया जिसमें प्रमाणित किया गया कि बेस्टसेलिंग लेखक जेम्स पैटरसन अपने स्पष्ट रूप से सह-लेखक उपन्यासों में कोई लेखन नहीं करते हैं।  ओ'सुलिवन के अनुसार, पूर्व अमेरिकी राष्ट्रपति बिल क्लिंटन के साथ उनका सहयोग, राष्ट्रपति लापता है (उपन्यास), इस नियम का अपवाद है।
 * 2017 में, भाषाविदों, कंप्यूटर वैज्ञानिकों और विद्वानों के समूह ने ऐलेना फेरांटे के लेखकत्व का विश्लेषण किया था। पडुआ विश्वविद्यालय में बनाए गए कोष के आधार पर जिसमें 40 लेखकों द्वारा लिखे गए 150 उपन्यास सम्मिलित हैं, इस प्रकार उन्होंने फेरांटे की शैली का उसके सात उपन्यासों के आधार पर विश्लेषण किया था। उदाहरण के लिए, स्टाइलो का उपयोग करके वे उनकी लेखन शैली की तुलना 39 अन्य उपन्यासकारों से करने में सक्षम थे। निष्कर्ष उन सभी के लिए समान था: डोमेनिको स्टारनोन ऐलेना फेरांटे के गुप्त लेखक हैं।
 * 2018 में, हार्वर्ड विश्वविद्यालय में सांख्यिकी के वरिष्ठ व्याख्याता, मार्क ग्लिकमैन ने हार्वर्ड के पूर्व सांख्यिकी छात्र रयान सॉन्ग और नोवा स्कोटिया में डलहौजी विश्वविद्यालय के प्रोफेसर जेसन ब्राउन के साथ कार्य किया, और यह पता लगाने के लिए स्टाइलोमेट्री का उपयोग किया कि, सबसे अधिक संभावना हैद बीटल्स का गीत मेरे जीवन में जॉन लेनन द्वारा रचा गया था, किन्तु 50% संभावना है कि पॉल मेकार्टनी ने मध्य आठ लिखा था।
 * 2019 में, ईटीएसओ प्रोजेक्ट: स्टाइलोमेट्री को स्पैनिश गोल्डन एज ​​थिएटर में क्रियान्वित किया गया था, इस प्रकार फिल्म का निर्देशन अल्वारो कुएलर गोंजालेज और जर्मन वेगा गार्सिया-लुएंगोस ने किया है। स्टाइलोमेट्रिकल विश्लेषण क्रियान्वित करने के बाद, महिलाओं और पालक बच्चों का श्रेय लोप डी वेगा को दिया गया अनुमोदित किया गया था, और ला मोन्ज़ा अल्फ़ेरेज़ में लेखकत्व समस्या का पता चला था, जो पेरेज़ डी मोंटालबैन के लिए उत्तरदायी नाटक था, जो इन विश्लेषणों और ऐतिहासिक और भाषाविज्ञान अनुसंधान के माध्यम से, अंततः जुआन रुइज़ डी अलारकोन को उत्तरदायी ठहराया गया था।    इस प्रकार 2023 में, उसी प्रोजेक्ट में लोप डी वेगा को ला फ्रांसेसा लॉरा (द फ्रेंचवूमन लॉरा) के लेखक के रूप में पाया गया, जबकि पांडुलिपि उनकी मृत्यु के वर्षों बाद लिखी गई थी। इस प्रकार कॉमेडी को लोप डी वेगा के दिवंगत कार्य के रूप में वर्गीकृत किया गया था और यह 1628 से 1630 तक की थी, क्योंकि फ्रांस के प्रति इसके पूर्ण व्यवहार का श्रेय तीस साल के युद्ध के समय स्पेन और फ्रांस के बीच क्षणिक अच्छे संबंधों को दिया जा सकता है, जिसमें इंग्लैंड सामान्य दुश्मन था। . इस विश्लेषण में, जांच के अनुसार टेक्स्ट के 500 सबसे अधिक बार आने वाले शब्दों की तुलना बाकी कार्यों के 500 से की गई है। ला फ्रांसेसा लॉरा के स्थितियों में, खोज से पता चला कि जिन 100 कार्यों के साथ यह निकटतम था, उनमें से लगभग सभी लोप डी वेगा के थे। इस प्रकार कार्यों के लेखकत्व पर पारंपरिक भाषाविज्ञान विश्लेषण ने कृत्रिम बुद्धि की जांच की पुष्टि की है।
 * 2020 में, राचेल मैक्कार्थी और जेम्स ओ'सुल्लीवन (आयरिश अकादमिक) या जेम्स ओ'सुल्लीवन ने तर्क दिया कि एमिली ब्रोंटे वर्थरिंग हाइट्स की सच्ची लेखिका हैं, इस प्रकार जिससे कुछ आलोचकों की अटकलें समाप्त हो गईं कि उपन्यास उनके किसी भाई-बहन द्वारा लिखा गया हो सकता है, विशेष रूप से या तो ब्रैनवेल ब्रोंटे या चार्लोट ब्रोंटे ने किया था।
 * 2020 में, हार्टमुट इल्सेमैन ने आर स्टाइलो प्रोग्राम सूट से रोलिंग डेल्टा और रोलिंग क्लासीफाई का उपयोग यह दिखाने के लिए किया कि मार्लो कॉर्पस शैलीगत रूप से अमानवीय है, और दो टैम्बुरलेन्स के लेखक संभवतः ही मार्लो के शेष आधिकारिक कॉर्पस में उपस्थित थे।
 * 2022 में, इतालवी विद्वान सिमोन रेबोरा और मास्सिमो साल्गारो ने जॉन एफ. बरोज़ की "डेल्टा डिस्टेंस" पद्धति का उपयोग करते हुए दिखाया कि फ़ेलिक्स साल्टेन 1906 के अस्पष्ट उपन्यास जोसेफिन मटज़ेनबैकर के सबसे संभावित लेखक हैं, अंतिम पृष्ठों को बाहर रखा गया है।

डेटा और विधियाँ
चूँकि स्टाइलोमेट्री में वर्णनात्मक उपयोग के दोनों स्थितियों हैं, जिनका उपयोग संग्रह की पदार्थ को चित्रित करने के लिए किया जाता है, और इस प्रकार पहचानात्मक उपयोग के स्थितियों, जैसे लेखकों या पाठों की श्रेणियों की पहचान करना, ऊपर दिए गए डेटा और सुविधाओं का विश्लेषण करने के लिए उपयोग की जाने वाली विधियां वस्तुओं को समूह में वर्गीकृत करने या फीचर भिन्नता के समिष्ट पर वस्तुओं को वितरित करने के लिए बनाई गई विधियों से भिन्न होती हैं। अधिकांश विधियाँ प्रकृति में सांख्यिकीय हैं, जैसे क्लस्टर विश्लेषण और विभेदक विश्लेषण, सामान्यतः भाषाविज्ञान डेटा और विशेषताओं पर आधारित होती हैं, और आधुनिक मशीन सीखने के विधियों के लिए उपयोगी अनुप्रयोग डोमेन हैं।

जबकि इसके पश्चात्, स्टाइलोमेट्री ने किसी टेक्स्ट के सबसे विरल या सबसे हड़ताली तत्वों पर बल दिया था, समकालीन तकनीकें भाषण के सामान्य भागो में भी पहचान क्रम को अलग कर सकती हैं। इस प्रकार अधिकांश प्रणालियाँ शाब्दिक आँकड़ों पर आधारित होती हैं, अर्थात टेक्स्ट (या उसके लेखक) को चित्रित करने के लिए टेक्स्ट में शब्दों और शब्दों की आवृत्तियों का उपयोग करता है। इस प्रकार इस संदर्भ में, सूचना पुनर्प्राप्ति के विपरीत, अंग्रेजी में सबसे सामान्य शब्द के देखे गए घटना क्रम उन सामयिक शब्दों की तुलना में अधिक रोचक हैं जो कम बार होते हैं।

प्राथमिक स्टाइलोमेट्रिक विधि लेखक अपरिवर्तनीय है: किसी दिए गए लेखक द्वारा लिखे गए सांख्यिकीय रूप से महत्वपूर्ण परिणाम देने वाले विश्लेषण को स्वीकार करने के लिए सभी ग्रंथों, या कम से कम सभी ग्रंथों द्वारा समान रूप से रखी गई संपत्ति लेखक अपरिवर्तनीय का उदाहरण लेखक द्वारा प्रयुक्त फलन शब्द की आवृत्ति है।

ऐसी ही विधि में, 50 सबसे सामान्य शब्दों को खोजने के लिए टेक्स्ट का विश्लेषण किया जाता है। फिर टेक्स्ट को 5,000 शब्द खंडों में विभाजित किया जाता है और उस खंड में उन 50 शब्दों की आवृत्ति का पता लगाने के लिए प्रत्येक खंड का विश्लेषण किया जाता है। यह प्रत्येक टुकड़े के लिए अद्वितीय 50-संख्या पहचानकर्ता उत्पन्न करता है। ये संख्याएँ टेक्स्ट के प्रत्येक भाग को 50-आयामी समिष्ट में बिंदु पर रखती हैं। इस 50-आयामी समिष्ट को प्रमुख घटक विश्लेषण (पीसीए) का उपयोग करके विमान में समतल किया गया है। इसके परिणामस्वरूप उन बिंदुओं का प्रदर्शन होता है जो लेखक की शैली के अनुरूप होते हैं। यदि दो साहित्यिक कृतियों को ही तल पर रखा जाता है, जिससे परिणामी क्रम यह दिखा सकता है कि क्या दोनों कृतियाँ ही लेखक या अलग-अलग लेखकों की हैं।

गाऊसी सांख्यिकी
स्टाइलोमेट्रिक डेटा को जिपफ-मंडेलब्रॉट नियम के अनुसार वितरित किया जाता है। वितरण अत्यंत कांटेदार और लेप्टोकुर्टिक है, इस प्रकार यही कारण है कि शोधकर्ता इसे हल करने के लिए आंकड़ों का उपयोग नहीं कर सकता है। लेखकत्व एट्रिब्यूशन समस्याएं. फिर भी, डेटा परिवर्तन (सांख्यिकी) को क्रियान्वित करके गाऊसी सांख्यिकी का उपयोग पूरी तरह से संभव है।

तंत्रिका नेटवर्क
तंत्रिका नेटवर्क, सांख्यिकीय मशीन सीखने के विधियों का विशेष स्थिति, का उपयोग ग्रंथों के लेखकत्व का विश्लेषण करने के लिए किया गया है। इस प्रकार निर्विवाद लेखकत्व के ग्रंथों का उपयोग तंत्रिका नेटवर्क को पश्चप्रचार जैसी प्रक्रियाओं द्वारा प्रशिक्षित करने के लिए किया जाता है, जैसे कि प्रशिक्षण त्रुटि की गणना की जाती है और स्पष्टता बढ़ाने के लिए प्रक्रिया को अद्यतन करने के लिए उपयोग किया जाता है। इस प्रकार गैर-रेखीय प्रतिगमन के समान प्रक्रिया के माध्यम से, नेटवर्क नए पाठों के लिए अपनी पहचान क्षमता को सामान्यीकृत करने की क्षमता प्राप्त करता है, जिसे अभी तक प्रदर्शित नहीं किया गया है, और इस प्रकार उन्हें आत्मविश्वास की निश्चित डिग्री के अनुसार वर्गीकृत किया जाता है। ऐसी तकनीकों को विलियम शेक्सपियर के उनके समकालीन जॉन फ्लेचर (नाटककार) और क्रिस्टोफर मार्लो के साथ सहयोग के लंबे समय से चले आ रहे प्रमाणों पर क्रियान्वित किया गया था, और अधिक पारंपरिक विद्वता के आधार पर इस राय की पुष्टि की कि ऐसा सहयोग वास्तव में हुआ था। 1999 के अध्ययन से पता चला कि तंत्रिका नेटवर्क आयोजन उन कविताओं के लेखकत्व को निर्धारित करने में 70% स्पष्टता तक पहुंच गया था, इस प्रकार जिनका उसने अभी तक विश्लेषण नहीं किया था। व्रीजे यूनिवर्सिटिट के इस अध्ययन में केवल डेन जैसे अक्षर अनुक्रमों का उपयोग करके तीन डच लेखकों की कविताओं की पहचान की जांच की गई थी। एक अध्ययन में निरंतर प्रमाणीकरण (सीए) के लिए क्रियान्वित लेखकत्व सत्यापन मॉडल के लिए गहन विश्वास नेटवर्क (डीबीएन) का उपयोग किया गया था। विश्लेषण की इस पद्धति के साथ समस्या यह है कि नेटवर्क अपने प्रशिक्षण समूह के आधार पर पक्षपाती हो सकता है, इस प्रकार संभवतः उन लेखकों का चयन करना जिनका नेटवर्क ने अधिक बार विश्लेषण किया है।

आनुवंशिक एल्गोरिदम
जेनेटिक एल्गोरिद्म स्टाइलोमेट्री के लिए उपयोग की जाने वाली अन्य मशीन लर्निंग तकनीक है। इस प्रकार इसमें ऐसी विधि सम्मिलित है जो नियमों के समूह से प्रारंभ होती है। उदाहरण नियम हो सकता है, यदि प्रत्येक हजार शब्दों में 1.7 बार से अधिक प्रकट होता है, जिससे टेक्स्ट लेखक एक्स है। आयोजन टेक्स्ट के साथ प्रस्तुत किया गया है और लेखकत्व निर्धारित करने के लिए नियमों का उपयोग करता है। इस प्रकार नियमों का परीक्षण ज्ञात पाठों के समूह के विरुद्ध किया जाता है और प्रत्येक नियम को फिटनेस स्कोर दिया जाता है। सबसे कम अंक वाले 50 नियमों का उपयोग नहीं किया जाता है। अतिरिक्त 50 नियमों में छोटे-छोटे बदलाव किए गए हैं और 50 नए नियम लाए गए हैं। इसे तब तक दोहराया जाता है जब तक कि विकसित नियम पाठों का सही विवरण नही देते है।

विरल जोड़े
शैली की पहचान करने की विधि को विरल जोड़े कहा जाता है, और यह संयोजन की व्यक्तिगत आदतों पर निर्भर करता है। इस प्रकार किसी विशेष लेखक के लिए कुछ शब्दों का उपयोग, अन्य पूर्वानुमानित शब्दों के उपयोग के साथ अज्ञात रूप से जुड़ा हो सकता है।

त्वरित संदेश सेवा में लेखकत्व एट्रिब्यूशन
इंटरनेट के प्रसार ने लेखकत्व श्रेय का ध्यान ऑनलाइन टेक्स्ट (वेब ​​पेज, ब्लॉग इत्यादि), इलेक्ट्रॉनिक संदेश (ई-मेल, ट्वीट, पोस्ट इत्यादि), और अन्य प्रकार की लिखित जानकारी की ओर समिष्टांतरित कर दिया है जो कि से बहुत छोटी हैं। इस प्रकार औसत पुस्तक, रंग, पृष्ठ लेआउट, फ़ॉन्ट, ग्राफिक्स, इमोटिकॉन इत्यादि जैसे अभिव्यंजक तत्वों के संदर्भ में बहुत कम औपचारिक और अधिक विविध है। इस प्रकार संरचना और वाक्यविन्यास दोनों के स्तर पर ऐसे तथ्यों को ध्यान में रखने के प्रयासों की सूचना दी गई थी। इसके अतिरिक्त, साभिप्राय शैलीगत विकल्पों का विवरण करने के लिए पदार्थ-विशिष्ट और विशिष्ट संकेत (उदाहरण के लिए, विषय मॉडल और व्याकरण जांच उपकरण) प्रस्तुत किए गए थे।

त्वरित संदेश द्वारा चैट की पदार्थ को वर्गीकृत करने के लिए मानक स्टाइलोमेट्रिक सुविधाओं को नियोजित किया गया है, या प्रतिभागियों का व्यवहार, किन्तु चैट प्रतिभागियों की पहचान करने के प्रयास अभी भी कम और प्रारंभिक हैं। इस प्रकार इसके अतिरिक्त, चैट डेटा और किसी अन्य प्रकार की लिखित जानकारी के बीच बड़ा अंतर होने के अतिरिक्त मौखिक इंटरैक्शन और चैट इंटरैक्शन के बीच समानता को उपेक्षा कर दिया गया है।

यह भी देखें

 * डेटा पुनः पहचान
 * डिजिटल वॉटरमार्किंग
 * भाषाविज्ञान और मॉर्मन की पुस्तक या स्टाइलोमेट्री (वर्डप्रिंट अध्ययन) या भाषाविज्ञान और मॉर्मन की पुस्तक, स्टाइलोमेट्री (वर्डप्रिंट अध्ययन)
 * मोशे युगल
 * मात्रात्मक भाषाविज्ञान
 * स्टेग्नोग्राफ़ी
 * लिखोमुद्रण

संदर्भ

 * Van Droogenbroeck, Frans J. (2016) "Handling the Zipf distribution in computerized authorship attribution"
 * Van Droogenbroeck, Frans J. (2019) "An essential rephrasing of the Zipf-Mandelbrot law to solve authorship attribution applications by Gaussian statistics"
 * Van Droogenbroeck, Frans J. (2016) "Handling the Zipf distribution in computerized authorship attribution"
 * Van Droogenbroeck, Frans J. (2019) "An essential rephrasing of the Zipf-Mandelbrot law to solve authorship attribution applications by Gaussian statistics"
 * Van Droogenbroeck, Frans J. (2016) "Handling the Zipf distribution in computerized authorship attribution"
 * Van Droogenbroeck, Frans J. (2019) "An essential rephrasing of the Zipf-Mandelbrot law to solve authorship attribution applications by Gaussian statistics"
 * Van Droogenbroeck, Frans J. (2016) "Handling the Zipf distribution in computerized authorship attribution"
 * Van Droogenbroeck, Frans J. (2019) "An essential rephrasing of the Zipf-Mandelbrot law to solve authorship attribution applications by Gaussian statistics"
 * Van Droogenbroeck, Frans J. (2016) "Handling the Zipf distribution in computerized authorship attribution"
 * Van Droogenbroeck, Frans J. (2019) "An essential rephrasing of the Zipf-Mandelbrot law to solve authorship attribution applications by Gaussian statistics"
 * Van Droogenbroeck, Frans J. (2016) "Handling the Zipf distribution in computerized authorship attribution"
 * Van Droogenbroeck, Frans J. (2019) "An essential rephrasing of the Zipf-Mandelbrot law to solve authorship attribution applications by Gaussian statistics"
 * Van Droogenbroeck, Frans J. (2016) "Handling the Zipf distribution in computerized authorship attribution"
 * Van Droogenbroeck, Frans J. (2019) "An essential rephrasing of the Zipf-Mandelbrot law to solve authorship attribution applications by Gaussian statistics"
 * Van Droogenbroeck, Frans J. (2016) "Handling the Zipf distribution in computerized authorship attribution"
 * Van Droogenbroeck, Frans J. (2019) "An essential rephrasing of the Zipf-Mandelbrot law to solve authorship attribution applications by Gaussian statistics"
 * Van Droogenbroeck, Frans J. (2016) "Handling the Zipf distribution in computerized authorship attribution"
 * Van Droogenbroeck, Frans J. (2019) "An essential rephrasing of the Zipf-Mandelbrot law to solve authorship attribution applications by Gaussian statistics"
 * Van Droogenbroeck, Frans J. (2016) "Handling the Zipf distribution in computerized authorship attribution"
 * Van Droogenbroeck, Frans J. (2019) "An essential rephrasing of the Zipf-Mandelbrot law to solve authorship attribution applications by Gaussian statistics"
 * Van Droogenbroeck, Frans J. (2019) "An essential rephrasing of the Zipf-Mandelbrot law to solve authorship attribution applications by Gaussian statistics"

अग्रिम पठन
See also the academic journal Literary and Linguistic Computing, now Digital Scholarship in the Humanities (published by the University of Oxford) and the Language Resources and Evaluation journal (previously Computers and the Humanities).

बाहरी संबंध

 * Association for Computers and the Humanities
 * Literary and Linguistic Computing
 * Computational Stylistics Group
 * Signature Stylometric System
 * JGAAP Authorship Attribution Program
 * Uncovering the Mystery of J.K. Rowling's Latest Novel