टेक्स्ट प्रोसेसिंग

कंप्यूटिंग में, टेक्स्ट प्रोसेसिंग शब्द इलेक्ट्रॉनिक टेक्स्ट के निर्माण या परिवर्तन को स्वचालित करने के सिद्धांत और अभ्यास को संदर्भित करता है। टेक्स्ट समान्य रूप से अभ्यास में संलग्न व्यक्ति के कीबोर्ड पर निर्दिष्ट सभी अल्फ़ान्यूमेरिक वर्णों को संदर्भित करता है, किन्तु सामान्य रूप से टेक्स्ट का अर्थ लक्ष्य टेक्स्ट के मानक अक्षरों को सांकेतिक अक्षरों में परिवर्तन के ठीक ऊपर अमूर्त परत है।

प्रोसेसिंग शब्द स्वचालित (या यंत्रीकृत) प्रोसेसिंग को संदर्भित करता है, जो मैन्युअल रूप से किए गए समान परिवर्तन के विपरीत है।

टेक्स्ट प्रोसेसिंग में कंप्यूटर कमांड सम्मिलित होते हैं जो उदाहरण के लिए विषय, विषय परिवर्तन और कर्सर आंदोलन को प्रयुक्त करते हैं नियमित अभिव्यक्ति की टेक्स्ट प्रोसेसिंग वर्चुअल एडिटिंग मशीन है, जिसमें प्रिमिटिव प्रोग्रामिंग लैंग्वेज होती है जिसमें रजिस्टरों (पहचानकर्ता) का नाम होता है, और टेक्स्ट में वर्णों के अनुक्रम में पदों का नाम दिया जाता है। इनका उपयोग करके, टेक्स्ट प्रोसेसर, उदाहरण के लिए, टेक्स्ट के क्षेत्र को चिह्नित कर सकता है और फिर उसे स्थानांतरित कर सकता है। यूनिक्स उपयोगिता का टेक्स्ट प्रोसेसिंग फ़िल्टर प्रोग्राम, या फ़िल्टर है। इन दो तंत्रों में टेक्स्ट प्रोसेसिंग सम्मिलित है।
 * खोजें और रिप्लेस
 * प्रारूप
 * या की विषय की संसाधित रिपोर्ट तैयार करें
 * किसी फ़ाइल या टेक्स्ट फ़ाइल की रिपोर्ट को फ़िल्टर करें।

परिभाषा
चूंकि एएनएसआई एस्केप कोड जैसे मानकीकृत मार्कअप समान्य रूप से एडिटर के लिए अदृश्य होते हैं, उनमें क्षणिक गुणों का सेट सम्मिलित होता है जो कभी-कभी वर्ड प्रोसेसिंग से अप्रभेद्य हो जाते हैं। किन्तु वर्ड प्रोसेसिंग से निश्चित अंतर यह है कि टेक्स्ट प्रोसेसिंग उचित है: इस प्रकार फ़ॉन्ट और रंग जैसे मार्कअप वास्तव में विशिष्ट कारक नहीं हैं, क्योंकि फ़ॉन्ट और रंग को प्रभावित करने वाले वर्ण अनुक्रम केवल पृष्ठभूमि टेक्स्ट प्रोसेसिंग मोड द्वारा स्वचालित रूप से डाले गए मानक वर्ण हैं, जो अनुरूप टेक्स्ट एडिटर द्वारा पारदर्शी रूप से कार्य करने के लिए बनाए जाते हैं।, फिर भी वह मोड प्रभावी नहीं होने पर टेक्स्ट प्रोसेसिंग कमांड के रूप में दृश्यमान हो जाता है। इसलिए टेक्स्ट प्रोसेसिंग को मानक, फिर भी अदृश्य वर्णों के अतिरिक्त दृश्य वर्णों (या ग्रैफेम्स) के आसपास मूल रूप से (किन्तु पूर्ण रूप से नहीं) परिभाषित किया गया है।
 * केवळ "टेक्स्ट एडिटिंग" ऍप्लिकेशन्स नव्हे तर "टेक्स्ट प्रोसेसिंग युटिलिटीज" चे प्रतिनिधित्व करते.
 * संपादन प्रारंभ करने के "माउस विधि " (उदाहरण के लिए ड्रैग और ड्राप, कट और पेस्ट करें) के विपरीत, यह "कीबोर्ड विधि " से कहीं अधिक है।
 * दृष्टिकोण में यादृच्छिक पहुंच के अतिरिक्त अनुक्रमिक पहुंच है।
 * अप्रत्यक्ष रूप से एप्लीकेशन लेयर के अतिरिक्त प्रेजेंटेशन लेयर पर सीधे कार्य करता है।
 * रॉ डेटा पर कार्य करता है जो मानकीकृत होता है और किसी मालिकाना विधियों की ओर रुझान करने के अतिरिक्त अधिक विवर्त रूप से कार्य करता है।

इतिहास
कंप्यूटर टेक्स्ट प्रोसेसिंग का विकास क्लेन द्वारा नियमित लैंग्वेज को औपचारिक रूप देने के साथ ही प्रारंभ हुआ था। इस तरह की नियमित अभिव्यक्तियाँ तब मिनी-प्रोग्राम बन सकती हैं, जो की संकलन प्रक्रिया के साथ पूर्ण होती है, किसी भी संपादन को करने के लिए उपलब्ध होती है, एक बार उस लैंग्वेज का विस्तार हो जाता है। इसी तरह, फिल्टर को विशेष कमांड (कंप्यूटिंग) विकसित करके बढ़ाया जाता है।

मूलभूत अवधारणाएँ
एक एडिटर अनिवार्य रूप से इनपुट स्ट्रीम को आमंत्रित करता है और इसे टेक्स्ट प्रोसेसिंग वातावरण में निर्देशित करता है, जो या तो कमांड शेल या टेक्स्ट एडिटर होता है। जिसमे परिणामी आउटपुट आगे की टेक्स्ट प्रोसेसिंग पर प्रयुक्त होता है, जिसका अंतिम परिणाम अधिक परिष्कृत और संरचित कंप्यूटर प्रोग्राम द्वारा एक बार प्रयुक्त एल्गोरिदम के एकल एप्लीकेशन के समान होता है।

टेक्स्ट प्रोसेसिंग, एल्गोरिदम के विपरीत, सरल मैक्रोज़ का मैन्युअल रूप से प्रशासित अनुक्रम है जो पैटर्न-एक्शन अभिव्यक्ति और फ़िल्टरिंग तंत्र हैं। किसी भी स्थिति में प्रोग्रामर का संकेत टेक्स्ट प्रोसेसिंग के कार्य में पाठ्य वर्णों के दिए गए सेट पर अप्रत्यक्ष रूप से प्रभावित होता है। टेक्स्ट प्रोसेसिंग चरण के परिणाम कभी-कभी केवल आशाजनक होते हैं, और प्रयास किया गया तंत्र अक्सर दृश्य प्रतिक्रिया के माध्यम से विभिन्न ड्राफ्ट के अधीन होता है, जब तक कि नियमित अभिव्यक्ति या मार्कअप लैंग्वेज विवरण, या उपयोगिता विकल्पों में पूर्ण रूप से प्रभुत्व प्राप्त नहीं हो जाती है।

इस प्रकार से टेक्स्ट प्रोसेसिंग का संबंध अधिकत्तर कंप्यूटिंग के उच्चतम स्तर पर टेक्स्ट कैरेक्टर तैयार करने से है, जहां इसकी गतिविधियां कंप्यूटिंग के व्यावहारिक उपयोग-सूचना के मैन्युअल ट्रांसमिशन से ठीक नीचे हैं।

अंततः सभी कंप्यूटिंग टेक्स्ट प्रोसेसिंग है, असेंबलर के स्व-संकलित पाठ्य वर्णों से, ग्राफिकल डेटा के ब्लॉब को संभालने के लिए उत्पन्न स्वचालित प्रोग्रामिंग लैंग्वेज के माध्यम से, और अंत में नियमित अभिव्यक्तियों के मेटाकैरेक्टर्स तक जो उपस्थित टेक्स्ट डॉक्यूमेंट को तैयार करते हैं।

टेक्स्ट प्रोसेसिंग का अपना स्वचालन है।

अक्षर
पाठ्य वर्ण मानकीकृत वर्ण सेटों में आते हैं जिनमें न्यूलाइन वर्ण जैसे नियंत्रण वर्ण भी होते हैं, जो टेक्स्ट को व्यवस्थित करते हैं। अन्य प्रकार के नियंत्रण वर्ण ट्रांसमिशन की व्यवस्था करते हैं, वर्ण सेट को परिभाषित करते हैं, और अन्य हाउसकीपिंग कार्य करते हैं।

यह भी देखें

 * टेक्स्ट एडिटर
 * यूनिक्स कमांड की सूची

बाहरी संबंध

 * The subject matter of the book Automatic Text Processing by Gerard Salton
 * Database with Text Processing Tools (2013-10-23)
 * Content analysis software Software for Content Analysis.
 * Text Tools Online Online Text processing tools.