प्रतिलेखन (भाषाविज्ञान)

भाषाविज्ञान के अर्थ में प्रतिलेखन मौखिक भाषा का लेखन रूप में व्यवस्थित प्रतिनिधित्व है। स्रोत या तो कथन (भाषण या सांकेतिक भाषा) या किसी अन्य लेखन प्रणाली में पहले से उपस्थित लिखित भाषा हो सकता है।

प्रतिलेखन को अनुवाद के साथ भ्रमित नहीं किया जाना चाहिए, जिसका अर्थ है स्रोत-भाषा से टेक्स्ट के अर्थ को लक्ष्य भाषा में प्रस्तुत करना, (उदाहरण के लिए लॉस एंजेल्स (स्रोत-भाषा स्पेनिश से) का अर्थ लक्ष्य में द एंजल्स है) भाषा अंग्रेजी); या लिप्यंतरण के साथ, जिसका अर्थ है किसी टेक्स्ट की वर्तनी को लिपि से दूसरी लिपि में प्रस्तुत करता है।

भाषाविज्ञान के अकादमिक अनुशासन में, प्रतिलेखन (दूसरों के बीच) ध्वन्यात्मकता, वार्तालाप विश्लेषण, बोलीविज्ञान और समाज भाषाविज्ञान की पद्धतियों का अनिवार्य भाग है। यह वाक् प्रौद्योगिकी के कई उपक्षेत्रों के लिए भी महत्वपूर्ण भूमिका निभाता है। शिक्षा क्षेत्र के बाहर प्रतिलेखन के सामान्य उदाहरण अदालत की सुनवाई की कार्यवाही हैं जैसे कि आपराधिक मुकदमा (अदालत रिपोर्टर द्वारा) या चिकित्सक के आवरण किए गए वॉयस नोट्स (चिकित्सकीय लिप्यंतरण) यह लेख भाषाविज्ञान में प्रतिलेखन पर केंद्रित है।

ध्वन्यात्मक और ऑर्थोग्राफ़िक प्रतिलेखन
भाषा ई प्रतिलेखन के दो मुख्य प्रकार हैं। ध्वन्यात्मक प्रतिलेखन बोली जाने वाली भाषा के ध्वन्यात्मक और ध्वन्यात्मक गुणों पर केंद्रित है। ध्वन्यात्मक प्रतिलेखन के लिए प्रणाली इस प्रकार व्यक्तिगत ध्वनियों या फोन (ध्वन्यात्मकता) को लिखित प्रतीकों में मैप करने के लिए नियम प्रस्तुत करते हैं। इसके विपरीत, ऑर्थोग्राफ़िक ट्रांसक्रिप्शन के प्रणाली में किसी दिए गए भाषा की इमला द्वारा निर्धारित लिखित रूपों में बोले गए शब्दों को मैप करने के नियम सम्मिलित होते हैं। ध्वन्यात्मक प्रतिलेखन विशेष रूप से परिभाषित वर्ण सेटों के साथ संचालित होता है, सामान्यतः अंतर्राष्ट्रीय ध्वन्यात्मक वर्णमाला का उपयोग किया जाता है।

चुना गया प्रतिलेखन का प्रकार अधिकतर उपयोग के संदर्भ पर निर्भर करता है। क्योंकि ध्वन्यात्मक प्रतिलेखन सख्ती से भाषा की ध्वन्यात्मक प्रकृति को रेखांकित करता है, इसका उपयोग ज्यादातर ध्वन्यात्मक या ध्वन्यात्मक विश्लेषण के लिए किया जाता है। चूँकि, ऑर्थोग्राफ़िक ट्रांसक्रिप्शन में ध्वन्यात्मक घटक के साथ-साथ रूपात्मक और शाब्दिक घटक होता है (कौन सा पहलू किस डिग्री तक दर्शाया जाता है यह प्रश्न में भाषा और ऑर्थोग्राफी पर निर्भर करता है)। इस प्रकार प्रतिलेखन का यह रूप अधिक सुविधाजनक है जहां बोली जाने वाली भाषा के शब्दार्थ तथ्यों को प्रतिलेखित किया जाता है। ध्वन्यात्मक प्रतिलेखन वैज्ञानिक अर्थ में अधिक व्यवस्थित है, किन्तु इसे सीखना भी अधिक कठिन है, इसे पूरा करने में अधिक समय लगता है और ऑर्थोग्राफ़िक प्रतिलेखन की तुलना में यह कम व्यापक रूप से प्रयुक्त होता है।

एक सिद्धांत के रूप में
बोली जाने वाली भाषा को लिखित प्रतीकों पर मैप करना इतनी सीधी प्रक्रिया नहीं है जितनी पहली आलोकन में लग सकती है। लिखित भाषा आदर्शीकरण है, जो स्पष्ट रूप से अलग और अलग प्रतीकों के सीमित सेट से बनी होती है। दूसरी ओर, मौखिक भाषा सतत (असतत के विपरीत) घटना है, जो संभावित रूप से असीमित संख्या में घटकों से बनी होती है। इन घटकों को अलग करने और वर्गीकृत करने के लिए कोई पूर्व निर्धारित प्रणाली नहीं है और परिणामस्वरूप, इन घटकों को लिखित प्रतीकों पर मैप करने का कोई पूर्व निर्धारित विधि नहीं है।

प्रतिलेखन प्रथाओं की गैर-तटस्थता को इंगित करने में साहित्य अपेक्षाकृत सुसंगत है। कोई तटस्थ प्रतिलेखन प्रणाली नहीं है और न ही हो सकती है। सामाजिक संस्कृति का ज्ञान सीधे प्रतिलेख के निर्माण में प्रवेश करता है। वे प्रतिलेख की बनावट में कैद हैं (बेकर, 2005)।

प्रतिलेखन प्रणाली
ट्रांसक्रिप्शन प्रणाली नियमों के समूह हैं जो परिभाषित करते हैं कि बोली जाने वाली भाषा को लिखित प्रतीकों में कैसे दर्शाया जाना है। अधिकांश ध्वन्यात्मक प्रतिलेखन प्रणालियाँ अंतर्राष्ट्रीय ध्वन्यात्मक वर्णमाला पर या, विशेष रूप से वाक् प्रौद्योगिकी में, इसके व्युत्पन्न साम्पा पर आधारित हैं।

ऑर्थोग्राफ़िक ट्रांसक्रिप्शन प्रणाली के उदाहरण (सभी वार्तालाप विश्लेषण या संबंधित क्षेत्रों के क्षेत्र से) हैं:

सीए (वार्तालाप विश्लेषण)
संभवतः अपनी तरह की पहली प्रणाली, जिसे मूल रूप से स्केच किया गया था (सैक्स एट अल. 1978), जिसे बाद में (मैकविनी 2000) द्वारा सीए-चैट के रूप में कंप्यूटर पठनीय कॉर्पोरा में उपयोग के लिए अनुकूलित किया गया था। वार्तालाप विश्लेषण के क्षेत्र में प्रतिलेखन के लिए कई अलग-अलग दृष्टिकोण और प्रतिलेखन सम्मेलनों के सेट सम्मिलित हैं। इनमें अन्य के अतिरिक्त जेफर्सन नोटेशन भी सम्मिलित है। वार्तालाप का विश्लेषण करने के लिए, आवरण किए गए डेटा को सामान्यतः लिखित रूप में लिखा जाता है जो विश्लेषकों के लिए स्वीकार्य होता है। दो सामान्य दृष्टिकोण हैं. पहला, जिसे संकीर्ण प्रतिलेखन कहा जाता है, वार्तालाप संबंधी वार्तालाप के विवरण को कैप्चर करता है जैसे कि किन विशेष शब्दों पर बल दिया जाता है, किन शब्दों को अधिक बल से बोला जाता है, किन बिंदुओं पर वार्तालाप ओवरलैप होती है, विशेष शब्दों को कैसे व्यक्त किया जाता है, इत्यादि। यदि ऐसा विवरण कम महत्वपूर्ण है, संभवतः इसलिए कि विश्लेषक वार्तालाप की समग्र संरचना या प्रतिभागियों के बीच वार्तालाप के सापेक्ष वितरण के बारे में अधिक चिंतित है, तो दूसरे प्रकार का प्रतिलेखन जिसे व्यापक प्रतिलेखन के रूप में जाना जाता है, पर्याप्त हो सकता है ( विलियमसन, 2009)।

जेफ़रसन प्रतिलेखन प्रणाली
जेफरसन ट्रांसक्रिप्शन प्रणाली गेल जेफरसन द्वारा विकसित प्रतीकों का सेट है, जिसका उपयोग वार्तालाप को ट्रांसक्रिप्ट करने के लिए किया जाता है। 1963 में जेल प्रहरियों के लिए संवेदनशीलता-प्रशिक्षण सत्रों को लिपिबद्ध करने के लिए यूसीएलए के सार्वजनिक स्वास्थ्य विभाग में क्लर्क टाइपिस्ट के रूप में काम पर रखे जाने पर, लिपिबद्ध करने का कुछ पिछला अनुभव होने के बाद, जेफरसन ने कुछ रिकॉर्डिंग्स लिपिबद्ध करना प्रारंभ किया, जो पदार्थ के रूप में काम करती थीं, जिनमें से हार्वे सैक्स के प्रारंभिक व्याख्यान विकसित किए गए थे। चार दशकों से अधिक समय तक, जिनमें से अधिकांश समय में उनके पास कोई विश्वविद्यालय पद नहीं था और वे वेतनभोगी नहीं थीं, टॉक-इन-इंटरेक्शन में जेफर्सन के शोध ने वार्तालाप विश्लेषण जेफरसोनियन ट्रांसक्रिप्शन (सीए) के रूप में जाना जाने वाला मानक स्थापित किया है। उनके काम ने वार्तालाप के समाज मौलिक अध्ययन को बहुत प्रभावित किया है, किन्तु इससे परे के विषयों, विशेष रूप से भाषाविज्ञान, संचार और मानवविज्ञान को भी प्रभावित किया है। यह प्रणाली सीए परिप्रेक्ष्य से काम करने वालों द्वारा सार्वभौमिक रूप से नियोजित की जाती है और इसे प्रतिलेखन के लिए निर्देशों का लगभग-वैश्वीकृत सेट माना जाता है। ===डीटी (प्रवचन प्रतिलेखन)                                                                                                                                                                                          === (डुबॉइस एट अल. 1992) में वर्णित प्रणाली, जिसका उपयोग बाद में सांता बारबरा कॉर्पस ऑफ स्पोकन अमेरिकन इंग्लिश (एसबीसीएसएई) के ट्रांसक्रिप्शन के लिए किया गया। इसे आगे DT2 में विकसित किया गया था।

जीएटी (गेस्प्राच्सानालिटिचेस ट्रांसक्रिप्शंससिस्टम - वार्तालाप विश्लेषणात्मक ट्रांसक्रिप्शन प्रणाली)
(सेल्टिंग एट अल. 1998) में वर्णित प्रणाली, बाद में जीएटी2 (सेल्टिंग एट अल. 2009) में विकसित हुई, जिसका व्यापक रूप से जर्मन भाषी देशों में प्रोसोडी (भाषाविज्ञान) उन्मुख वार्तालाप विश्लेषण और इंटरेक्शनल भाषाविज्ञान के लिए उपयोग किया जाता है।

एचआईएटी (हल्बिन्टरप्रिटिव आर्बिट्सट्रांसक्रिप्शनन - अर्धव्याख्यात्मक कार्यकारी प्रतिलेखन)
संभवतः अपनी तरह की पहली प्रणाली, जिसका मूल रूप से वर्णन (एहलिच और रेहबीन 1976) में किया गया है अंग्रेजी संदर्भ के लिए देखें (एह्लिच 1992) कंप्यूटर पठनीय कॉर्पोरा में उपयोग के लिए अनुकूलित (रेहबीन एट अल 2004), और व्यापक रूप से कार्यात्मक में उपयोग किया जाता है

सॉफ़्टवेयर
ट्रांसक्रिप्शन मूल रूप से मैन्युअल रूप से की जाने वाली प्रक्रिया थी, अर्थात पेंसिल और कागज के साथ, कॉम्पैक्ट कैसेट पर संग्रहीत एनालॉग ध्वनि रिकॉर्डिंग का उपयोग करके उपयोग किया जाता है। आजकल, अधिकांश प्रतिलेखन कंप्यूटर पर किया जाता है। रिकॉर्डिंग सामान्यतः डिजिटल ऑडियो फाइल या वीडियो फाइल होती हैं, और ट्रांसक्रिप्शन इलेक्ट्रॉनिक दस्तावेज़ होते हैं। डिजिटल रिकॉर्डिंग से कुशलतापूर्वक डिजिटल ट्रांसक्रिप्शन बनाने में ट्रांसक्राइबर की सहायता के लिए विशेष कंप्यूटर सॉफ्टवेयर उपस्थित है।

ट्रांसक्रिप्शन की प्रक्रिया में सहायता के लिए दो प्रकार के प्रतिलेखन सॉफ्टवेयर का उपयोग किया जा सकता है: जो मैन्युअल ट्रांसक्रिप्शन की सुविधा देता है और दूसरा स्वचालित ट्रांसक्रिप्शन पूर्व के लिए, काम अभी भी मानव प्रतिलेखक द्वारा किया जाता है जो रिकॉर्डिंग सुनता है और जो कंप्यूटर में सुना जाता है उसे टाइप करता है, और इस प्रकार का सॉफ़्टवेयर अधिकांशतः प्लेबैक या गति बदलने जैसी कार्यक्षमता वाला मल्टीमीडिया प्लेयर होता है। बाद के लिए, स्वचालित प्रतिलेखन भाषण-से-टेक्स्ट इंजन द्वारा प्राप्त किया जाता है जो ऑडियो या वीडियो फ़ाइलों को इलेक्ट्रॉनिक टेक्स्ट में परिवर्तित करता है। कुछ सॉफ़्टवेयर में टिप्पणी का कार्य भी सम्मिलित होता है।

यह भी देखें

 * इंटरलीनियर ग्लॉस
 * ध्वन्यात्मक प्रतिलेखन
 * वाक् पहचान
 * उपशीर्षक (कैप्शन)
 * पाठ्य छात्रवृत्ति
 * प्रतिलेखन (सेवा)
 * प्रतिलेखन सॉफ्टवेयर

==संदर्भ                                                                                                                                                                                                  ==

अग्रिम पठन

 * Hepburn, A., & Bolden, G. B. (2013). The conversation analytic approach to transcription. In J. Sidnell & T. Stivers (Eds.), The handbook of Conversation Analysis (pp. 57–76). Oxford: Blackwell. PDF
 * DuBois, John / Schuetze-Coburn, Stephan / Cumming, Susanne / Paolino, Danae (1992): Outline of Discourse Transcription. In: Edwards/Lampert (1992), 45–89.
 * Haberland, H. & Mortensen, J. (2016) Transcription as second order entextualisation: The challenge of heteroglossia. In: Capone, A. & Mey, J. L. (eds.): Interdisciplinary Studies in Pragmatics, Culture and Society, 581–600. Cham: Springer.
 * Jenks, C.J. (2011) Transcribing Talk and Interaction: Issues in the Representation of Communication Data. Amsterdam: John Benjamins.
 * MacWhinney, Brian (2000): The CHILDES project: tools for analyzing talk. Mahwah, NJ: Lawrence Erlbaum.
 * Ochs, E. (1979) Transcription as theory. In: Ochs, E. & Schieffelin, B. B. (ed.): Developmental pragmatics, 43–72. New York: Academic Press.
 * Sacks, H.; Schegloff, E. & Jefferson, G. (1978) A simplest systematics for the organization of turn taking for conversation. In: Schenkein, J. (ed.): Studies in the Organization of Conversational Interaction, 7-56. New York: Academic Press.

बाहरी संबंध

 * Transcription in Action - website from UC Santa Barbara
 * Documentation and examples for the एचआईएटी transcription system
 * Transcription - a website with resources for transcription in conversation analysis