प्रतिलेखन (भाषाविज्ञान)

भाषाविज्ञान के अर्थ में प्रतिलेखन मौखिक भाषा का लेखन रूप में व्यवस्थित प्रतिनिधित्व है। स्रोत या तो कथन (भाषण या सांकेतिक भाषा) या किसी अन्य लेखन प्रणाली में पहले से मौजूद लिखित भाषा हो सकता है।

प्रतिलेखन को अनुवाद के साथ भ्रमित नहीं किया जाना चाहिए, जिसका अर्थ है स्रोत-भाषा से पाठ के अर्थ को लक्ष्य भाषा में प्रस्तुत करना, (उदाहरण के लिए  देवदूत  (स्रोत-भाषा स्पेनिश से) का अर्थ लक्ष्य में द एंजल्स है) भाषा अंग्रेजी); या लिप्यंतरण के साथ, जिसका अर्थ है किसी पाठ की वर्तनी को एक लिपि से दूसरी लिपि में प्रस्तुत करना।

भाषाविज्ञान के अकादमिक अनुशासन में, प्रतिलेखन (दूसरों के बीच) ध्वन्यात्मकता, वार्तालाप विश्लेषण, बोलीविज्ञान और समाजभाषाविज्ञान की पद्धतियों का एक अनिवार्य हिस्सा है। यह वाक् प्रौद्योगिकी के कई उपक्षेत्रों के लिए भी महत्वपूर्ण भूमिका निभाता है। शिक्षा क्षेत्र के बाहर प्रतिलेखन के सामान्य उदाहरण अदालत की सुनवाई की कार्यवाही हैं जैसे कि आपराधिक मुकदमा (अदालत रिपोर्टर द्वारा) या चिकित्सक के रिकॉर्ड किए गए वॉयस नोट्स ( चिकित्सकीय लिप्यंतरण )। यह लेख भाषाविज्ञान में प्रतिलेखन पर केंद्रित है।

ध्वन्यात्मक और वर्तनी प्रतिलेखन
भाषाई प्रतिलेखन के दो मुख्य प्रकार हैं। ध्वन्यात्मक प्रतिलेखन बोली जाने वाली भाषा के ध्वन्यात्मक और ध्वन्यात्मक गुणों पर केंद्रित है। ध्वन्यात्मक प्रतिलेखन के लिए सिस्टम इस प्रकार व्यक्तिगत ध्वनियों या फोन (ध्वन्यात्मकता) को लिखित प्रतीकों में मैप करने के लिए नियम प्रस्तुत करते हैं। इसके विपरीत, ऑर्थोग्राफ़िक ट्रांसक्रिप्शन के सिस्टम में किसी दिए गए भाषा की इमला द्वारा निर्धारित लिखित रूपों में बोले गए शब्दों को मैप करने के नियम शामिल होते हैं। ध्वन्यात्मक प्रतिलेखन विशेष रूप से परिभाषित वर्ण सेटों के साथ संचालित होता है, आमतौर पर अंतर्राष्ट्रीय ध्वन्यात्मक वर्णमाला।

चुना गया प्रतिलेखन का प्रकार अधिकतर उपयोग के संदर्भ पर निर्भर करता है। क्योंकि ध्वन्यात्मक प्रतिलेखन सख्ती से भाषा की ध्वन्यात्मक प्रकृति को रेखांकित करता है, इसका उपयोग ज्यादातर ध्वन्यात्मक या ध्वन्यात्मक विश्लेषण के लिए किया जाता है। हालाँकि, ऑर्थोग्राफ़िक ट्रांसक्रिप्शन में ध्वन्यात्मक घटक के साथ-साथ एक रूपात्मक और एक शाब्दिक घटक होता है (कौन सा पहलू किस डिग्री तक दर्शाया जाता है यह प्रश्न में भाषा और ऑर्थोग्राफी पर निर्भर करता है)। इस प्रकार प्रतिलेखन का यह रूप अधिक सुविधाजनक है जहां बोली जाने वाली भाषा के शब्दार्थ पहलुओं को प्रतिलेखित किया जाता है। ध्वन्यात्मक प्रतिलेखन वैज्ञानिक अर्थ में अधिक व्यवस्थित है, लेकिन इसे सीखना भी अधिक कठिन है, इसे पूरा करने में अधिक समय लगता है और ऑर्थोग्राफ़िक प्रतिलेखन की तुलना में यह कम व्यापक रूप से लागू होता है।

एक सिद्धांत के रूप में
बोली जाने वाली भाषा को लिखित प्रतीकों पर मैप करना इतनी सीधी प्रक्रिया नहीं है जितनी पहली नज़र में लग सकती है। लिखित भाषा एक आदर्शीकरण है, जो स्पष्ट रूप से अलग और अलग प्रतीकों के एक सीमित सेट से बनी होती है। दूसरी ओर, मौखिक भाषा एक सतत (असतत के विपरीत) घटना है, जो संभावित रूप से असीमित संख्या में घटकों से बनी होती है। इन घटकों को अलग करने और वर्गीकृत करने के लिए कोई पूर्व निर्धारित प्रणाली नहीं है और परिणामस्वरूप, इन घटकों को लिखित प्रतीकों पर मैप करने का कोई पूर्व निर्धारित तरीका नहीं है।

प्रतिलेखन प्रथाओं की गैर-तटस्थता को इंगित करने में साहित्य अपेक्षाकृत सुसंगत है। कोई तटस्थ प्रतिलेखन प्रणाली नहीं है और न ही हो सकती है। सामाजिक संस्कृति का ज्ञान सीधे प्रतिलेख के निर्माण में प्रवेश करता है। वे प्रतिलेख की बनावट में कैद हैं (बेकर, 2005)।

प्रतिलेखन प्रणाली
ट्रांसक्रिप्शन सिस्टम नियमों के समूह हैं जो परिभाषित करते हैं कि बोली जाने वाली भाषा को लिखित प्रतीकों में कैसे दर्शाया जाना है। अधिकांश ध्वन्यात्मक प्रतिलेखन प्रणालियाँ अंतर्राष्ट्रीय ध्वन्यात्मक वर्णमाला पर या, विशेष रूप से वाक् प्रौद्योगिकी में, इसके व्युत्पन्न SAMPA पर आधारित हैं।

ऑर्थोग्राफ़िक ट्रांसक्रिप्शन सिस्टम के उदाहरण (सभी वार्तालाप विश्लेषण या संबंधित क्षेत्रों के क्षेत्र से) हैं:

सीए (बातचीत विश्लेषण)
संभवतः अपनी तरह की पहली प्रणाली, जिसे मूल रूप से स्केच किया गया था (सैक्स एट अल. 1978), जिसे बाद में (मैकविनी 2000) द्वारा सीए-चैट के रूप में कंप्यूटर पठनीय कॉर्पोरा में उपयोग के लिए अनुकूलित किया गया। वार्तालाप विश्लेषण के क्षेत्र में प्रतिलेखन के लिए कई अलग-अलग दृष्टिकोण और प्रतिलेखन सम्मेलनों के सेट शामिल हैं। इनमें अन्य के अलावा जेफर्सन नोटेशन भी शामिल है। बातचीत का विश्लेषण करने के लिए, रिकॉर्ड किए गए डेटा को आम तौर पर एक लिखित रूप में लिखा जाता है जो विश्लेषकों के लिए स्वीकार्य होता है। दो सामान्य दृष्टिकोण हैं. पहला, जिसे संकीर्ण प्रतिलेखन कहा जाता है, बातचीत संबंधी बातचीत के विवरण को कैप्चर करता है जैसे कि किन विशेष शब्दों पर जोर दिया जाता है, किन शब्दों को अधिक ज़ोर से बोला जाता है, किन बिंदुओं पर बातचीत ओवरलैप होती है, विशेष शब्दों को कैसे व्यक्त किया जाता है, इत्यादि। यदि ऐसा विवरण कम महत्वपूर्ण है, शायद इसलिए कि विश्लेषक बातचीत की समग्र संरचना या प्रतिभागियों के बीच बातचीत के सापेक्ष वितरण के बारे में अधिक चिंतित है, तो दूसरे प्रकार का प्रतिलेखन जिसे व्यापक प्रतिलेखन के रूप में जाना जाता है, पर्याप्त हो सकता है ( विलियमसन, 2009)।

जेफ़रसन प्रतिलेखन प्रणाली
जेफरसन ट्रांसक्रिप्शन सिस्टम गेल जेफरसन द्वारा विकसित प्रतीकों का एक सेट है, जिसका उपयोग बातचीत को ट्रांसक्रिप्ट करने के लिए किया जाता है। 1963 में जेल प्रहरियों के लिए संवेदनशीलता-प्रशिक्षण सत्रों को लिपिबद्ध करने के लिए यूसीएलए के सार्वजनिक स्वास्थ्य विभाग में एक क्लर्क टाइपिस्ट के रूप में काम पर रखे जाने पर, लिपिबद्ध करने का कुछ पिछला अनुभव होने के बाद, जेफरसन ने कुछ रिकॉर्डिंग्स लिपिबद्ध करना शुरू किया, जो सामग्री के रूप में काम करती थीं, जिनमें से हार्वे सैक्स के शुरुआती व्याख्यान विकसित किए गए थे। चार दशकों से अधिक समय तक, जिनमें से अधिकांश समय में उनके पास कोई विश्वविद्यालय पद नहीं था और वे वेतनभोगी नहीं थीं, टॉक-इन-इंटरेक्शन में जेफर्सन के शोध ने वार्तालाप विश्लेषण#जेफरसोनियन ट्रांसक्रिप्शन (सीए) के रूप में जाना जाने वाला मानक स्थापित किया है। उनके काम ने बातचीत के समाजशास्त्रीय अध्ययन को बहुत प्रभावित किया है, बल्कि इससे परे के विषयों, विशेष रूप से भाषाविज्ञान, संचार और मानवविज्ञान को भी प्रभावित किया है। यह प्रणाली सीए परिप्रेक्ष्य से काम करने वालों द्वारा सार्वभौमिक रूप से नियोजित की जाती है और इसे प्रतिलेखन के लिए निर्देशों का लगभग-वैश्वीकृत सेट माना जाता है।

डीटी (प्रवचन प्रतिलेखन)
(डुबॉइस एट अल. 1992) में वर्णित एक प्रणाली, जिसका उपयोग बाद में सांता बारबरा कॉर्पस ऑफ स्पोकन अमेरिकन इंग्लिश (SBCSAE) के ट्रांसक्रिप्शन के लिए किया गया। इसे आगे DT2 में विकसित किया गया।

GAT (गेस्प्राच्सानालिटिचेस ट्रांसक्रिप्शंससिस्टम - वार्तालाप विश्लेषणात्मक ट्रांसक्रिप्शन सिस्टम)
(सेल्टिंग एट अल. 1998) में वर्णित एक प्रणाली, बाद में जीएटी2 (सेल्टिंग एट अल. 2009) में विकसित हुई, जिसका व्यापक रूप से जर्मन भाषी देशों में प्रोसोडी (भाषाविज्ञान) उन्मुख वार्तालाप विश्लेषण और इंटरेक्शनल भाषाविज्ञान के लिए उपयोग किया जाता है।

HIAT (Halbinterpretative Arbeitstransscriptionen - Semiinterpretative कार्यकारी प्रतिलेखन)
संभवतः अपनी तरह की पहली प्रणाली, जिसका मूल रूप से वर्णन (एहलिच और रेहबीन 1976) में किया गया है - अंग्रेजी संदर्भ के लिए देखें (एह्लिच 1992) - कंप्यूटर पठनीय कॉर्पोरा में उपयोग के लिए अनुकूलित (रेहबीन एट अल 2004), और व्यापक रूप से कार्यात्मक में उपयोग किया जाता है व्यावहारिकता

सॉफ़्टवेयर
ट्रांसक्रिप्शन मूल रूप से मैन्युअल रूप से की जाने वाली एक प्रक्रिया थी, यानी पेंसिल और कागज के साथ, एक कॉम्पैक्ट कैसेट पर संग्रहीत एनालॉग ध्वनि रिकॉर्डिंग का उपयोग करके। आजकल, अधिकांश प्रतिलेखन कंप्यूटर पर किया जाता है। रिकॉर्डिंग आमतौर पर डिजिटल ऑडियो फाइल या वीडियो फाइल होती हैं, और ट्रांसक्रिप्शन इलेक्ट्रॉनिक दस्तावेज़ होते हैं। डिजिटल रिकॉर्डिंग से कुशलतापूर्वक डिजिटल ट्रांसक्रिप्शन बनाने में ट्रांसक्राइबर की सहायता के लिए विशेष कंप्यूटर सॉफ्टवेयर मौजूद है।

ट्रांसक्रिप्शन की प्रक्रिया में सहायता के लिए दो प्रकार के प्रतिलेखन सॉफ्टवेयर का उपयोग किया जा सकता है: एक जो मैन्युअल ट्रांसक्रिप्शन की सुविधा देता है और दूसरा स्वचालित ट्रांसक्रिप्शन। पूर्व के लिए, काम अभी भी एक मानव प्रतिलेखक द्वारा किया जाता है जो रिकॉर्डिंग सुनता है और जो कंप्यूटर में सुना जाता है उसे टाइप करता है, और इस प्रकार का सॉफ़्टवेयर अक्सर प्लेबैक या गति बदलने जैसी कार्यक्षमता वाला मल्टीमीडिया प्लेयर होता है। बाद के लिए, स्वचालित प्रतिलेखन एक वाक् पहचान | वाक्-से-पाठ इंजन द्वारा प्राप्त किया जाता है जो ऑडियो या वीडियो फ़ाइलों को इलेक्ट्रॉनिक पाठ में परिवर्तित करता है। कुछ सॉफ़्टवेयर में टिप्पणी  का कार्य भी शामिल होगा।

यह भी देखें

 * इंटरलीनियर चमक
 * ध्वन्यात्मक प्रतिलेखन
 * वाक् पहचान
 * उपशीर्षक (कैप्शन)
 * पाठ्य छात्रवृत्ति
 * प्रतिलेखन (सेवा)
 * प्रतिलेखन सॉफ्टवेयर

अग्रिम पठन

 * Hepburn, A., & Bolden, G. B. (2013). The conversation analytic approach to transcription. In J. Sidnell & T. Stivers (Eds.), The handbook of Conversation Analysis (pp. 57–76). Oxford: Blackwell. PDF
 * DuBois, John / Schuetze-Coburn, Stephan / Cumming, Susanne / Paolino, Danae (1992): Outline of Discourse Transcription. In: Edwards/Lampert (1992), 45–89.
 * Haberland, H. & Mortensen, J. (2016) Transcription as second order entextualisation: The challenge of heteroglossia. In: Capone, A. & Mey, J. L. (eds.): Interdisciplinary Studies in Pragmatics, Culture and Society, 581–600. Cham: Springer.
 * Jenks, C.J. (2011) Transcribing Talk and Interaction: Issues in the Representation of Communication Data. Amsterdam: John Benjamins.
 * MacWhinney, Brian (2000): The CHILDES project: tools for analyzing talk. Mahwah, NJ: Lawrence Erlbaum.
 * Ochs, E. (1979) Transcription as theory. In: Ochs, E. & Schieffelin, B. B. (ed.): Developmental pragmatics, 43–72. New York: Academic Press.
 * Sacks, H.; Schegloff, E. & Jefferson, G. (1978) A simplest systematics for the organization of turn taking for conversation. In: Schenkein, J. (ed.): Studies in the Organization of Conversational Interaction, 7-56. New York: Academic Press.

बाहरी संबंध

 * Transcription in Action - website from UC Santa Barbara
 * Documentation and examples for the HIAT transcription system
 * Transcription - a website with resources for transcription in conversation analysis