स्क्रीन रीडर



स्क्रीन रीडर सहायक तकनीक का एक रूप है ( AT ) जो पाठ और छवि सामग्री को भाषण या ब्रेल आउटपुट के रूप में प्रस्तुत करता है। दृष्टिहीन लोगों के लिए स्क्रीन रीडर आवश्यक हैं, और दृष्टिबाधित लोगों के लिए उपयोगी हैं, निरक्षरता, या सीखने की अक्षमता है। स्क्रीन रीडर्स अनुप्रयोग प्रक्रिया सामग्री हैं जो यह बताने का प्रयास करते हैं कि सामान्य दृष्टि वाले लोग प्रदर्शन उपकरण पर अपने उपयोगकर्ताओं को भाषण के पाठ जैसे गैर-दृश्य माध्यमों के माध्यम से क्या देखते हैं। ध्वनि चिह्न, या एक ताज़ा करने योग्य ब्रेल डिस्प्ले। वे विभिन्न प्रकार की तकनीकों को लागू करके ऐसा करते हैं, जिसमें शामिल हैं, उदाहरण के लिए, समर्पित #Accessibility API के साथ बातचीत करना, विभिन्न ऑपरेटिंग सिस्टम सुविधाओं (जैसे इंटर-प्रोसेस संचार और उपयोगकर्ता इंटरफ़ेस गुणों को क्वेरी करना) का उपयोग करना, और हुकिंग तकनीकों को नियोजित करना। माइक्रोसॉफ़्ट विंडोज़ ऑपरेटिंग सिस्टम में विंडोज 2000 के बाद से माइक्रोसॉफ्ट नैरेटर स्क्रीन रीडर शामिल है, हालांकि स्वतंत्रता वैज्ञानिक के व्यावसायिक रूप से उपलब्ध JAWS (स्क्रीन रीडर) स्क्रीन रीडर और जूमटेक्स्ट स्क्रीन मैग्निफायर और एनवी एक्सेस द्वारा मुक्त और खुला स्रोत स्क्रीन रीडर गैर-दृश्य डेस्कटॉप एक्सेस जैसे अलग-अलग उत्पाद हैं। उस ऑपरेटिंग सिस्टम के लिए अधिक लोकप्रिय। Apple Inc. के macOS, iOS और TVOS में बिल्ट-इन स्क्रीन रीडर के रूप में VoiceOver शामिल है, जबकि Google का Android (ऑपरेटिंग सिस्टम) Google TalkBack प्रदान करता है और इसका ChromeOS ChromeVox का उपयोग कर सकता है। इसी तरह, Amazon के Android-आधारित उपकरण VoiceView स्क्रीन रीडर प्रदान करते हैं। लिनक्स और यूनिक्स जैसी प्रणालियों के लिए फ्री और ओपन सोर्स स्क्रीन रीडर भी हैं, जैसे स्पीकअप और ओर्का (सहायक तकनीक)।

कमांड-लाइन (पाठ)
शुरुआती ऑपरेटिंग सिस्टम में, जैसे कि MS-DOS, जिसमें कमांड लाइन इंटरफेस ( CLI s) को नियोजित किया गया था, स्क्रीन डिस्प्ले में चरित्र (कंप्यूटिंग) मेमोरी-मैप्ड I/O सीधे एक स्क्रीन बफर में शामिल था स्मृति और एक कर्सर (कंप्यूटर) स्थिति। इनपुट कीबोर्ड द्वारा किया गया था। इसलिए यह सारी जानकारी सिस्टम से या तो सिस्टम के चारों ओर सूचना के प्रवाह को हुक करके और स्क्रीन बफर को पढ़कर या एक मानक हार्डवेयर आउटपुट सॉकेट का उपयोग करके प्राप्त की जा सकती है। और उपयोगकर्ता को परिणाम संप्रेषित करना।

1980 के दशक में, बर्मिंघम विश्वविद्यालय में दृष्टि विकलांगों की शिक्षा के लिए अनुसंधान केंद्र ( RCEVH ) ने बीबीसी माइक्रो और के लिए एक स्क्रीन रीडर विकसित किया एनईसी पोर्टेबल।

ऑफ-स्क्रीन मॉडल
ग्राफिकल यूज़र इंटरफ़ेस ( GUI s) के आगमन के साथ, स्थिति और अधिक जटिल हो गई। एक GUI में विशिष्ट स्थानों पर स्क्रीन पर वर्ण और ग्राफ़िक्स बनाए जाते हैं, और इसलिए प्रदर्शन की ग्राफ़िकल सामग्री का कोई विशुद्ध रूप से पाठ्य प्रतिनिधित्व नहीं होता है। इसलिए स्क्रीन पाठकों को नई निम्न-स्तरीय तकनीकों को नियोजित करने, ऑपरेटिंग सिस्टम से संदेशों को इकट्ठा करने और ऑफ-स्क्रीन मॉडल बनाने के लिए इनका उपयोग करने के लिए मजबूर किया गया था, जिसमें आवश्यक टेक्स्ट सामग्री संग्रहीत की जाती है। उदाहरण के लिए, ऑपरेटिंग सिस्टम कमांड बटन और उसके कैप्शन को बनाने के लिए संदेश भेज सकता है। इन संदेशों को इंटरसेप्ट किया जाता है और ऑफ-स्क्रीन मॉडल बनाने के लिए उपयोग किया जाता है। उपयोगकर्ता स्क्रीन पर उपलब्ध नियंत्रणों (जैसे बटन) के बीच स्विच कर सकता है और कैप्शन और नियंत्रण सामग्री को ज़ोर से पढ़ा जाएगा और/या ताज़ा करने योग्य ब्रेल डिस्प्ले पर दिखाया जाएगा।

स्क्रीन रीडर नेत्रहीन उपयोगकर्ताओं को इन निर्माणों के साथ बातचीत करने की अनुमति देने के लिए मेनू, नियंत्रण और अन्य दृश्य निर्माणों के बारे में जानकारी भी संप्रेषित कर सकते हैं। हालाँकि, ऑफ-स्क्रीन मॉडल को बनाए रखना एक महत्वपूर्ण तकनीकी चुनौती है; निम्न स्तर के संदेशों को जोड़ना और एक सटीक मॉडल बनाए रखना दोनों कठिन कार्य हैं।

अभिगम्यता एपीआई
ऑपरेटिंग सिस्टम और एप्लिकेशन डिजाइनरों ने ऑफ-स्क्रीन मॉडल को बनाए रखने के बिना स्क्रीन पाठकों को डिस्प्ले सामग्री तक पहुंचने के तरीके प्रदान करके इन समस्याओं का समाधान करने का प्रयास किया है। इनमें एक अप्लिकेशन प्रोग्रामिंग अंतरफलक के माध्यम से एक्सेस की गई स्क्रीन पर प्रदर्शित की जा रही चीज़ों के वैकल्पिक और सुलभ प्रतिनिधित्व का प्रावधान शामिल है। मौजूदा API में शामिल हैं: स्क्रीन रीडर वर्तमान में प्रदर्शित होने वाली चीज़ों के लिए ऑपरेटिंग सिस्टम या एप्लिकेशन को क्वेरी कर सकते हैं और डिस्प्ले बदलने पर अपडेट प्राप्त कर सकते हैं। उदाहरण के लिए, एक स्क्रीन रीडर को बताया जा सकता है कि वर्तमान फोकस एक बटन पर है और बटन कैप्शन को उपयोगकर्ता को सूचित किया जाना है। स्क्रीन रीडर्स के विकासकर्ताओं के लिए यह तरीका काफी आसान है, लेकिन जब एप्लिकेशन एक्सेसिबिलिटी API का अनुपालन नहीं करते हैं तो यह विफल हो जाता है: उदाहरण के लिए, Microsoft Word MSAA < का अनुपालन नहीं करता है। abbr>API, इसलिए स्क्रीन पाठकों को अभी भी Word के लिए एक ऑफ-स्क्रीन मॉडल बनाए रखना चाहिए या इसकी सामग्री तक पहुंचने का दूसरा तरीका खोजना चाहिए। एक्सेसिबिलिटी API के पूरक के लिए उपलब्ध ऑपरेटिंग सिस्टम संदेशों और एप्लिकेशन ऑब्जेक्ट मॉडल का उपयोग करना एक दृष्टिकोण है।
 * एंड्रॉइड एक्सेसिबिलिटी फ्रेमवर्क
 * ऐप्पल एक्सेसिबिलिटी एपीआई
 * एटी-एसपीआई
 * IAccessible2
 * माइक्रोसॉफ्ट एक्टिव एक्सेसिबिलिटी ( MSAA )
 * माइक्रोसॉफ्ट यूआई स्वचालन
 * जावा एक्सेस ब्रिज

स्क्रीन रीडर्स के बारे में यह माना जा सकता है कि वे सभी प्रदर्शन सामग्री तक पहुंच सकते हैं जो आंतरिक रूप से दुर्गम नहीं है। वेब ब्राउज़र, वर्ड प्रोसेसर, आइकन और विंडोज़ और ईमेल प्रोग्राम स्क्रीन रीडर उपयोगकर्ताओं द्वारा सफलतापूर्वक उपयोग किए जाने वाले कुछ एप्लिकेशन हैं। हालाँकि, कुछ उपयोगकर्ताओं के अनुसार, जीयूआई का उपयोग करने की तुलना में एक स्क्रीन रीडर का उपयोग करना काफी कठिन है, और कई अनुप्रयोगों में विशिष्ट समस्याएं होती हैं, जो एप्लिकेशन की प्रकृति (जैसे एनिमेशन) या प्लेटफॉर्म के लिए एक्सेसिबिलिटी मानकों का पालन करने में विफलता (जैसे माइक्रोसॉफ्ट वर्ड और एक्टिव एक्सेसिबिलिटी) के परिणामस्वरूप होती हैं।

आत्म आवाज प्रोग्राम और एप्लिकेशन
कुछ कार्यक्रमों और अनुप्रयोगों में वॉयसिंग तकनीक उनकी प्राथमिक कार्यक्षमता के साथ निर्मित होती है। इन कार्यक्रमों को स्व-आवाज़ कहा जाता है और यदि वे स्क्रीन रीडर का उपयोग करने की आवश्यकता को दूर करने के लिए डिज़ाइन किए गए हैं तो वे सहायक तकनीक का एक रूप हो सकते हैं।

क्लाउड-आधारित
कुछ टेलीफोन सेवाएं उपयोगकर्ताओं को दूरस्थ रूप से इंटरनेट से बातचीत करने की अनुमति देती हैं। उदाहरण के लिए, टेलीटेंडर फोन पर वेब पेजों को पढ़ सकता है और इसके लिए उपयोगकर्ता की ओर से विशेष कार्यक्रमों या उपकरणों की आवश्यकता नहीं होती है।

आभासी सहायक कभी-कभी लिखित दस्तावेज़ (टेक्स्टुअल वेब सामग्री, पोर्टेबल दस्तावेज़ फ़ॉर्मेट दस्तावेज़, ई-मेल आदि) पढ़ सकते हैं। सबसे प्रसिद्ध उदाहरण Apple के महोदय मै, Google सहायक और अमेज़न एलेक्सा हैं।

वेब आधारित
क्षेत्र में एक अपेक्षाकृत नया विकास स्पोकन-वेब जैसे वेब-आधारित अनुप्रयोग हैं जो वेब पोर्टल के रूप में कार्य करते हैं, दृष्टिबाधित या नेत्रहीन कंप्यूटर उपयोगकर्ताओं के लिए समाचार अपडेट, मौसम, विज्ञान और व्यावसायिक लेख जैसी सामग्री का प्रबंधन करते हैं। अन्य उदाहरण रीडस्पीकर या जोर से ब्राउज़ करें हैं जो वेब सामग्री में टेक्स्ट-टू-स्पीच कार्यक्षमता जोड़ते हैं। ऐसे अनुप्रयोगों के लिए प्राथमिक दर्शक वे हैं जिन्हें सीखने की अक्षमता या भाषा की बाधाओं के कारण पढ़ने में कठिनाई होती है। हालांकि समतुल्य डेस्कटॉप अनुप्रयोगों की तुलना में कार्यक्षमता सीमित रहती है, प्रमुख लाभ सार्वजनिक मशीनों पर देखे जाने पर उक्त वेबसाइटों की पहुंच में वृद्धि करना है जहां उपयोगकर्ताओं को कस्टम सॉफ़्टवेयर स्थापित करने की अनुमति नहीं है, जिससे लोगों को घूमने की अधिक स्वतंत्रता मिलती है।

यह कार्यक्षमता सॉफ्टवेयर की गुणवत्ता पर निर्भर करती है, लेकिन पाठ की तार्किक संरचना पर भी। एक अच्छे उच्चारण के लिए शीर्षकों, विराम चिह्नों, छवियों के लिए वैकल्पिक विशेषताओं की उपस्थिति आदि का उपयोग महत्वपूर्ण है। सीएसएस के साथ उपयुक्त दो आयामी स्थिति के उपयोग के कारण भी एक वेब साइट का एक अच्छा रूप हो सकता है, लेकिन इसका मानक रैखिककरण, उदाहरण के लिए, ब्राउज़र में किसी भी सीएसएस और जावास्क्रिप्ट को दबाने से समझ में नहीं आ सकता है।

अनुकूलन
अधिकांश स्क्रीन रीडर उपयोगकर्ता को यह चुनने की अनुमति देते हैं कि क्या अधिकांश विराम चिह्नों की घोषणा की जाती है या चुपचाप अनदेखा कर दिया जाता है। कुछ स्क्रीन रीडर्स को स्क्रिप्ट (कंप्यूटिंग) के माध्यम से किसी विशेष एप्लिकेशन के अनुरूप बनाया जा सकता है। स्क्रिप्टिंग का एक फायदा यह है कि यह अनुकूलन को उपयोगकर्ताओं के बीच साझा करने की अनुमति देता है, जिससे सभी के लिए पहुंच में वृद्धि होती है। उदाहरण के लिए Job Access with Speech एक सक्रिय स्क्रिप्ट-साझाकरण समुदाय का आनंद लेता है।

शब्दाडंबर
वर्बोसिटी स्क्रीन रीडिंग सॉफ़्टवेयर की एक विशेषता है जो दृष्टिबाधित कंप्यूटर उपयोगकर्ताओं का समर्थन करती है। स्पीच शब्दाडंबर नियंत्रण उपयोगकर्ताओं को यह चुनने में सक्षम बनाता है कि वे कितना स्पीच फीडबैक सुनना चाहते हैं। विशेष रूप से, वाचालता सेटिंग्स उपयोगकर्ताओं को उनके कंप्यूटर स्क्रीन पर प्रदर्शित वेब पेजों का एक मानसिक मॉडल बनाने की अनुमति देती हैं। वर्बोसिटी सेटिंग्स के आधार पर, एक स्क्रीन-रीडिंग प्रोग्राम उपयोगकर्ताओं को कुछ स्वरूपण परिवर्तनों के बारे में सूचित करता है, जैसे कि जब कोई फ्रेम या तालिका शुरू होती है और समाप्त होती है, जहां पाठ में ग्राफिक्स डाले गए हैं, या जब दस्तावेज़ में एक सूची दिखाई देती है। वर्बोसिटी सेटिंग्स तत्वों की वर्णनात्मकता के स्तर को भी नियंत्रित कर सकती हैं, जैसे कि सूचियाँ, तालिकाएँ और क्षेत्र। उदाहरण के लिए, JAWS (स्क्रीन रीडर) निम्न, मध्यम और उच्च वेब वर्बोसिटी प्रीसेट स्तर प्रदान करता है। उच्च वेब वाचालता स्तर वेबपृष्ठ की सामग्री के बारे में अधिक विवरण प्रदान करता है।

भाषा
कुछ स्क्रीन रीडर टेक्स्ट को एक से अधिक भाषाओं में पढ़ सकते हैं, बशर्ते कि सामग्री की भाषा इसके मेटाडेटा एन्कोडिंग और ट्रांसमिशन मानक में एन्कोडेड हो। कुछ स्क्रीन रीडिंग प्रोग्राम भाषा शब्दाडंबर भी शामिल है, जो स्वचालित रूप से भाषण आउटपुट भाषा से संबंधित शब्दाडंबर सेटिंग्स का पता लगाता है। उदाहरण के लिए, यदि कोई उपयोगकर्ता यूनाइटेड किंगडम में स्थित किसी वेबसाइट पर नेविगेट करता है, तो पाठ ब्रिटिश अंग्रेजी के साथ पढ़ा जाएगा।

यह भी देखें

 * स्क्रीन रीडर्स की सूची
 * स्क्रीन आवर्धक
 * भाषण प्रसंस्करण
 * वाक् पहचान
 * भाषा संकलन
 * विनक्स
 * पार्श्व स्वर

बाहरी संबंध

 * Fangs screen reader emulator – an open-source Mozilla Firefox extension that simulates how a web page would look in JAWS