अक्षर-विभाजन

शब्दांशीकरण या शब्दांश, जिसे हाइफ़नेशन के रूप में भी जाना जाता है, किसी मौखिक, लिखित या हस्ताक्षरित शब्द को शब्दांशो में विभाजित करने की प्रक्रिया है

संक्षिप्त विवरण
अंग्रेजी वर्तनी का उपयोग करते समय अक्षरों में लिखित पृथक्करण को सामान्यतः एक योजक चिन्ह द्वारा चिह्नित किया जाता है (उदाहरण के लिए, syl-la-ble) तथा अंतर्राष्ट्रीय ध्वन्यात्मक वर्णमाला में वास्तव में बोले गए अक्षरों को लिखते समय पूर्णविराम चिह्न के साथ चिह्नित किया जाता है (उदाहरण के लिए, )। प्रस्तुतिकरण उद्देश्यों के लिए, टाइपोग्राफर इंटरपंकट (यूनिकोड वर्ण U+00B7, उदाहरण के लिए, syl·la·ble), विशेष प्रयोजन हाइफ़नेशन बिंदु (U+2027, उदाहरण के लिए, syl‧la‧ble), या अंतराल का उपयोग कर सकते हैं (उदाहरण के लिए, syl la ble)।

किसी पंक्ति के अंत में, यदि कोई शब्द पंक्ति में समायोजित नहीं होता है और अगली पंक्ति में इसे ले जाने से पहली पंक्ति अन्य पंक्तियों की तुलना में बहुत कम हो जाती है, तो लेखन में इसे दो भागों में विभाजित कर दिया जाता है, जिन्हें परंपरागत रूप से "शब्दांश" कहा जाता है। यह विशेष रूप से बड़े शब्दों और समाचार पत्रों में संक्षिप्त स्तंभों के साथ एक विशेष समस्या हो सकती है। वर्ड प्रोसेसिंग ने संरेखण की प्रक्रिया को स्वचालित कर दिया है, जिससे छोटे शब्दों का शब्दांशीकरण प्रायः अनावश्यक हो जाता हैं।

कुछ भाषाओं में, बोले गए शब्दांश भी लेखन में शब्दांशीकरण का आधार होते हैं। यद्यपि, संभवतः आधुनिक अंग्रेजी की वर्तनी में ध्वनियों और अक्षरों के बीच कमजोर सामंजस्य के कारण, अंग्रेजी में लिखित शब्दांशीकरण ध्वन्यात्मक सिद्धांतों के अतिरिक्त अधिकतर व्युत्पत्ति विज्ञान या आकृति विज्ञान पर आधारित है। उदाहरण के रूप में, भाषा के सही शब्दांशीकरण के अनुसार "learning" को "lear-ning" के रूप में शब्दांसिकृत नहीं किया जा सकता है। किसी पंक्ति के अंत में केवल "lear-" देखने से पाठक शब्द का उच्चारण करने में भ्रमित हो सकता है, क्योंकि "ea" शब्दावली अंग्रेजी वर्तनी में कई ध्वनि धारण कर सकती है। अंग्रेजी शब्दावली का इतिहास ऐसी कई घटनाओं का विवरण देता है।

अंग्रेजी लिखित शब्दांशीकरण, इसलिए शब्दांश की एक ऐसी अवधारणा से संबंधित है जो ध्वन्यात्मक इकाई के भाषाई अवधारणा के अनुरूप नहीं है।

परिणामस्वरूप, अधिकांश जन्मजात अंग्रेजी बोलने वाले भी शब्दकोश की सलाह के बिना या वर्ड प्रोसेसर का उपयोग किए बिना स्थापित नियमों के अनुसार शब्दों का शब्दांश बनाने में असमर्थ हैं। स्कूल सामान्यतः शब्दकोश से परामर्श लेने के अतिरिक्त इस विषय पर अधिक सलाह नहीं देते हैं। इसके अतिरिक्त, ब्रिटिश और अमेरिकी शब्दांशों और यहां तक ​​कि एक ही अंग्रेजी प्रकार के शब्दकोशों के बीच भी अंतर हैं।

फ़िनिश भाषा, इतालवी भाषा, पुर्तगाली भाषा, जापानी भाषा ( गंभीरता से ) और ध्वन्यात्मक वर्तनी वाली अन्य भाषाओं में, लेखक सैद्धांतिक रूप से केवल सामान्य नियमों का उपयोग करके किसी भी उपलब्ध या नव निर्मित शब्द को सही ढंग से शब्दांसिकृत कर सकते हैं। फ़िनलैंड में, बच्चों को पहले हर शब्द को तबतक हाइफ़न करना सिखाया जाता है जब तक कि वे विश्वसनीय रूप से सही शब्दांश का निर्माण नहीं कर लेते, जिसके बाद हाइफ़न के उपयोग को छोड़ा जा सकता है।

विधिकलन
शब्दांशीकरण विधिकलन नियमों का एक समुच्चय है, विशेष रूप से एक कंप्यूटर प्रोग्राम में कार्यान्वयन के लिए संहिताबद्ध, जो यह तय करता है कि किन बिंदुओं पर किसी शब्द को हाइफ़न के साथ दो पंक्तियों में तोड़ा जा सकता है। उदाहरण के लिए, एक शब्दांशीकरण विधिकलन यह तय कर सकता है कि impeachment को impeach-ment या im-peachment के रूप में तो तोड़ा जा सकता है, परंतु impe-achment के रूप में नहीं।

शब्द-विभाजन के नियमों की जटिलता का एक कारण यह है कि अंग्रेजी की विभिन्न बोलियाँ शब्दांशीकरण में भिन्न होती हैं: अमेरिकी अंग्रेजी, ध्वनि पर कार्य करती है, परंतु ब्रिटिश अंग्रेजी, शब्द की उत्पत्ति और फिर ध्वनि पर ध्यान देती है। बड़ी संख्या में अपवाद भी हैं, जो इन विषयों को और अधिक जटिल बनाते हैं।

मेजर कीरी के "ऑन हायफेनेशन - एनार्की ऑफ़ पेडेंट्री" में कुछ विशिष्ट नियम प्राप्त किए जा सकते हैं।" हायफेनेशन के विधिकलन दृष्टिकोण से, टेक टाइपसेटिंग सिस्टम (TeX) में लागू एक विधि व्यापक रूप से प्रयोग की जाती है। इसे डोनाल्ड नुथ द्वारा कंप्यूटर और टाइपसेटिंग के पहले दो खंडों और फ्रैंकलिन मार्क लियांग के शोध प्रबंध में पूरी तरह से प्रलेखित किया गया है। लिआंग के कार्य का उद्देश्य विधिकलन को यथासंभव सटीक बनाना और किसी भी अपवाद शब्दकोश को छोटा रखना था।

TeX के मूल हायफेनेशन प्रारूप में अमेरिकी अंग्रेजी के लिए अपवाद सूची में केवल 14 शब्द हैं।

टेक्स
टेक्स हायफेनेशन विधिकलन के पोर्ट प्रोग्रामिंग भाषाओं के लिए लाइब्रेरी के रूप में उपलब्ध हैं, जिनमें हास्केल, जावास्क्रिप्ट, पर्ल, पोस्टस्क्रिप्ट, पायथन, रूबी, सी शार्प, और टेक्स को लॉग में योजक चिन्ह दिखाने के लिए  कमांड का उपयोग किया जा सकता है।

LaTeX में, हाइफ़नेशन सुधार को उपयोगकर्ताओं द्वारा निम्नलिखित कूट का उपयोग करके जोड़ा जा सकता है:

कमांड शब्दों को शब्दांशीकरण की अनुमति देने के लिए उपयोग होता है, जहां शब्दों की सूची होती है जो अंतराल से अलग होती हैं, और प्रत्येक शब्दांशीकरण बिन्दु को  वर्ण के द्वारा दर्शाया जाता है। उदाहरण के लिए,

\hyphenation{फोर्ट्रैन इर्गोनॉमिक} इससे स्पष्ट होता है कि वर्तमान कार्य में "फोर्ट्रैन" को शब्दांसिकृत नहीं किया जाना चाहिए और यदि "इर्गोनॉमिक" को हायफेनेट किया जाना आवश्यक है, तो यह वहां दिखाए गए बिन्दुओ में से किसी एक पर होगा।

यद्यपि, इसमे कई सीमाएं होती हैं। उदाहरण के लिए, व्यतिक्रम रूप से स्टॉक  कमांड केवल ASCII अक्षरों को स्वीकार करता है और इसलिए इसका उपयोग गैर-एस्कीआई अक्षरों (जैसे ä, é, ç) वाले शब्दों के शब्दांशीकरण को सही करने के लिए नहीं किया जा सकता है, जो अंग्रेजी को छोड़कर लगभग सभी भाषाओं में अत्यधिक सामान्य हैं। यद्यपि, इसके लिए सरल उपाय उपलब्ध हैं।

यह भी देखें

 * ध्वन्यात्मकता
 * टौटोसिलेबिक|टॉटोसिलेबिक, हेटरोसिलेबिक और अस्पष्ट  फ़ोन
 * अंग्रेजी ध्वनिविज्ञान#शब्दांश संरचना

बाहरी संबंध

 * Online Lyric Hyphenator: Hyphenates English text into syllables
 * Online hyphenation tool: Hyphenation algorithms for several languages
 * Hyphenation tool for the French Language: Hyphenates French words with explanation