अक्षर-विभाजन

शब्दांशीकरण या शब्दांश, जिसे हाइफ़नेशन के रूप में भी जाना जाता है, एक शब्द को शब्दांशों में अलग करना है, चाहे वह बोला गया हो, लिखा गया हो या हस्ताक्षरित.

अवलोकन
अंग्रेजी शब्दावली (उदाहरण के लिए, सिले-ला-बल) का उपयोग करते समय अक्षरों में लिखित पृथक्करण को आमतौर पर एक हैफ़ेन द्वारा चिह्नित किया जाता है और अंतर्राष्ट्रीय ध्वन्यात्मक वर्णमाला में वास्तव में बोले गए अक्षरों को लिखते समय एक अवधि के साथ चिह्नित किया जाता है (उदाहरण के लिए, ). प्रस्तुतिकरण उद्देश्यों के लिए, टाइपोग्राफर एक इंटरपंकट (यूनिकोड वर्ण U+00B7, उदाहरण के लिए, शब्दांश), एक विशेष प्रयोजन हाइफ़नेशन बिंदु (U+2027, उदाहरण के लिए, शब्दांश), या एक स्थान (विराम चिह्न) का उपयोग कर सकते हैं ) (उदाहरण के लिए, syl la ble)।

एक पंक्ति के अंत में, एक शब्द को लिखित रूप में भागों में विभाजित किया जाता है, जिसे पारंपरिक रूप से शब्दांश कहा जाता है, यदि यह पंक्ति में फिट नहीं होता है और यदि इसे अगली पंक्ति में ले जाने से पहली पंक्ति अन्य की तुलना में बहुत छोटी हो जाएगी। बहुत लंबे शब्दों और समाचार पत्रों में संकीर्ण स्तंभों के साथ यह एक विशेष समस्या हो सकती है। शब्द संसाधन  ने औचित्य (टाइपसेटिंग) की प्रक्रिया को स्वचालित कर दिया है, जिससे छोटे शब्दों का शब्दांशीकरण अक्सर अनावश्यक हो जाता है।

कुछ भाषाओं में, बोले गए शब्दांश भी लेखन में शब्दांशीकरण का आधार होते हैं। हालाँकि, संभवतः आधुनिक अंग्रेजी की वर्तनी में ध्वनियों और अक्षरों के बीच कमजोर पत्राचार के कारण, अंग्रेजी में लिखित शब्दांशीकरण ध्वन्यात्मक सिद्धांतों के बजाय ज्यादातर व्युत्पत्ति विज्ञान या आकृति विज्ञान (भाषा विज्ञान) पर आधारित है। उदाहरण के लिए, सीखने को जीवित भाषा के सही शब्दांश के अनुसार सीखना-सीखना संभव नहीं है। किसी पंक्ति के अंत में केवल लीयर- देखने से पाठक शब्द का गलत उच्चारण करने में भ्रमित हो सकता है, क्योंकि डिग्राफ (शब्दावली) ईए अंग्रेजी वर्तनी#ध्वनि-से-वर्तनी के अनुरूप हो सकता है। अंग्रेजी शब्दावली का इतिहास ऐसी घटनाओं का विवरण देता है।

अंग्रेजी लिखित शब्दांश इसलिए शब्दांश की एक अवधारणा से संबंधित है जो ध्वन्यात्मक (रूपात्मक के विपरीत) इकाई की भाषाई अवधारणा के अनुरूप नहीं है।

परिणामस्वरूप, अधिकांश देशी अंग्रेजी बोलने वाले भी शब्दकोश की सलाह के बिना या वर्ड प्रोसेसर का उपयोग किए बिना स्थापित नियमों के अनुसार शब्दों का शब्दांश बनाने में असमर्थ हैं। स्कूल आमतौर पर शब्दकोश से परामर्श लेने के अलावा इस विषय पर अधिक सलाह नहीं देते हैं। इसके अलावा, ब्रिटिश और अमेरिकी शब्दांशों और यहां तक ​​कि एक ही अंग्रेजी किस्म के शब्दकोशों के बीच भी अंतर हैं।

फ़िनिश भाषा, इतालवी भाषा, पुर्तगाली भाषा, जापानी भाषा ( गंभीरता से ) और अन्य लगभग ध्वन्यात्मक रूप से वर्तनी वाली भाषाओं में, लेखक सैद्धांतिक रूप से केवल सामान्य नियमों का उपयोग करके किसी भी मौजूदा या नव निर्मित शब्द को सही ढंग से बना सकते हैं। फ़िनलैंड में, बच्चों को पहले हर शब्द को हाइफ़न करना सिखाया जाता है जब तक कि वे विश्वसनीय रूप से सही शब्दांश का निर्माण नहीं कर लेते, जिसके बाद हाइफ़न को छोड़ा जा सकता है।

एल्गोरिदम
हाइफ़नेशन एल्गोरिदम नियमों का एक सेट है, विशेष रूप से एक कंप्यूटर प्रोग्राम में कार्यान्वयन के लिए संहिताबद्ध, जो यह तय करता है कि किन बिंदुओं पर एक शब्द को हाइफ़न के साथ दो पंक्तियों में तोड़ा जा सकता है। उदाहरण के लिए, एक हाइफ़नेशन एल्गोरिदम यह तय कर सकता है कि महाभियोग को महाभियोग-मेंट या इम-पीचमेंट के रूप में तोड़ा जा सकता है, लेकिन इम्पेचमेंट के रूप में नहीं।

शब्द-विभाजन के नियमों की जटिलता का एक कारण यह है कि अंग्रेजी की विभिन्न बोलियाँ हाइफ़नेशन पर भिन्न होती हैं: अमेरिकी अंग्रेजी ध्वनि पर काम करती है, लेकिन ब्रिटिश अंग्रेजी शब्द की उत्पत्ति और फिर ध्वनि पर ध्यान देती है। बड़ी संख्या में अपवाद भी हैं, जो मामलों को और अधिक जटिल बनाते हैं।

अंगूठे के कुछ नियम मेजर केरी के ऑन हाइफ़नेशन - एनार्की ऑफ़ पेडेंट्री में पाए जा सकते हैं। हाइफ़नेशन के लिए कलन विधि  दृष्टिकोण के बीच, TeX में कार्यान्वित दृष्टिकोण का व्यापक रूप से उपयोग किया जाता है। इसे डोनाल्ड नुथ द्वारा कंप्यूटर और टाइपसेटिंग के पहले दो खंडों और फ्रैंकलिन मार्क लियांग के शोध प्रबंध में पूरी तरह से प्रलेखित किया गया है। लिआंग के काम का उद्देश्य एल्गोरिदम को यथासंभव सटीक बनाना और किसी भी अपवाद शब्दकोश को छोटा रखना था।

अमेरिकी अंग्रेजी के लिए TeX के मूल हाइफ़नेशन पैटर्न में, अपवाद सूची में केवल 14 शब्द हैं।

TeX में
TeX हाइफ़नेशन एल्गोरिदम के पोर्ट कई प्रोग्रामिंग भाषाओं के लिए लाइब्रेरी के रूप में उपलब्ध हैं, जिनमें हास्केल (प्रोग्रामिंग भाषा), जावास्क्रिप्ट, पर्ल, परिशिष्ट भाग, पायथन (प्रोग्रामिंग भाषा), रूबी (प्रोग्रामिंग भाषा), सी शार्प (प्रोग्रामिंग भाषा)|सी#, और शामिल हैं। TeX को कमांड द्वारा लॉग में हाइफ़न दिखाने के लिए बनाया जा सकता है.

LaTeX में, हाइफ़नेशन सुधार को उपयोगकर्ताओं द्वारा इसका उपयोग करके जोड़ा जा सकता है:

\हाइफ़नेशन{शब्द}  ई> कमांड अनुमत हाइफ़नेशन बिंदुओं की घोषणा करता है जिसमें शब्द रिक्त स्थान द्वारा अलग किए गए शब्दों की एक सूची है, जिसमें प्रत्येक हाइफ़नेशन बिंदु को एक द्वारा दर्शाया जाता है   चरित्र। उदाहरण के लिए,

\हाइफ़नेशन{फोरट्रान एर-गो-नो-माइक}

घोषणा करता है कि वर्तमान कार्य में फोरट्रान को हाइफ़न नहीं किया जाना चाहिए और यदि एर्गोनोमिक को हाइफ़न किया जाना चाहिए, तो यह संकेतित बिंदुओं में से एक पर होगा। हालाँकि, कई सीमाएँ हैं। उदाहरण के लिए, स्टॉक  कमांड डिफ़ॉल्ट रूप से केवल ASCII अक्षरों को स्वीकार करता है और इसलिए इसका उपयोग गैर-ASCII वर्णों (जैसे ä, é, ç) वाले शब्दों के लिए हाइफ़नेशन को सही करने के लिए नहीं किया जा सकता है, जो अंग्रेजी को छोड़कर लगभग सभी भाषाओं में बहुत आम हैं। हालाँकि, सरल उपाय मौजूद हैं।

यह भी देखें

 * ध्वन्यात्मकता
 * टौटोसिलेबिक|टॉटोसिलेबिक, हेटरोसिलेबिक और अस्पष्ट  फ़ोन
 * अंग्रेजी ध्वनिविज्ञान#शब्दांश संरचना

बाहरी संबंध

 * Online Lyric Hyphenator: Hyphenates English text into syllables
 * Online hyphenation tool: Hyphenation algorithms for several languages
 * Hyphenation tool for the French Language: Hyphenates French words with explanation