गुणसूत्र (आनुवंशिक एल्गोरिथ्म)

आनुवंशिक एल्गोरिदम (जीए), या अधिक सामान्य, विकासवादी एल्गोरिदम (ईए) में, गुणसूत्र (जिसे कभी-कभी जीनोटाइप भी कहा जाता है) मापदंडों का सेट है जो उस समस्या के प्रस्तावित समाधान को परिभाषित करता है जिसे विकासवादी एल्गोरिदम हल करने का प्रयास कर रहा है। सभी समाधानों के सेट को, जिसे जैविक मॉडल के अनुसार व्यक्ति भी कहा जाता है, जनसंख्या मॉडल (विकासवादी एल्गोरिदम) के रूप में जाना जाता है। किसी व्यक्ति का जीनोम से बना होता है, शायद ही कभी कई से,  गुणसूत्र और हल किए जाने वाले कार्य के आनुवंशिक प्रतिनिधित्व से मेल खाते हैं। गुणसूत्र जीनों के समूह से बना होता है, जहां जीन में या अधिक शब्दार्थ से जुड़े पैरामीटर होते हैं, जिन्हें अक्सर निर्णय चर भी कहा जाता है। वे व्यक्ति की या अधिक फेनोटाइप विशेषताओं को निर्धारित करते हैं या कम से कम उन पर प्रभाव डालते हैं। आनुवंशिक एल्गोरिदम के मूल रूप में, गुणसूत्र को बाइनरी स्ट्रिंग (कंप्यूटर विज्ञान) के रूप में दर्शाया जाता है, जबकि बाद के वेरिएंट में और सामान्य तौर पर ईएएस में, अन्य डेटा संरचनाओं की विस्तृत विविधता का उपयोग किया जाता है।

गुणसूत्र डिज़ाइन
किसी कार्य का आनुवंशिक प्रतिनिधित्व बनाते समय, यह निर्धारित किया जाता है कि कौन से निर्णय चर और कार्य की स्वतंत्रता की अन्य डिग्री ईए और संभावित अतिरिक्त अनुमानों द्वारा सुधार की जानी चाहिए और आनुवंशिक प्रतिनिधित्व#खोज स्थान और समस्या स्थान के बीच अंतर|जीनोटाइप-फेनोटाइप मैपिंग कैसी दिखनी चाहिए। गुणसूत्र का डिज़ाइन इन विचारों को ठोस डेटा संरचनाओं में परिवर्तित करता है जिसके लिए ईए को चुनना, कॉन्फ़िगर करना, विस्तारित करना या, सबसे खराब स्थिति में, बनाना पड़ता है। गुणसूत्र के लिए समस्या डोमेन का उपयुक्त आनुवंशिक प्रतिनिधित्व ढूंढना महत्वपूर्ण विचार है, क्योंकि अच्छा प्रतिनिधित्व आनुवंशिक प्रतिनिधित्व को सीमित करके खोज को आसान बना देगा#खोज स्थान और समस्या स्थान के बीच अंतर; इसी तरह, ख़राब प्रतिनिधित्व बड़े खोज स्थान की अनुमति देगा। इस संदर्भ में, उपयुक्त उत्परिवर्तन (जेनेटिक एल्गोरिदम) और क्रॉसओवर (जेनेटिक एल्गोरिदम) आनुवंशिक संचालक चुने हुए क्रोमोसोम डिज़ाइन को फिट करने के लिए भी पाया जाना चाहिए या नई परिभाषा दी जानी चाहिए। इन ऑपरेटरों के लिए महत्वपूर्ण आवश्यकता यह है कि वे न केवल सैद्धांतिक रूप से खोज स्थान के सभी बिंदुओं तक पहुंचने की अनुमति दें, बल्कि इसे यथासंभव आसान भी बनाएं। निम्नलिखित आवश्यकताओं को उपयुक्त गुणसूत्र द्वारा पूरा किया जाना चाहिए:


 * इसे खोज स्थान में सभी स्वीकार्य बिंदुओं तक पहुंच की अनुमति देनी चाहिए।
 * गुणसूत्र का डिज़ाइन इस तरह से कि यह केवल खोज स्थान को कवर करे और कोई अतिरिक्त क्षेत्र न हो। ताकि कोई आनुवंशिक प्रतिनिधित्व#अतिरेक न हो या यथासंभव कम अतिरेक हो।


 * कारण स्थितियों का अवलोकन: गुणसूत्र में छोटे परिवर्तन से केवल फेनोटाइप में छोटे परिवर्तन होने चाहिए। इसे खोज और समस्या स्थान के बीच संबंध का आनुवंशिक प्रतिनिधित्व#स्थानीयता भी कहा जाता है।
 * गुणसूत्र को इस तरह से डिज़ाइन करना कि यह खोज स्थान में निषिद्ध क्षेत्रों को पूरी तरह या यथासंभव बाहर कर दे।

जबकि पहली आवश्यकता अपरिहार्य है, आवेदन और उपयोग किए गए ईए के आधार पर, किसी को आमतौर पर जहां तक ​​संभव हो केवल शेष आवश्यकताओं को पूरा करने से संतुष्ट होना पड़ता है। हालाँकि, यह ध्यान दिया जाना चाहिए कि विकासवादी खोज समर्थित है और संभवतः यथासंभव पूर्ण पूर्ति द्वारा काफी तेज हो गई है।

बाइनरी कोडिंग के लिए गुणसूत्र
अपने शास्त्रीय रूप में, जीए बिट स्ट्रिंग्स का उपयोग करते हैं और उन पर अनुकूलित किए जाने वाले निर्णय चर को मैप करते हैं। मूल्य सीमाओं के साथ बूलियन और तीन पूर्णांक निर्णय चर के लिए उदाहरण $$0 \leq D_1 \leq 60$$, $$28 \leq D_2 \leq 30$$ और $$-12 \leq D_3 \leq 14$$ इसका उदाहरण दे सकते हैं:

ध्यान दें कि यहां ऋणात्मक संख्या दो के पूरक में दी गई है। यह सीधा आगे का प्रतिनिधित्व तीन मानों का प्रतिनिधित्व करने के लिए पांच बिट्स का उपयोग करता है $$D_2$$, हालाँकि दो बिट पर्याप्त होंगे। यह महत्वपूर्ण अतिरेक है. बेहतर विकल्प, जहां जीनोटाइप-फेनोटाइप मैपिंग के लिए 28 जोड़ा जाना है, इस तरह दिख सकता है:

वास्तविक-मूल्यवान या पूर्णांक जीन वाले गुणसूत्र
वास्तविक-मूल्यवान या मिश्रित-पूर्णांक निर्णय चर वाले कार्यों के प्रसंस्करण के लिए, विकास रणनीति जैसे ईएएस या वास्तविक-कोडित GAs  अनुकूल हैं. मिश्रित-पूर्णांक मानों के मामले में, राउंडिंग का उपयोग अक्सर किया जाता है, लेकिन यह खोज स्थान और समस्या स्थान के बीच आनुवंशिक प्रतिनिधित्व#संबंधों के कुछ उल्लंघन का प्रतिनिधित्व करता है। यदि वास्तविक मूल्यों की आवश्यक सटीकता को यथोचित रूप से कम किया जा सकता है, तो पूर्णांक-कोडित जीए का उपयोग करके इस उल्लंघन को ठीक किया जा सकता है। इस प्रयोजन के लिए, वास्तविक मानों के वैध अंकों को उपयुक्त कारक के साथ गुणा करके पूर्णांकों में मैप किया जाता है। उदाहरण के लिए, 12.380 को 1000 से गुणा करने पर पूर्णांक 12380 बन जाता है। मूल्यांकन और परिणाम प्रस्तुति के लिए जीनोटाइप-फेनोटाइप मैपिंग में इसे निश्चित रूप से ध्यान में रखा जाना चाहिए। सामान्य रूप गुणसूत्र होता है जिसमें पूर्णांक या वास्तविक मानों की सूची या सरणी होती है।

क्रमपरिवर्तन के लिए गुणसूत्र
संयुक्त अनुकूलन मुख्य रूप से प्राथमिक वस्तुओं के सेट का इष्टतम अनुक्रम खोजने से संबंधित है। उदाहरण के तौर पर, ट्रैवलिंग सेल्समैन की समस्या पर विचार करें जो कम से कम संभव दौरे पर बार निश्चित संख्या में शहरों का दौरा करना चाहता है। गुणसूत्र पर सबसे सरल और सबसे स्पष्ट मानचित्रण शहरों को क्रमिक रूप से क्रमांकित करना है, परिणामी अनुक्रम को क्रमपरिवर्तन के रूप में व्याख्या करना और इसे सीधे गुणसूत्र में संग्रहीत करना है, जहां जीन शहर की क्रमिक संख्या से मेल खाता है। फिर, हालांकि, जेनेटिक ऑपरेटर केवल जीन क्रम को बदल सकता है और किसी भी जीन को हटा या डुप्लिकेट नहीं कर सकता है। इस प्रकार गुणसूत्र में शहरों के संभावित दौरे का मार्ग शामिल होता है। उदाहरण के तौर पर क्रम $$3,5,7,1,4,2,9,6,8$$ नौ शहर सेवा दे सकते हैं, जिनसे निम्नलिखित गुणसूत्र मेल खाते हैं:

सह-विकास के लिए गुणसूत्र
जब आनुवंशिक प्रतिनिधित्व में निर्णय चर के अलावा, अतिरिक्त जानकारी शामिल होती है जो विकास और/या जीनोटाइप को फेनोटाइप में मैप करने को प्रभावित करती है और स्वयं विकास के अधीन होती है, तो इसे सह-विकास कहा जाता है। विशिष्ट उदाहरण विकास रणनीति (ईएस) है, जिसमें प्रत्येक गुणसूत्र में रणनीति पैरामीटर के रूप में या अधिक उत्परिवर्तन चरण आकार शामिल होते हैं। एक अन्य उदाहरण शेड्यूलिंग कार्यों में संसाधन आवंटन के लिए चयन अनुमान को नियंत्रित करने के लिए अतिरिक्त जीन है। यह दृष्टिकोण इस धारणा पर आधारित है कि अच्छे समाधान रणनीति मापदंडों के उचित चयन या नियंत्रण जीन पर आधारित होते हैं जो जीनोटाइप-फेनोटाइप मैपिंग को प्रभावित करते हैं। ईएस की सफलता इस धारणा का प्रमाण देती है।

जटिल निरूपण के लिए गुणसूत्र
ऊपर प्रस्तुत गुणसूत्र निरंतर, मिश्रित-पूर्णांक, शुद्ध-पूर्णांक या संयोजन अनुकूलन के प्रसंस्करण कार्यों के लिए उपयुक्त हैं। दूसरी ओर, इन अनुकूलन क्षेत्रों के संयोजन के लिए, कार्य के आधार पर, उन्हें मूल्यों की सरल श्रृंखला में मैप करना कठिन होता जा रहा है। इस उद्देश्य के लिए जीन अवधारणा का निम्नलिखित विस्तार EA GLEAM (जनरल लर्निंग इवोल्यूशनरी एल्गोरिदम एंड मेथड) द्वारा प्रस्तावित है: जीन को फेनोटाइप के तत्व या प्राथमिक लक्षण का विवरण माना जाता है, जिसमें कई पैरामीटर हो सकते हैं। इस प्रयोजन के लिए, जीन प्रकारों को परिभाषित किया जाता है जिसमें उपयुक्त डेटा प्रकार के उतने ही पैरामीटर होते हैं जितने फेनोटाइप के विशेष तत्व का वर्णन करने के लिए आवश्यक होते हैं। गुणसूत्र में अब जीन प्रकार के डेटा ऑब्जेक्ट के रूप में जीन शामिल होते हैं, जिससे, अनुप्रयोग के आधार पर, प्रत्येक जीन प्रकार जीन के रूप में बिल्कुल बार होता है या किसी भी संख्या में गुणसूत्र में समाहित हो सकता है। उत्तरार्द्ध गतिशील लंबाई के गुणसूत्रों की ओर ले जाता है, क्योंकि कुछ समस्याओं के लिए उनकी आवश्यकता होती है। जीन प्रकार की परिभाषाओं में जीन मापदंडों की अनुमेय मूल्य सीमाओं की जानकारी भी होती है, जो गुणसूत्र पीढ़ी के दौरान और संबंधित उत्परिवर्तन द्वारा देखी जाती हैं, इसलिए वे घातक उत्परिवर्तन का कारण नहीं बन सकते हैं। कॉम्बिनेटरियल भाग वाले कार्यों के लिए, उपयुक्त जेनेटिक ऑपरेटर होते हैं जो जीन को समग्र रूप से स्थानांतरित या पुनर्स्थापित कर सकते हैं, यानी उनके मापदंडों के साथ। एक शेड्यूलिंग (कंप्यूटिंग) कार्य को चित्रण के रूप में उपयोग किया जाता है, जिसमें कार्यप्रवाह को शेड्यूल किया जाना है जिसके लिए विभिन्न संख्या में विषम संसाधनों की आवश्यकता होती है। वर्कफ़्लो निर्दिष्ट करता है कि कौन से कार्य चरणों को समानांतर में संसाधित किया जा सकता है और जिन्हें के बाद निष्पादित करना होगा। इस संदर्भ में, विविध संसाधनों का मतलब अलग-अलग प्रसंस्करण क्षमताओं के अलावा अलग-अलग लागत पर अलग-अलग प्रसंस्करण समय है। इसलिए प्रत्येक शेड्यूलिंग ऑपरेशन के लिए या अधिक पैरामीटर की आवश्यकता होती है जो संसाधन चयन निर्धारित करते हैं, जहां पैरामीटर की मान सीमा प्रत्येक कार्य चरण के लिए उपलब्ध वैकल्पिक संसाधनों की संख्या पर निर्भर करती है। उपयुक्त गुणसूत्र प्रत्येक कार्य चरण में जीन प्रकार प्रदान करता है और इस मामले में संगत जीन प्रदान करता है, जिसमें प्रत्येक आवश्यक संसाधन के लिए पैरामीटर होता है। जीन का क्रम शेड्यूलिंग संचालन का क्रम निर्धारित करता है और इसलिए, आवंटन संघर्ष के मामले में प्राथमिकता निर्धारित करता है। दो संसाधनों के साथ कार्य चरण 15 की अनुकरणीय जीन प्रकार की परिभाषा, जिसके लिए क्रमशः चार और सात विकल्प हैं, बाईं छवि में दिखाए अनुसार दिखेंगी। चूंकि पैरामीटर संबंधित कार्य चरण के लिए उपलब्ध संसाधनों की सूचियों में सूचकांकों का प्रतिनिधित्व करते हैं, उनकी मान सीमा 0 से शुरू होती है। सही छवि सूची प्रतिनिधित्व में जीन प्रकारों से संबंधित गुणसूत्र के तीन जीनों का उदाहरण दिखाती है।



वृक्ष प्रतिनिधित्व के लिए गुणसूत्र
गुणसूत्र में वृक्ष प्रतिनिधित्व का उपयोग आनुवंशिक प्रोग्रामिंग द्वारा किया जाता है, जो कंप्यूटर प्रोग्राम या विद्युत सर्किट उत्पन्न करने के लिए ईए प्रकार है। कंप्यूटर प्रोग्राम का अनुवाद करते समय पेड़ एक संकलक द्वारा आंतरिक प्रतिनिधित्व के रूप में उत्पन्न पार्स वृक्ष के अनुरूप होते हैं। निकटवर्ती चित्र उदाहरण के रूप में गणितीय अभिव्यक्ति के वाक्यविन्यास वृक्ष को दर्शाता है। उत्परिवर्तन ऑपरेटर प्रस्तुत वाक्यविन्यास संरचना के आधार पर उपवृक्षों को पुनर्व्यवस्थित, परिवर्तित या हटा सकते हैं। उपयुक्त उपवृक्षों का आदान-प्रदान करके पुनर्संयोजन किया जाता है।

ग्रन्थसूची

 * Thomas Bäck (1996): Evolutionary Algorithms in Theory and Practice: Evolution Strategies, Evolutionary Programming, Genetic Algorithms, Oxford Univ. Press. ISBN 978-0-19-509971-3
 * Wolfgang Banzhaf, P. Nordin, R. Keller, F. Francone (1998): Genetic Programming - An Introduction, Morgan Kaufmann, San Francisco. ISBN 1-55860-510-X
 * Kenneth A. de Jong (2006): Evolutionary Computation: A Unified Approach. MIT Press, Cambridge, MA. ISBN 0-262-04194-4
 * Melanie Mitchell (1996): An Introduction to Genetic Algorithms. MIT Press, Cambridge MA. ISBN 978-0-262-63185-3
 * Hans-Paul Schwefel (1995): Evolution and Optimum Seeking. Wiley & Sons, New York. ISBN 0-471-57148-2