गिलेस्पी एल्गोरिथम

संभाव्यता सिद्धांत में, गिलेस्पी एल्गोरिथम (या डोब-गिलेस्पी एल्गोरिथम या  स्टोचैस्टिक सिमुलेशन एल्गोरिथम , एसएसए) एक स्टोकेस्टिक समीकरण प्रणाली का एक सांख्यिकीय रूप से सही प्रक्षेपवक्र (संभावित समाधान) उत्पन्न करता है जिसके लिए प्रतिक्रिया दर ज्ञात होती है। यह जोसेफ एल. डोब और अन्य (लगभग 1945) द्वारा बनाया गया था, जो 1976 में और गिलेस्पी द्वारा प्रस्तुत किया गया था, और 1977 में एक पेपर में लोकप्रिय हुआ, जहां वह सीमित कम्प्यूटेशनल शक्ति का उपयोग करके कुशलतापूर्वक और सटीक रूप से प्रतिक्रियाओं के रासायनिक या जैव रासायनिक प्रणालियों का अनुकरण करने के लिए इसका उपयोग करता है। स्टोचैस्टिक सिमुलेशन)। जैसे-जैसे कंप्यूटर तेज होते गए हैं, एल्गोरिद्म का उपयोग तेजी से जटिल प्रणालियों का अनुकरण करने के लिए किया गया है। एल्गोरिथ्म विशेष रूप से कोशिकाओं के भीतर प्रतिक्रियाओं का अनुकरण करने के लिए उपयोगी है, जहां अभिकर्मकों की संख्या कम है और व्यक्तिगत अणुओं की स्थिति और व्यवहार पर नज़र रखना कम्प्यूटेशनल रूप से संभव है। गणितीय रूप से, यह गतिशील मोंटे कार्लो पद्धति का एक प्रकार है और गतिज मोंटे कार्लो विधियों के समान है। कम्प्यूटेशनल सिस्टम बायोलॉजी में इसका अत्यधिक उपयोग किया जाता है।

इतिहास
एल्गोरिथम की ओर ले जाने वाली प्रक्रिया कई महत्वपूर्ण चरणों को पहचानती है। 1931 में, एंड्री कोलमोगोरोव ने स्टोकेस्टिक प्रक्रियाओं के समय-विकास के अनुरूप विभेदक समीकरण पेश किए, जो छलांग लगाकर आगे बढ़ते हैं, जिसे आज कोलमोगोरोव समीकरण (मार्कोव जंप प्रक्रिया) के रूप में जाना जाता है (एक सरलीकृत संस्करण को प्राकृतिक विज्ञान में मास्टर समीकरण के रूप में जाना जाता है)। यह 1940 में विलियम फेलर थे, जिन्होंने उन स्थितियों का पता लगाया, जिनके तहत कोलमोगोरोव समीकरणों ने समाधान के रूप में (उचित) संभावनाओं को स्वीकार किया। अपने प्रमेय I (1940 कार्य) में उन्होंने स्थापित किया कि समय-से-अगली छलांग घातीय रूप से वितरित की गई थी और अगली घटना की संभावना दर के समानुपाती होती है। जैसे, उन्होंने कोलमोगोरोव के समीकरणों के संबंध को स्टोकेस्टिक प्रक्रियाओं के साथ स्थापित किया। बाद में, दूब (1942, 1945) ने फेलर के समाधान को शुद्ध-कूद प्रक्रियाओं के मामले से परे बढ़ाया। मैनचेस्टर मार्क 1 कंप्यूटर का उपयोग करके डेविड जॉर्ज केंडल (1950) द्वारा कंप्यूटर में विधि लागू की गई थी और बाद में मौरिस एस बार्टलेट (1953) द्वारा महामारी के प्रकोप के अपने अध्ययन में उपयोग किया गया था। गिलेस्पी (1977) एक भौतिक तर्क का उपयोग करके एल्गोरिथम को एक अलग तरीके से प्राप्त करता है।

एल्गोरिथम के पीछे का विचार
पारंपरिक निरंतर और नियतात्मक जैव रासायनिक दर समीकरण सेलुलर प्रतिक्रियाओं की सटीक भविष्यवाणी नहीं करते हैं क्योंकि वे थोक प्रतिक्रियाओं पर भरोसा करते हैं जिनके लिए लाखों अणुओं की बातचीत की आवश्यकता होती है। वे आम तौर पर युग्मित साधारण अंतर समीकरणों के एक सेट के रूप में तैयार किए जाते हैं। इसके विपरीत, गिलेस्पी एल्गोरिथ्म कुछ अभिकारकों के साथ एक प्रणाली के असतत और स्टोकेस्टिक सिमुलेशन की अनुमति देता है क्योंकि हर प्रतिक्रिया स्पष्ट रूप से सिम्युलेटेड होती है। एकल गिलेस्पी सिमुलेशन से संबंधित एक प्रक्षेपवक्र संभाव्यता द्रव्यमान समारोह से एक सटीक नमूना दर्शाता है जो कि मास्टर समीकरण का समाधान है।

एल्गोरिदम का भौतिक आधार प्रतिक्रिया पोत के भीतर अणुओं की टक्कर है। यह माना जाता है कि टकराव अक्सर होते हैं, लेकिन उचित अभिविन्यास और ऊर्जा के साथ टकराव बहुत कम होते हैं। इसलिए, गिलेस्पी ढांचे के भीतर सभी प्रतिक्रियाओं में अधिकतम दो अणु शामिल होने चाहिए। तीन अणुओं को शामिल करने वाली प्रतिक्रियाओं को अत्यंत दुर्लभ माना जाता है और उन्हें द्विआधारी प्रतिक्रियाओं के अनुक्रम के रूप में तैयार किया जाता है। यह भी माना जाता है कि प्रतिक्रिया वातावरण अच्छी तरह मिश्रित है।

एल्गोरिथम
एक हालिया समीक्षा (गिलेस्पी, 2007) में तीन अलग-अलग, लेकिन समकक्ष योगों की रूपरेखा दी गई है; प्रत्यक्ष, प्रथम-प्रतिक्रिया, और प्रथम-पारिवारिक विधियाँ, जिससे पूर्व दो बाद के विशेष मामले हैं। प्रत्यक्ष और प्रथम-प्रतिक्रिया विधियों का सूत्रीकरण स्टोचैस्टिक रासायनिक कैनेटीक्स के तथाकथित मौलिक आधार पर सामान्य मोंटे-कार्लो व्युत्क्रम चरणों के प्रदर्शन पर केंद्रित है, जो गणितीय रूप से कार्य है


 * $$p(\tau,j|\boldsymbol{x},t) = a_{j}(\boldsymbol{x})\exp(-\tau\sum_{j}a_{j}(\boldsymbol{x}))$$,

जहां प्रत्येक $$a$$ शब्द एक प्राथमिक प्रतिक्रिया के प्रवृत्ति कार्य हैं, जिसका तर्क है $$\boldsymbol{x}$$, प्रजातियों का वेक्टर मायने रखता है। $$\tau$$ h> पैरामीटर अगली प्रतिक्रिया (या ठहराव समय) का समय है, और $$t$$ वर्तमान समय है। गिलेस्पी की व्याख्या करने के लिए, इस अभिव्यक्ति को दी गई संभाव्यता के रूप में पढ़ा जाता है $$\boldsymbol{X}(t) = \boldsymbol{x}$$, कि सिस्टम की अगली प्रतिक्रिया अतिसूक्ष्म समय अंतराल में होगी $$[t+\tau, t+\tau+d\tau]$$, और स्टोइकोमेट्री के अनुरूप होगा $$j$$वें प्रतिक्रिया। यह सूत्रीकरण लागू करके प्रत्यक्ष और प्रथम-प्रतिक्रिया विधियों के लिए एक विंडो प्रदान करता है $$\tau$$ एक घातीय रूप से वितरित यादृच्छिक चर है, और $$j$$ बिंदु संभावनाओं के साथ सांख्यिकीय रूप से स्वतंत्र पूर्णांक यादृच्छिक चर है $$a_{j}(\boldsymbol{x}) / \sum_{j}a_{j}(\boldsymbol{x})$$.

इस प्रकार, मोंटे-कार्लो जनरेटिंग विधि केवल दो छद्म यादृच्छिक संख्याओं को आकर्षित करने के लिए है, $$r_{1}$$ और $$r_{2}$$ पर $$[0,1]$$, और गणना करें


 * $$\tau = \frac{1}{\sum_{j}a_{j}(\boldsymbol{x})}\log\left(\frac{1}{r_{1}}\right)$$,

और
 * $$j =$$ सबसे छोटा पूर्णांक संतोषजनक $$\sum_{j'=1}^{j}a_{j'}(\boldsymbol{x}) > r_{2}\sum_{j}a_{j}(\boldsymbol{x})$$.

प्रवास के समय और अगली प्रतिक्रिया के लिए इस जनरेटिंग विधि का उपयोग करते हुए, गिलेस्पी द्वारा डायरेक्ट मेथड एल्गोरिथम के रूप में कहा गया है

1. समय प्रारंभ करें $$t = t_{0}$$ और सिस्टम की स्थिति $$\boldsymbol{x} = \boldsymbol{x}_{0}$$ 2. राज्य में व्यवस्था के साथ $$\boldsymbol{x}$$ समय पर $$t$$, सभी का मूल्यांकन करें $$a_{j}(\boldsymbol{x})$$ और उनकी राशि $$\sum_{j}a_{j}(\boldsymbol{x})$$ 3. प्रतिस्थापित करके अगली प्रतिक्रिया को प्रभावित करें $$t \leftarrow t + \tau$$ और $$\boldsymbol{x} \leftarrow \boldsymbol{x} + \nu_{j}$$ 4. रिकॉर्ड $$(\boldsymbol{x}, t)$$ जैसी इच्छा थी। चरण 1 पर लौटें, अन्यथा अनुकरण समाप्त करें।

एल्गोरिदम का यह परिवार कम्प्यूटेशनल रूप से महंगा है और इस प्रकार कई संशोधन और अनुकूलन मौजूद हैं, जिसमें अगली प्रतिक्रिया विधि (गिब्सन और ब्रुक), अधिवर्ष, साथ ही हाइब्रिड तकनीकें शामिल हैं, जहां प्रचुर मात्रा में अभिकारकों को नियतात्मक व्यवहार के साथ तैयार किया जाता है। अनुकूलित तकनीक आम तौर पर एल्गोरिथ्म के पीछे के सिद्धांत की सटीकता से समझौता करती है क्योंकि यह मास्टर समीकरण से जुड़ती है, लेकिन बहुत बेहतर समय-सारिणी के लिए उचित अहसास प्रदान करती है। एल्गोरिदम के सटीक संस्करणों की कम्प्यूटेशनल लागत प्रतिक्रिया नेटवर्क के युग्मन वर्ग द्वारा निर्धारित की जाती है। कमजोर युग्मित नेटवर्क में, किसी अन्य प्रतिक्रिया से प्रभावित होने वाली प्रतिक्रियाओं की संख्या एक छोटे स्थिरांक से बंधी होती है। दृढ़ता से युग्मित नेटवर्क में, एक एकल प्रतिक्रिया फायरिंग सिद्धांत रूप में अन्य सभी प्रतिक्रियाओं को प्रभावित कर सकती है। कमजोर युग्मित नेटवर्क के लिए निरंतर-समय स्केलिंग के साथ एल्गोरिथ्म का एक सटीक संस्करण विकसित किया गया है, जो बहुत बड़ी संख्या में प्रतिक्रिया चैनलों के साथ सिस्टम के कुशल सिमुलेशन को सक्षम करता है (स्लीपॉय थॉम्पसन प्लैम्पटन 2008)। ब्रैटसन एट अल द्वारा सामान्यीकृत गिलेस्पी एल्गोरिद्म जो यादृच्छिक जैव रासायनिक घटनाओं के गैर-मार्कोवियन गुणों के लिए जिम्मेदार है, विकसित किया गया है। 2005 और स्वतंत्र रूप से बैरियो एट अल। 2006, साथ ही (कै 2007)। विवरण के लिए नीचे उद्धृत लेख देखें।

आंशिक-प्रवृत्ति सूत्रीकरण, जैसा कि रामास्वामी एट अल दोनों द्वारा स्वतंत्र रूप से विकसित किया गया है। (2009, 2010) और इंदुर्ख्य और बील (2010), एल्गोरिथम के सटीक संस्करणों के एक परिवार के निर्माण के लिए उपलब्ध हैं, जिनकी कम्प्यूटेशनल लागत प्रतिक्रियाओं की (बड़ी) संख्या के बजाय नेटवर्क में रासायनिक प्रजातियों की संख्या के अनुपात में है। ये योग कम्प्यूटेशनल लागत को कम कर सकते हैं कमजोर युग्मित नेटवर्क के लिए निरंतर-समय स्केलिंग और दृढ़ता से युग्मित नेटवर्क के लिए प्रजातियों की संख्या के साथ सबसे अधिक रैखिक रूप से स्केल करने के लिए। देरी के साथ प्रतिक्रियाओं के लिए सामान्यीकृत गिलेस्पी एल्गोरिथम का एक आंशिक-प्रवृत्ति संस्करण भी प्रस्तावित किया गया है (रामास्वामी सबलजारिनी 2011)। आंशिक-प्रवृत्ति विधियों का उपयोग प्राथमिक रासायनिक प्रतिक्रियाओं तक सीमित है, अर्थात, अधिकतम दो अलग-अलग अभिकारकों के साथ प्रतिक्रियाएँ। नेटवर्क आकार में एक रेखीय (प्रतिक्रिया के क्रम में) वृद्धि की कीमत पर, प्रत्येक गैर-प्राथमिक रासायनिक प्रतिक्रिया को समान रूप से प्राथमिक के एक सेट में विघटित किया जा सकता है।

एबी डिमर्स बनाने के लिए ए और बी की रिवर्सिबल बाइंडिंग
एक सरल उदाहरण यह समझाने में मदद कर सकता है कि गिलेस्पी एल्गोरिथम कैसे काम करता है। दो प्रकार के अणुओं की एक प्रणाली पर विचार करें, $A$ और $B$. इस प्रणाली में, $A$ और $B$ बनाने के लिए एक साथ उल्टा बांधें $AB$ मंदक ऐसे होते हैं कि दो प्रतिक्रियाएँ संभव हैं: या तो A और B एक बनाने के लिए उत्क्रमणीय रूप से प्रतिक्रिया करते हैं $AB$ डिमर, या ए $AB$ डिमर में वियोजित हो जाता है $A$ और $B$. किसी दिए गए एकल के साथ प्रतिक्रिया करने वाले किसी एकल ए अणु के लिए प्रतिक्रिया दर स्थिर $B$ अणु है $$k_\mathrm{D}$$, और एक के लिए प्रतिक्रिया दर $AB$ डिमर ब्रेकिंग है $$k_\mathrm{B}$$.

यदि समय t पर प्रत्येक प्रकार का एक अणु होता है तो मंदक बनने की दर होती है $$k_\mathrm{D}$$, जबकि अगर हैं $$n_\mathrm{A}$$ प्रकार के अणु $A$ और $$n_\mathrm{B}$$ प्रकार के अणु $B$, मंदक गठन की दर है $$k_\mathrm{D}n_\mathrm{A}n_\mathrm{B}$$. अगर वहाँ $$n_\mathrm{AB}$$ डिमर्स तो डिमर हदबंदी की दर है $$k_\mathrm{B}n_\mathrm{AB}$$.

कुल प्रतिक्रिया दर, $$R_\mathrm{TOT}$$, समय पर t तब द्वारा दिया जाता है

$$R_\mathrm{TOT}=k_\mathrm{D}n_\mathrm{A}n_\mathrm{B}+k_\mathrm{B}n_\mathrm{AB}$$ तो, अब हमने दो प्रतिक्रियाओं के साथ एक साधारण मॉडल का वर्णन किया है। यह परिभाषा गिलेस्पी एल्गोरिथम से स्वतंत्र है। अब हम वर्णन करेंगे कि गिलेस्पी एल्गोरिथम को इस प्रणाली में कैसे लागू किया जाए।

एल्गोरिथम में, हम समय में दो चरणों में आगे बढ़ते हैं: अगली प्रतिक्रिया के लिए समय की गणना करना, और यह निर्धारित करना कि अगली प्रतिक्रिया कौन सी संभावित प्रतिक्रिया है। प्रतिक्रियाओं को पूरी तरह से यादृच्छिक माना जाता है, इसलिए यदि प्रतिक्रिया की दर एक समय टी है $$R_\mathrm{TOT}$$, तब समय, δt, जब तक अगली प्रतिक्रिया नहीं होती है, माध्य के साथ घातीय वितरण फ़ंक्शन से ली गई एक यादृच्छिक संख्या है $$1/R_\mathrm{TOT}$$. इस प्रकार, हम समय को t से t + δt तक आगे बढ़ाते हैं।

संभावना है कि यह प्रतिक्रिया एक है $A$ अणु एक के लिए बाध्यकारी $AB$ अणु इस प्रकार की प्रतिक्रिया के कारण कुल दर का अंश है, अर्थात,

संभावना है कि प्रतिक्रिया है संभावना है कि अगली प्रतिक्रिया एक है $A$ मंदक वियोजन केवल 1 घटा है। तो इन दो संभावनाओं के साथ हम या तो घटाकर एक मंदक बनाते हैं $$n_\mathrm{A}$$ और $$n_\mathrm{B}$$ एक से, और बढ़ाएँ $$n_\mathrm{AB}$$ एक के द्वारा, या हम एक डिमर को अलग कर देते हैं और वृद्धि करते हैं $$n_\mathrm{A}$$ और $$n_\mathrm{B}$$ एक से और घटाएं $$n_\mathrm{AB}$$ एक - एक करके।

अब हमारे पास t + δt के लिए उन्नत समय है, और एक ही प्रतिक्रिया का प्रदर्शन किया है। गिलेस्पी एल्गोरिथम इन दो चरणों को उतनी ही बार दोहराता है जितनी बार हम चाहते हैं (यानी, जितनी प्रतिक्रियाओं के लिए) सिस्टम को अनुकरण करने के लिए आवश्यक है। एक गिलेस्पी अनुकरण का परिणाम जिसके साथ शुरू होता है $$n_\mathrm{A}=n_\mathrm{B}=10$$ और $$n_\mathrm{AB}=0$$ टी = 0 पर, और कहाँ $$k_\mathrm{D}=2$$ और $$k_\mathrm{B}=1$$, दाईं ओर दिखाया गया है। इन पैरामीटर मानों के लिए औसतन 8 हैं $$n_\mathrm{AB}$$ डिमर्स और 2 $B$ और $B$ लेकिन अणुओं की छोटी संख्या के कारण इन मूल्यों के आसपास उतार-चढ़ाव बड़े होते हैं। गिलेस्पी एल्गोरिथ्म का उपयोग अक्सर उन प्रणालियों का अध्ययन करने के लिए किया जाता है जहां ये उतार-चढ़ाव महत्वपूर्ण होते हैं।

यह सिर्फ एक साधारण उदाहरण था, दो प्रतिक्रियाओं के साथ। अधिक प्रतिक्रियाओं वाली अधिक जटिल प्रणालियों को उसी तरह से नियंत्रित किया जाता है। सभी प्रतिक्रिया दरों की गणना प्रत्येक समय कदम पर की जानी चाहिए, और दर में इसके आंशिक योगदान के बराबर संभाव्यता के साथ चुना जाना चाहिए। समय तो इस उदाहरण के रूप में उन्नत है।

स्टोकेस्टिक सेल्फ-असेंबली
गार्ड मॉडल समुच्चय में लिपिड के स्व-विधानसभा का वर्णन करता है। स्टोचैस्टिक सिमुलेशन का उपयोग करके यह कई प्रकार के समुच्चय और उनके विकास के उद्भव को दर्शाता है।

अग्रिम पठन

 * (Slepoy Thompson Plimpton 2008):
 * (Bratsun et al. 2005):
 * (Barrio et al. 2006):
 * (Cai 2007):
 * (Barnes Chu 2010):
 * (Ramaswamy González-Segredo Sbalzarini 2009):
 * (Ramaswamy Sbalzarini 2010):
 * (Indurkhya Beal 2010):
 * (Ramaswamy Sbalzarini 2011):
 * (Yates Klingbeil 2013):
 * (Slepoy Thompson Plimpton 2008):
 * (Bratsun et al. 2005):
 * (Barrio et al. 2006):
 * (Cai 2007):
 * (Barnes Chu 2010):
 * (Ramaswamy González-Segredo Sbalzarini 2009):
 * (Ramaswamy Sbalzarini 2010):
 * (Indurkhya Beal 2010):
 * (Ramaswamy Sbalzarini 2011):
 * (Yates Klingbeil 2013):
 * (Indurkhya Beal 2010):
 * (Ramaswamy Sbalzarini 2011):
 * (Yates Klingbeil 2013):