वर्चुअल स्क्रीनिंग

वर्चुअल स्क्रीनिंग (वीएस) एक कम्प्यूटेशनल विधि है जिसका उपयोग दवा की खोज में छोटे अणुओं के लाइब्रेरीज की खोज करने के लिए किया जाता है जिससे कि उन संरचनाओं की पहचान की जा सके जो ड्रग टारगेट, सामान्यतः प्रोटीन रिसेप्टर (जैव रसायन) या एंजाइम से जुड़ने की सबसे अधिक संभावना होती है। वर्चुअल स्क्रीनिंग को कंप्यूटर प्रोग्राम का उपयोग करके यौगिकों के बहुत बड़े लाइब्रेरीज के स्वचालित मूल्यांकन के रूप में परिभाषित किया गया है। जैसा कि इस परिभाषा से पता चलता है, वीएस अधिक सीमा तक एक संख्या का खेल है जो इस बात पर ध्यान केंद्रित करता है कि 1060 से अधिक का विशाल रासायनिक स्थान को कैसे एक प्रबंधनीय संख्या में फ़िल्टर किया जा सकता है जिसे संश्लेषित, खरीद और परीक्षण किया जा सकता है। यद्यपि पूरे रासायनिक ब्रह्मांड की खोज एक सैद्धांतिक रूप से रोचक समस्या हो सकती है, अधिक व्यावहारिक वीएस परिदृश्य लक्षित संयोजन लाइब्रेरीज को डिजाइन और अनुकूलित करने और इन-हाउस कंपाउंड रिपॉजिटरी या विक्रेता प्रसाद से उपलब्ध यौगिकों के लाइब्रेरीज को समृद्ध करने पर ध्यान केंद्रित करते हैं। जैसे-जैसे विधि की स्पष्टता बढ़ी है, वर्चुअल स्क्रीनिंग दवा खोज प्रक्रिया का एक अभिन्न अंग बन गई है। वर्चुअल स्क्रीनिंग का उपयोग स्क्रीनिंग के लिए घरेलू डेटाबेस यौगिकों का चयन करने, बाहरी रूप से खरीदे जा सकने वाले यौगिकों को चुनने और यह चुनने के लिए किया जा सकता है कि आगे किस यौगिक को संश्लेषित किया जाना चाहिए।

विधियाँ
स्क्रीनिंग विधियों की दो व्यापक श्रेणियां हैं: लिगैंड-आधारित और संरचना-आधारित। इस पृष्ठ का शेष भाग वर्चुअल स्क्रीनिंग के चित्र 1 फ़्लो चार्ट को प्रतिबिंबित करेगा।

लिगैंड-आधारित विधियाँ
संरचनात्मक रूप से विविध लिगैंड (जैव रसायन) के एक समूह को देखते हुए, जो एक रिसेप्टर (जैव रसायन) से जुड़ता है, लिगैंड के ऐसे समूह में निहित सामूहिक जानकारी का उपयोग करके रिसेप्टर का एक मॉडल बनाया जा सकता है। विभिन्न कम्प्यूटेशनल विधियाँ अलग-अलग लिगेंड की संरचनात्मक, इलेक्ट्रॉनिक, आणविक आकार और भौतिक रासायनिक समानता का पता लगाती हैं जो एक विशिष्ट आणविक रिसेप्टर या सेल लाइनों के विरुद्ध उनकी कार्रवाई का तरीका बता सकती हैं। एक उम्मीदवार लिगैंड की तुलना फार्माकोफोर मॉडल से की जा सकती है जिससे कि यह निर्धारित किया जा सके कि यह इसके साथ संगत है और इसलिए बाध्य होने की संभावना है। विभिन्न 2डी रासायनिक समानता विश्लेषण विधियां का उपयोग सक्रिय लिगेंड्स को खोजने के लिए डेटाबेस को स्कैन करने के लिए किया गया है। लिगैंड-आधारित वर्चुअल स्क्रीनिंग में उपयोग किया जाने वाला एक अन्य लोकप्रिय दृष्टिकोण ज्ञात सक्रिय पदार्थों के समान आकार वाले अणुओं की खोज करना है, क्योंकि ऐसे अणु लक्ष्य की बाइंडिंग साइट पर फिट होंगे और इसलिए लक्ष्य को बांधने की संभावना होगी। साहित्य में इस वर्ग की विधियों के कई संभावित अनुप्रयोग हैं। इन 3डी विधियों के फार्माकोफोरिक एक्सटेंशन वेबसर्वर के रूप में भी निःशुल्क उपलब्ध हैं।  इसके अतिरिक्त आकार आधारित वर्चुअल स्क्रीनिंग ने भी अधिक लोकप्रियता हासिल की है।

संरचना-आधारित विधियाँ
संरचना-आधारित वर्चुअल स्क्रीनिंग दृष्टिकोण में विभिन्न कम्प्यूटेशनल विधियाँ सम्मिलित हैं जो रिसेप्टर की संरचना पर विचार करती हैं जो जांच किए गए सक्रिय लिगैंड का आणविक लक्ष्य है। इनमें से कुछ विधियों में आणविक डॉकिंग (आणविक), संरचना-आधारित फार्माकोफोर पूर्वानुमान और आणविक गतिशीलता सिमुलेशन सम्मिलित हैं। आणविक डॉकिंग सबसे अधिक उपयोग की जाने वाली संरचना-आधारित विधि है, और यह मैक्रोमोलेक्यूलर रिसेप्टर की बाइंडिंग साइट के विरुद्ध प्रत्येक लिगैंड की फिटनेस का अनुमान लगाने के लिए डॉकिंग के लिए एक अंकन क्रिया प्रयुक्त करती है, जिससे सबसे उच्च संबंध वाले लिगैंड को चुनने में सहायता मिलती है।   वर्तमान में, कुछ वेबसर्वर संभावित वर्चुअल स्क्रीनिंग की ओर उन्मुख हैं।

हाइब्रिड विधियाँ
पारंपरिक वीएलएस दृष्टिकोण की सीमाओं को दूर करने के लिए संरचनात्मक और लिगैंड समानता पर भरोसा करने वाली हाइब्रिड विधियां भी विकसित की गईं। यह पद्धति छोटे-अणु बाइंडर्स की पूर्वानुमान करने के लिए विकास-आधारित लिगैंड-बाइंडिंग जानकारी का उपयोग करती है और वैश्विक संरचनात्मक समानता और पॉकेट समानता दोनों को नियोजित कर सकता है। एक वैश्विक संरचनात्मक समानता आधारित दृष्टिकोण पीडीबी होलो-टेम्पलेट लाइब्रेरी में प्रोटीन के साथ संरचनात्मक समानता खोजने के लिए एक प्रयोगात्मक संरचना या अनुमानित प्रोटीन मॉडल दोनों को नियोजित करता है। महत्वपूर्ण संरचनात्मक समानता का पता लगाने पर, 2डी फिंगरप्रिंट आधारित टैनिमोटो गुणांक मीट्रिक को छोटे-अणुओं के लिए स्क्रीन पर प्रयुक्त किया जाता है जो चयनित होलो पीडीबी टेम्पलेट्स से निकाले गए लिगैंड के समान होते हैं। इस पद्धति से प्राप्त पूर्वानुमानों का प्रयोगात्मक रूप से मूल्यांकन किया गया है और सक्रिय छोटे अणुओं की पहचान करने में अच्छा संवर्धन दिखाया गया है।

उपरोक्त निर्दिष्ट विधि वैश्विक संरचनात्मक समानता पर निर्भर करती है और रुचि के प्रोटीन में किसी विशेष लिगैंड-बाइंडिंग साइट का चयन करने में सक्षम नहीं है। इसके अतिरिक्त, चूंकि विधियां लिगेंड के लिए 2डी समानता मूल्यांकन पर निर्भर करती हैं, इसलिए वे छोटे-अणुओं की स्टीरियोकेमिकल समानता को पहचानने में सक्षम नहीं हैं जो अधिक सीमा तक भिन्न हैं किन्तु ज्यामितीय आकार समानता प्रदर्शित करते हैं। इन चिंताओं को दूर करने के लिए, एक नया पॉकेट केंद्रित दृष्टिकोण, पोली, जो होलो-प्रोटीन टेम्पलेट्स में विशिष्ट बाइंडिंग पॉकेट्स को लक्षित करने में सक्षम है, विकसित किया गया और प्रयोगात्मक रूप से मूल्यांकन किया गया।

कंप्यूटिंग अवसंरचना
परमाणुओं के मध्य युग्‍मानूसार परस्पर क्रिया की गणना, जो कई आभासी स्क्रीनिंग प्रोग्राम के संचालन के लिए एक नियम है, $$O(N^{2})$$ द्वारा मापी जाती है, N प्रणाली में परमाणुओं की संख्या है। द्विघात स्केलिंग के कारण, कम्प्यूटेशनल व्यय तेजी से बढ़ती है।

लिगैंड-आधारित दृष्टिकोण
लिगैंड-आधारित विधियो को सामान्यतः एकल संरचना तुलना ऑपरेशन के लिए एक सेकंड के एक अंश की आवश्यकता होती है। कभी-कभी एक सीपीयू घंटों के अंदर बड़ी स्क्रीनिंग करने के लिए पर्याप्त होता है। चूँकि, यौगिकों के एक बड़े डेटाबेस के प्रसंस्करण में तेजी लाने के लिए समानांतर में कई तुलनाएँ की जा सकती हैं।

संरचना-आधारित दृष्टिकोण
कार्य के आकार के लिए समानांतर कंप्यूटिंग बुनियादी ढांचे की आवश्यकता होती है, जैसे कि लिनक्स सिस्टम का क्लस्टर, काम को संभालने के लिए बैच क्यू प्रोसेसर चलाना, जैसे सन ग्रिड इंजन या टॉर्क पीबीएस।

बड़े कंपाउंड लाइब्रेरीज से इनपुट को संभालने के साधन की आवश्यकता है। इसके लिए कंपाउंड डेटाबेस के एक रूप की आवश्यकता होती है जिसे समानांतर क्लस्टर द्वारा क्वेरी किया जा सकता है, जो विभिन्न कंप्यूट नोड्स के समानांतर कंपाउंड प्रदान करता है। वाणिज्यिक डेटाबेस इंजन बहुत कठिन हो सकते हैं, और एक उच्च गति अनुक्रमण इंजन, जैसे बर्कले डीबी, एक उत्तम विकल्प हो सकता है। इसके अतिरिक्त, प्रति कार्य एक तुलना चलाना कुशल नहीं हो सकता है, क्योंकि क्लस्टर नोड्स का रैंप अप समय आसानी से उपयोगी कार्य की मात्रा से आगे निकल सकता है। इसके आसपास काम करने के लिए, प्रत्येक क्लस्टर कार्य में यौगिकों के बैचों को संसाधित करना, परिणामों को किसी प्रकार की लॉग फ़ाइल में एकत्रित करना आवश्यक है। लॉग फ़ाइलों को माइन करने और उच्च अंकन अभ्यर्थी को निकालने के लिए एक माध्यमिक प्रक्रिया, पूरे प्रयोग के चलने के बाद चलाई जा सकती है।

स्पष्टता
वर्चुअल स्क्रीनिंग का उद्देश्य नवीन रासायनिक संरचना के अणुओं की पहचान करना है जो मैक्रोमोलेक्युलर जैविक लक्ष्य से जुड़ते हैं। इस प्रकार, वर्चुअल स्क्रीन की सफलता को हिट की कुल संख्या के अतिरिक्त रोचक नए मचान खोजने के संदर्भ में परिभाषित किया गया है। इसलिए, वर्चुअल स्क्रीनिंग स्पष्टता की व्याख्या पर सावधानी से विचार किया जाना चाहिए। रोचक मचानों की कम हिट दर पहले से ही ज्ञात मचानों की उच्च हिट दरों की तुलना में स्पष्ट रूप से उत्तम है।

साहित्य में वर्चुअल स्क्रीनिंग अध्ययन के अधिकांश परीक्षण पूर्वव्यापी हैं। इन अध्ययनों में, वीएस विधि के प्रदर्शन को एक लाइब्रेरी से रुचि के लक्ष्य (सक्रिय अणुओं या सिर्फ सक्रिय) के साथ पहले से ज्ञात अणुओं के एक छोटे समूह को पुनः प्राप्त करने की क्षमता से मापा जाता है, जिसमें अनुमानित निष्क्रिय या बहुत अधिक अनुपात होता है। प्रलोभन। संबंधित सक्रिय अणु के गुणों का मिलान करके डिकॉय का चयन करने के कई अलग-अलग विधियाँ हैं और वर्तमान में डिकॉय को भी गुण-अद्वितीय विधियाँ से चुना गया है। प्रशिक्षण या परीक्षण उद्देश्यों के लिए डिकॉय चयन के वास्तविक प्रभाव पर भी चर्चा की गई है।

इसके विपरीत, वर्चुअल स्क्रीनिंग के संभावित अनुप्रयोगों में, परिणामी हिट प्रयोगात्मक पुष्टि के अधीन होते हैं (उदाहरण के लिए, IC50|IC50माप)। इस बात पर आम सहमति है कि पूर्वव्यापी बेंचमार्क संभावित प्रदर्शन के अच्छे भविष्यवक्ता नहीं हैं और परिणामस्वरूप केवल संभावित अध्ययन ही किसी विशेष लक्ष्य के लिए किसी विधि की उपयुक्तता का निर्णायक प्रमाण बनते हैं।

दवा खोज के लिए एप्लिकेशन
जब औषधीय रसायन विज्ञान की प्रारंभिक के रूप में हिट अणुओं की पहचान करने की बात आती है तो वर्चुअल स्क्रीनिंग एक बहुत ही उपयोगी एप्लिकेशन है। जैसे-जैसे वर्चुअल स्क्रीनिंग दृष्टिकोण औषधीय रसायन उद्योग के अंदर एक अधिक महत्वपूर्ण और पर्याप्त विधि बनने लगा है, इस दृष्टिकोण में तेजी से वृद्धि हुई है।

लिगैंड-आधारित विधियाँ
संरचना को न जानते हुए भी यह अनुमान लगाने की प्रयास किया जा रहा है कि लिगेंड रिसेप्टर से कैसे बंधेंगे। फार्माकोफोर सुविधाओं के उपयोग से प्रत्येक लिगैंड ने दाता और स्वीकर्ता की पहचान की। समान विशेषताएँ व्याप्त हैं, चूँकि यह देखते हुए कि एक भी सही समाधान होने की संभावना नहीं है।

फार्माकोफोर मॉडल
इस विधि का उपयोग विपरीत संदर्भ यौगिकों, समान वर्णनकर्ताओं और गुणांक, किन्तु विभिन्न सक्रिय यौगिकों का उपयोग करके खोजों के परिणामों को मर्ज करते समय किया जाता है। यह विधि लाभदायक है क्योंकि जब विविध गतिविधियों की बात आती है तो यह सबसे स्पष्ट प्रदर्शन के साथ-साथ एकल संदर्भ संरचना का उपयोग करने की तुलना में अधिक कुशल है।

फार्माकोफोर स्टेरिक और इलेक्ट्रॉनिक विशेषताओं का एक समूह है, जिसकी जैविक प्रतिक्रिया को तेज करने के लिए जैविक लक्ष्य संरचना के साथ इष्टतम सुपरमॉलेक्यूलर इंटरैक्शन या इंटरैक्शन की आवश्यकता होती है। एक्टिविटीज़ के समूह के रूप में एक प्रतिनिधि चुनें, अधिकांश विधियाँ समान बाइंडिंग की तलाश करेंगी। कई कठोर अणुओं को प्राथमिकता दी जाती है और लिगेंड को विविधतापूर्ण होना चाहिए, दूसरे शब्दों में यह सुनिश्चित करना चाहिए कि अलग-अलग विशेषताएं हों जो बंधन चरण के दौरान न हों।

आकार-आधारित वर्चुअल स्क्रीनिंग
आकार-आधारित आणविक समानता दृष्टिकोण को महत्वपूर्ण और लोकप्रिय आभासी स्क्रीनिंग विधियों के रूप में स्थापित किया गया है। वर्तमान में, अत्यधिक अनुकूलित स्क्रीनिंग प्लेटफॉर्म आरओसीएस (रैपिड ओवरले ऑफ केमिकल स्ट्रक्चर्स) को आकार-आधारित, लिगैंड-केंद्रित वर्चुअल स्क्रीनिंग के लिए वास्तविक उद्योग मानक माना जाता है।  यह छोटे कार्बनिक अणुओं के आणविक आयतन को परिभाषित करने के लिए गाऊसी क्रिया का उपयोग करता है। क्वेरी संरचना का चयन कम महत्वपूर्ण है, जो लिगैंड-आधारित मॉडलिंग के लिए आकार-आधारित स्क्रीनिंग को आदर्श बनाता है: चूंकि क्वेरी के लिए बायोएक्टिव संरचना की उपलब्धता स्क्रीनिंग के लिए सीमित कारक नहीं है - यह क्वेरी कंपाउंड का चयन अधिक महत्वपूर्ण है ) जो स्क्रीनिंग प्रदर्शन के लिए निर्णायक है।

क्षेत्र-आधारित वर्चुअल स्क्रीनिंग
आकार-आधारित समानता विधियों में सुधार के रूप में, क्षेत्र-आधारित विधियाँ उन सभी क्षेत्रों को ध्यान में रखने का प्रयास करती हैं जो एक क्वेरी के रूप में उपयोग की जाने वाली रासायनिक संरचना के बारे में अज्ञेयवादी होते हुए लिगैंड-रिसेप्टर इंटरैक्शन को प्रभावित करते हैं। इन विधियों में उपयोग किए जाने वाले अन्य क्षेत्रों के उदाहरण इलेक्ट्रोस्टैटिक या हिड्रोफोबिक क्षेत्र हैं।

मात्रात्मक-संरचना गतिविधि संबंध
मात्रात्मक-संरचना गतिविधि संबंध (क्यूएसएआर) मॉडल में ज्ञात सक्रिय और ज्ञात निष्क्रिय यौगिकों के एक समूह से निकाली गई जानकारी के आधार पर पूर्वानुमानित मॉडल सम्मिलित होते हैं। एसएआर (स्ट्रक्चर एक्टिविटी रिलेशनशिप) जहां डेटा को गुणात्मक रूप से व्यवहार किया जाता है और इसका उपयोग संरचनात्मक वर्गों और एक से अधिक बाइंडिंग मोड के साथ किया जा सकता है। मॉडल लेड की खोज के लिए यौगिकों को प्राथमिकता देते हैं।

मशीन लर्निंग एल्गोरिदम
वर्चुअल स्क्रीनिंग दृष्टिकोण में मशीन लर्निंग एल्गोरिदम का व्यापक रूप से उपयोग किया गया है। पर्यवेक्षित शिक्षण विधियाँ ज्ञात सक्रिय और ज्ञात निष्क्रिय यौगिकों से बने प्रशिक्षण और परीक्षण डेटासमूह का उपयोग करती हैं। विभिन्न एमएल एल्गोरिदम को वर्चुअल स्क्रीनिंग कार्यनीति में सफलता के साथ प्रयुक्त किया गया है, जैसे पुनरावर्ती विभाजन, सपोर्ट वेक्टर मशीन, के-नियेरेस्ट नेबर और न्यूरल नेटवर्क।  ये मॉडल किसी यौगिक के सक्रिय होने की संभावना का पता लगाते हैं और फिर प्रत्येक यौगिक को उसकी संभावना के आधार पर रैंकिंग देते हैं।

मशीन लर्निंग में सबस्ट्रक्चरल विश्लेषण
इस प्रकार यह बड़े डेटासमूह पर उपयोग किया जाने वाला पहला मशीन लर्निंग मॉडल सबस्ट्रक्चर विश्लेषण है जो 1973 में बनाया गया था। प्रत्येक टुकड़ा सबस्ट्रक्चर विशिष्ट प्रकार की गतिविधि में निरंतर योगदान देता है। जब दवा डिजाइन में संरचनाओं का विश्लेषण करने की बात आती है तो सबस्ट्रक्चर एक ऐसी विधि है जो बड़े माप पर आयामीता की कठिनाई को दूर करती है। एक कुशल उपसंरचना विश्लेषण का उपयोग उन संरचनाओं के लिए किया जाता है जिनमें बहु-स्तरीय इमारत या टावर की समानता होती है। ज्यामिति का उपयोग प्रारंभिक में और उत्तम की ओर दी गई संरचना के लिए सीमा जोड़ों को क्रमांकित करने के लिए किया जाता है। जब विशेष स्थैतिक संक्षेपण और प्रतिस्थापन दिनचर्या की विधि विकसित की जाती है तो यह विधि पिछले उपसंरचना विश्लेषण मॉडल की तुलना में अधिक उत्पादक सिद्ध होती है।

पुनरावर्ती विभाजन
पुनरावर्ती विभाजन वह विधि है जो गुणात्मक डेटा का उपयोग करके निर्णय तालिका बनाती है। यह समझना कि किस प्रकार नियम प्रत्येक चरण को दोहराते हुए गलत वर्गीकरण की कम त्रुटि के साथ कक्षाओं को तोड़ते हैं जब तक कि कोई तर्कसंगत विभाजन न मिल जाए। चूँकि, पुनरावर्ती विभाजन में व्यर्थ पूर्वानुमान क्षमता हो सकती है जो संभावित रूप से उसी दर पर अच्छे मॉडल बना सकती है।

संरचना-आधारित विधियाँ ज्ञात प्रोटीन लिगैंड डॉकिंग
प्राथमिकता क्रम निर्दिष्ट करते समय किसी व्यक्तिगत लिगैंड के सबसे संभावित कारण की पहचान करने के लिए डॉकिंग सर्च एल्गोरिदम और अंकन क्रिया का उपयोग करके लिगैंड को प्रोटीन के अंदर एक सक्रिय साइट में बांधा जा सकता है।

यह भी देखें

 * ग्रिड कंप्यूटिंग
 * उच्च परिणाम स्क्रीनिंग
 * डॉकिंग (आणविक)
 * रेट्रो स्क्रीनिंग
 * डॉकिंग के लिए अंकन कार्य
 * जिंक डेटाबेस

बाहरी संबंध

 * VLS3D – list of over 2000 databases, online and standalone in silico tools