वर्चुअल स्क्रीनिंग

वर्चुअल स्क्रीनिंग (वीएस) एक कम्प्यूटेशनल तकनीक है जिसका उपयोग दवा की खोज में छोटे अणुओं के पुस्तकालयों की खोज करने के लिए किया जाता है ताकि उन संरचनाओं की पहचान की जा सके जो दवा लक्ष्य, आमतौर पर एक प्रोटीन रिसेप्टर (जैव रसायन) या एंजाइम से जुड़ने की सबसे अधिक संभावना होती है। वर्चुअल स्क्रीनिंग को कंप्यूटर प्रोग्राम का उपयोग करके यौगिकों के बहुत बड़े पुस्तकालयों के स्वचालित मूल्यांकन के रूप में परिभाषित किया गया है। जैसा कि इस परिभाषा से पता चलता है, वीएस काफी हद तक एक संख्या का खेल रहा है जो इस बात पर ध्यान केंद्रित करता है कि 10 से अधिक का विशाल रासायनिक स्थान कैसे है60कल्पनीय यौगिक को एक प्रबंधनीय संख्या में फ़िल्टर किया जा सकता है जिसे संश्लेषित, खरीदा और परीक्षण किया जा सकता है। यद्यपि पूरे रासायनिक ब्रह्मांड की खोज एक सैद्धांतिक रूप से दिलचस्प समस्या हो सकती है, अधिक व्यावहारिक वीएस परिदृश्य लक्षित संयोजन पुस्तकालयों को डिजाइन और अनुकूलित करने और इन-हाउस कंपाउंड रिपॉजिटरी या विक्रेता प्रसाद से उपलब्ध यौगिकों के पुस्तकालयों को समृद्ध करने पर ध्यान केंद्रित करते हैं। जैसे-जैसे विधि की सटीकता बढ़ी है, वर्चुअल स्क्रीनिंग दवा खोज प्रक्रिया का एक अभिन्न अंग बन गई है। वर्चुअल स्क्रीनिंग का उपयोग स्क्रीनिंग के लिए घरेलू डेटाबेस यौगिकों का चयन करने, बाहरी रूप से खरीदे जा सकने वाले यौगिकों को चुनने और यह चुनने के लिए किया जा सकता है कि आगे किस यौगिक को संश्लेषित किया जाना चाहिए।

तरीके
स्क्रीनिंग तकनीकों की दो व्यापक श्रेणियां हैं: लिगैंड-आधारित और संरचना-आधारित। इस पृष्ठ का शेष भाग वर्चुअल स्क्रीनिंग के चित्र 1 फ़्लो चार्ट को प्रतिबिंबित करेगा।

लिगैंड-आधारित विधियाँ
संरचनात्मक रूप से विविध लिगैंड (जैव रसायन) के एक सेट को देखते हुए, जो एक रिसेप्टर (जैव रसायन) से जुड़ता है, लिगैंड के ऐसे सेट में निहित सामूहिक जानकारी का उपयोग करके रिसेप्टर का एक मॉडल बनाया जा सकता है। विभिन्न कम्प्यूटेशनल तकनीकें अलग-अलग लिगेंड की संरचनात्मक, इलेक्ट्रॉनिक, आणविक आकार और भौतिक रासायनिक समानता का पता लगाती हैं जो एक विशिष्ट आणविक रिसेप्टर या सेल लाइनों के खिलाफ उनकी कार्रवाई का तरीका बता सकती हैं। एक उम्मीदवार लिगैंड की तुलना फार्माकोफोर मॉडल से की जा सकती है ताकि यह निर्धारित किया जा सके कि यह इसके साथ संगत है और इसलिए बाध्य होने की संभावना है। विभिन्न 2डी रासायनिक समानता विश्लेषण विधियां का उपयोग सक्रिय लिगेंड्स को खोजने के लिए डेटाबेस को स्कैन करने के लिए किया गया है। लिगैंड-आधारित वर्चुअल स्क्रीनिंग में उपयोग किया जाने वाला एक अन्य लोकप्रिय दृष्टिकोण ज्ञात सक्रिय पदार्थों के समान आकार वाले अणुओं की खोज करना है, क्योंकि ऐसे अणु लक्ष्य की बाइंडिंग साइट पर फिट होंगे और इसलिए लक्ष्य को बांधने की संभावना होगी। साहित्य में इस वर्ग की तकनीकों के कई संभावित अनुप्रयोग हैं। इन 3डी विधियों के फार्माकोफोरिक एक्सटेंशन वेबसर्वर के रूप में भी निःशुल्क उपलब्ध हैं।  इसके अलावा आकार आधारित वर्चुअल स्क्रीनिंग ने भी काफी लोकप्रियता हासिल की है।

संरचना-आधारित विधियाँ
संरचना-आधारित वर्चुअल स्क्रीनिंग दृष्टिकोण में विभिन्न कम्प्यूटेशनल तकनीकें शामिल हैं जो रिसेप्टर की संरचना पर विचार करती हैं जो जांच किए गए सक्रिय लिगैंड का आणविक लक्ष्य है। इनमें से कुछ तकनीकों में आणविक डॉकिंग (आणविक), संरचना-आधारित फार्माकोफोर भविष्यवाणी और आणविक गतिशीलता सिमुलेशन शामिल हैं। आणविक डॉकिंग सबसे अधिक इस्तेमाल की जाने वाली संरचना-आधारित तकनीक है, और यह मैक्रोमोलेक्यूलर रिसेप्टर की बाइंडिंग साइट के खिलाफ प्रत्येक लिगैंड की फिटनेस का अनुमान लगाने के लिए डॉकिंग के लिए एक स्कोरिंग फ़ंक्शन लागू करती है, जिससे सबसे उच्च संबंध वाले लिगैंड को चुनने में मदद मिलती है।   वर्तमान में, कुछ वेबसर्वर संभावित वर्चुअल स्क्रीनिंग की ओर उन्मुख हैं।

हाइब्रिड तरीके
पारंपरिक वीएलएस दृष्टिकोण की सीमाओं को दूर करने के लिए संरचनात्मक और लिगैंड समानता पर भरोसा करने वाली हाइब्रिड विधियां भी विकसित की गईं। यह पद्धति छोटे-अणु बाइंडर्स की भविष्यवाणी करने के लिए विकास-आधारित लिगैंड-बाइंडिंग जानकारी का उपयोग करती है और वैश्विक संरचनात्मक समानता और पॉकेट समानता दोनों को नियोजित कर सकता है। एक वैश्विक संरचनात्मक समानता आधारित दृष्टिकोण पीडीबी होलो-टेम्पलेट लाइब्रेरी में प्रोटीन के साथ संरचनात्मक समानता खोजने के लिए एक प्रयोगात्मक संरचना या अनुमानित प्रोटीन मॉडल दोनों को नियोजित करता है। महत्वपूर्ण संरचनात्मक समानता का पता लगाने पर, 2डी फिंगरप्रिंट आधारित टैनिमोटो गुणांक मीट्रिक को छोटे-अणुओं के लिए स्क्रीन पर लागू किया जाता है जो चयनित होलो पीडीबी टेम्पलेट्स से निकाले गए लिगैंड के समान होते हैं। इस पद्धति से प्राप्त पूर्वानुमानों का प्रयोगात्मक रूप से मूल्यांकन किया गया है और सक्रिय छोटे अणुओं की पहचान करने में अच्छा संवर्धन दिखाया गया है।

उपरोक्त निर्दिष्ट विधि वैश्विक संरचनात्मक समानता पर निर्भर करती है और रुचि के प्रोटीन में किसी विशेष लिगैंड-बाइंडिंग साइट का चयन करने में सक्षम नहीं है। इसके अलावा, चूंकि विधियां लिगेंड के लिए 2डी समानता मूल्यांकन पर निर्भर करती हैं, इसलिए वे छोटे-अणुओं की स्टीरियोकेमिकल समानता को पहचानने में सक्षम नहीं हैं जो काफी हद तक भिन्न हैं लेकिन ज्यामितीय आकार समानता प्रदर्शित करते हैं। इन चिंताओं को दूर करने के लिए, एक नया पॉकेट केंद्रित दृष्टिकोण, पोली, जो होलो-प्रोटीन टेम्पलेट्स में विशिष्ट बाइंडिंग पॉकेट्स को लक्षित करने में सक्षम है, विकसित किया गया और प्रयोगात्मक रूप से मूल्यांकन किया गया।

कंप्यूटिंग इन्फ्रास्ट्रक्चर
परमाणुओं के बीच जोड़ी-वार बातचीत की गणना, जो कई आभासी स्क्रीनिंग कार्यक्रमों के संचालन के लिए एक शर्त है, द्वारा मापी जाती है $$O(N^{2})$$, N प्रणाली में परमाणुओं की संख्या है। द्विघात स्केलिंग के कारण, कम्प्यूटेशनल लागत तेजी से बढ़ती है।

लिगैंड-आधारित दृष्टिकोण
लिगैंड-आधारित तरीकों को आमतौर पर एकल संरचना तुलना ऑपरेशन के लिए एक सेकंड के एक अंश की आवश्यकता होती है। कभी-कभी एक सीपीयू घंटों के भीतर बड़ी स्क्रीनिंग करने के लिए पर्याप्त होता है। हालाँकि, यौगिकों के एक बड़े डेटाबेस के प्रसंस्करण में तेजी लाने के लिए समानांतर में कई तुलनाएँ की जा सकती हैं।

संरचना-आधारित दृष्टिकोण
कार्य के आकार के लिए समानांतर कंप्यूटिंग बुनियादी ढांचे की आवश्यकता होती है, जैसे कि लिनक्स सिस्टम का क्लस्टर, काम को संभालने के लिए बैच कतार प्रोसेसर चलाना, जैसे सन ग्रिड इंजन या टॉर्क पीबीएस।

बड़े कंपाउंड पुस्तकालयों से इनपुट को संभालने के साधन की आवश्यकता है। इसके लिए कंपाउंड डेटाबेस के एक रूप की आवश्यकता होती है जिसे समानांतर क्लस्टर द्वारा क्वेरी किया जा सकता है, जो विभिन्न कंप्यूट नोड्स के समानांतर कंपाउंड प्रदान करता है। वाणिज्यिक डेटाबेस इंजन बहुत कठिन हो सकते हैं, और एक उच्च गति अनुक्रमण इंजन, जैसे बर्कले डीबी, एक बेहतर विकल्प हो सकता है। इसके अलावा, प्रति कार्य एक तुलना चलाना कुशल नहीं हो सकता है, क्योंकि क्लस्टर नोड्स का रैंप अप समय आसानी से उपयोगी कार्य की मात्रा से आगे निकल सकता है। इसके आसपास काम करने के लिए, प्रत्येक क्लस्टर कार्य में यौगिकों के बैचों को संसाधित करना, परिणामों को किसी प्रकार की लॉग फ़ाइल में एकत्रित करना आवश्यक है। लॉग फ़ाइलों को माइन करने और उच्च स्कोरिंग उम्मीदवारों को निकालने के लिए एक माध्यमिक प्रक्रिया, पूरे प्रयोग के चलने के बाद चलाई जा सकती है।

सटीकता
वर्चुअल स्क्रीनिंग का उद्देश्य नवीन रासायनिक संरचना के अणुओं की पहचान करना है जो मैक्रोमोलेक्युलर जैविक लक्ष्य से जुड़ते हैं। इस प्रकार, वर्चुअल स्क्रीन की सफलता को हिट की कुल संख्या के बजाय दिलचस्प नए मचान खोजने के संदर्भ में परिभाषित किया गया है। इसलिए, वर्चुअल स्क्रीनिंग सटीकता की व्याख्या पर सावधानी से विचार किया जाना चाहिए। दिलचस्प मचानों की कम हिट दर पहले से ही ज्ञात मचानों की उच्च हिट दरों की तुलना में स्पष्ट रूप से बेहतर है।

साहित्य में वर्चुअल स्क्रीनिंग अध्ययन के अधिकांश परीक्षण पूर्वव्यापी हैं। इन अध्ययनों में, वीएस तकनीक के प्रदर्शन को एक पुस्तकालय से रुचि के लक्ष्य (सक्रिय अणुओं या सिर्फ सक्रिय) के साथ पहले से ज्ञात अणुओं के एक छोटे सेट को पुनः प्राप्त करने की क्षमता से मापा जाता है, जिसमें अनुमानित निष्क्रिय या बहुत अधिक अनुपात होता है। प्रलोभन। संबंधित सक्रिय अणु के गुणों का मिलान करके डिकॉय का चयन करने के कई अलग-अलग तरीके हैं और हाल ही में डिकॉय को भी संपत्ति-बेजोड़ तरीके से चुना गया है। प्रशिक्षण या परीक्षण उद्देश्यों के लिए डिकॉय चयन के वास्तविक प्रभाव पर भी चर्चा की गई है। इसके विपरीत, वर्चुअल स्क्रीनिंग के संभावित अनुप्रयोगों में, परिणामी हिट प्रयोगात्मक पुष्टि के अधीन होते हैं (उदाहरण के लिए, IC50|IC50माप)। इस बात पर आम सहमति है कि पूर्वव्यापी बेंचमार्क संभावित प्रदर्शन के अच्छे भविष्यवक्ता नहीं हैं और परिणामस्वरूप केवल संभावित अध्ययन ही किसी विशेष लक्ष्य के लिए किसी तकनीक की उपयुक्तता का निर्णायक प्रमाण बनते हैं।

दवा खोज के लिए आवेदन
जब औषधीय रसायन विज्ञान की शुरुआत के रूप में हिट अणुओं की पहचान करने की बात आती है तो वर्चुअल स्क्रीनिंग एक बहुत ही उपयोगी एप्लिकेशन है। जैसे-जैसे वर्चुअल स्क्रीनिंग दृष्टिकोण औषधीय रसायन उद्योग के भीतर एक अधिक महत्वपूर्ण और पर्याप्त तकनीक बनने लगा है, इस दृष्टिकोण में तेजी से वृद्धि हुई है।

लिगैंड-आधारित विधियाँ
संरचना को न जानते हुए भी यह अनुमान लगाने की कोशिश की जा रही है कि लिगेंड रिसेप्टर से कैसे बंधेंगे। फार्माकोफोर सुविधाओं के उपयोग से प्रत्येक लिगैंड ने दाता और स्वीकर्ता की पहचान की। समान विशेषताएँ व्याप्त हैं, हालाँकि यह देखते हुए कि एक भी सही समाधान होने की संभावना नहीं है।

फार्माकोफोर मॉडल
इस तकनीक का उपयोग विपरीत संदर्भ यौगिकों, समान वर्णनकर्ताओं और गुणांक, लेकिन विभिन्न सक्रिय यौगिकों का उपयोग करके खोजों के परिणामों को मर्ज करते समय किया जाता है। यह तकनीक फायदेमंद है क्योंकि जब विविध गतिविधियों की बात आती है तो यह सबसे सटीक प्रदर्शन के साथ-साथ एकल संदर्भ संरचना का उपयोग करने की तुलना में अधिक कुशल है।

फार्माकोफोर स्टेरिक और इलेक्ट्रॉनिक विशेषताओं का एक समूह है, जिसकी जैविक प्रतिक्रिया को तेज करने के लिए जैविक लक्ष्य संरचना के साथ इष्टतम सुपरमॉलेक्यूलर इंटरैक्शन या इंटरैक्शन की आवश्यकता होती है। एक्टिविटीज़ के सेट के रूप में एक प्रतिनिधि चुनें, अधिकांश विधियाँ समान बाइंडिंग की तलाश करेंगी। कई कठोर अणुओं को प्राथमिकता दी जाती है और लिगेंड को विविधतापूर्ण होना चाहिए, दूसरे शब्दों में यह सुनिश्चित करना चाहिए कि अलग-अलग विशेषताएं हों जो बंधन चरण के दौरान न हों।

आकार-आधारित वर्चुअल स्क्रीनिंग
आकार-आधारित आणविक समानता दृष्टिकोण को महत्वपूर्ण और लोकप्रिय आभासी स्क्रीनिंग तकनीकों के रूप में स्थापित किया गया है। वर्तमान में, अत्यधिक अनुकूलित स्क्रीनिंग प्लेटफॉर्म आरओसीएस (रैपिड ओवरले ऑफ केमिकल स्ट्रक्चर्स) को आकार-आधारित, लिगैंड-केंद्रित वर्चुअल स्क्रीनिंग के लिए वास्तविक उद्योग मानक माना जाता है।  यह छोटे कार्बनिक अणुओं के आणविक आयतन को परिभाषित करने के लिए गाऊसी फ़ंक्शन का उपयोग करता है। क्वेरी संरचना का चयन कम महत्वपूर्ण है, जो लिगैंड-आधारित मॉडलिंग के लिए आकार-आधारित स्क्रीनिंग को आदर्श बनाता है: चूंकि क्वेरी के लिए बायोएक्टिव संरचना की उपलब्धता स्क्रीनिंग के लिए सीमित कारक नहीं है - यह क्वेरी कंपाउंड का चयन अधिक महत्वपूर्ण है ) जो स्क्रीनिंग प्रदर्शन के लिए निर्णायक है।

फ़ील्ड-आधारित वर्चुअल स्क्रीनिंग
आकार-आधारित समानता विधियों में सुधार के रूप में, फ़ील्ड-आधारित विधियाँ उन सभी क्षेत्रों को ध्यान में रखने का प्रयास करती हैं जो एक क्वेरी के रूप में उपयोग की जाने वाली रासायनिक संरचना के बारे में अज्ञेयवादी होते हुए लिगैंड-रिसेप्टर इंटरैक्शन को प्रभावित करते हैं। इन विधियों में उपयोग किए जाने वाले अन्य क्षेत्रों के उदाहरण इलेक्ट्रोस्टैटिक या हिड्रोफोबिक क्षेत्र हैं।

मात्रात्मक-संरचना गतिविधि संबंध
मात्रात्मक संरचना-गतिविधि संबंध|मात्रात्मक-संरचना गतिविधि संबंध (क्यूएसएआर) मॉडल में ज्ञात सक्रिय और ज्ञात निष्क्रिय यौगिकों के एक सेट से निकाली गई जानकारी के आधार पर पूर्वानुमानित मॉडल शामिल होते हैं। एसएआर (स्ट्रक्चर एक्टिविटी रिलेशनशिप) जहां डेटा को गुणात्मक रूप से व्यवहार किया जाता है और इसका उपयोग संरचनात्मक वर्गों और एक से अधिक बाइंडिंग मोड के साथ किया जा सकता है। मॉडल सीसे की खोज के लिए यौगिकों को प्राथमिकता देते हैं।

मशीन लर्निंग एल्गोरिदम
वर्चुअल स्क्रीनिंग दृष्टिकोण में मशीन लर्निंग एल्गोरिदम का व्यापक रूप से उपयोग किया गया है। पर्यवेक्षित शिक्षण तकनीकें ज्ञात सक्रिय और ज्ञात निष्क्रिय यौगिकों से बने प्रशिक्षण और परीक्षण डेटासेट का उपयोग करती हैं। विभिन्न एमएल एल्गोरिदम को वर्चुअल स्क्रीनिंग रणनीतियों में सफलता के साथ लागू किया गया है, जैसे पुनरावर्ती विभाजन, समर्थन वेक्टर यंत्र, के-निकटतम पड़ोसी और कृत्रिम तंत्रिका नेटवर्क।  ये मॉडल किसी यौगिक के सक्रिय होने की संभावना का पता लगाते हैं और फिर प्रत्येक यौगिक को उसकी संभावना के आधार पर रैंकिंग देते हैं।

मशीन लर्निंग में सबस्ट्रक्चरल विश्लेषण
बड़े डेटासेट पर उपयोग किया जाने वाला पहला मशीन लर्निंग मॉडल सबस्ट्रक्चर विश्लेषण है जो 1973 में बनाया गया था। प्रत्येक टुकड़ा सबस्ट्रक्चर विशिष्ट प्रकार की गतिविधि में निरंतर योगदान देता है। जब दवा डिजाइन में संरचनाओं का विश्लेषण करने की बात आती है तो सबस्ट्रक्चर एक ऐसी विधि है जो बड़े पैमाने पर आयामीता की कठिनाई को दूर करती है। एक कुशल उपसंरचना विश्लेषण का उपयोग उन संरचनाओं के लिए किया जाता है जिनमें बहु-स्तरीय इमारत या टावर की समानता होती है। ज्यामिति का उपयोग शुरुआत में और चरमोत्कर्ष की ओर दी गई संरचना के लिए सीमा जोड़ों को क्रमांकित करने के लिए किया जाता है। जब विशेष स्थैतिक संक्षेपण और प्रतिस्थापन दिनचर्या की विधि विकसित की जाती है तो यह विधि पिछले उपसंरचना विश्लेषण मॉडल की तुलना में अधिक उत्पादक साबित होती है।

पुनरावर्ती विभाजन
पुनरावर्ती विभाजन वह विधि है जो गुणात्मक डेटा का उपयोग करके निर्णय वृक्ष बनाती है। यह समझना कि किस प्रकार नियम प्रत्येक चरण को दोहराते हुए गलत वर्गीकरण की कम त्रुटि के साथ कक्षाओं को तोड़ते हैं जब तक कि कोई समझदार विभाजन न मिल जाए। हालाँकि, पुनरावर्ती विभाजन में खराब भविष्यवाणी क्षमता हो सकती है जो संभावित रूप से उसी दर पर अच्छे मॉडल बना सकती है।

संरचना-आधारित विधियाँ ज्ञात प्रोटीन लिगैंड डॉकिंग
प्राथमिकता क्रम निर्दिष्ट करते समय किसी व्यक्तिगत लिगैंड के सबसे संभावित कारण की पहचान करने के लिए डॉकिंग सर्च एल्गोरिदम और स्कोरिंग फ़ंक्शन का उपयोग करके लिगैंड को प्रोटीन के भीतर एक सक्रिय साइट में बांधा जा सकता है।

यह भी देखें

 * ग्रिड कंप्यूटिंग
 * उच्च परिणाम स्क्रीनिंग
 * डॉकिंग (आणविक)
 * रेट्रो स्क्रीनिंग
 * डॉकिंग के लिए स्कोरिंग कार्य
 * जिंक डेटाबेस

बाहरी संबंध

 * VLS3D – list of over 2000 databases, online and standalone in silico tools