प्रोटीन संरचना

प्रोटीन संरचना आणविक ज्यामिति है एमिनो एसिड-चेन अणु में परमाणुओं की त्रि-आयामी व्यवस्था है। प्रोटीन बहुलक होते हैं – विशेष रूप से पॉलीपेप्टाइड बहुलक के मोनोमर, अमीनो एसिड के अनुक्रम से बनते हैं। एकल अमीनो एसिड मोनोमर को अवशेष भी कहा जा सकता है जो बहुलक की दोहराई जाने वाली इकाई का संकेत देता है। संघनन प्रतिक्रियाओं से निकलने वाले अमीनो एसिड द्वारा प्रोटीन बनते हैं, जिसमें अमीनो एसिड पेप्टाइड बॉन्ड के साथ एक दूसरे से जुड़ने के लिए प्रति रासायनिक प्रतिक्रिया में पानी के अणु को खो देते हैं। परंपरा के अनुसार, 30 अमीनो एसिड के  द्वारा श्रृंखला को अधिकांशतः प्रोटीन के अतिरिक्त पेप्टाइड के रूप में पहचाना जाता है। अपने जैविक कार्य करने में सक्षम होने के लिए, प्रोटीन एक या एक से अधिक विशिष्ट स्थानिक अनुरूपता में बदल जाता है जो कई गैर-सहसंयोजक अंतःक्रियाओं जैसे हाइड्रोजन बंध, आयनिक बातचीत, वैन डेर वाल बल और जल विरोधी पैकिंग द्वारा संचालित होता है। आणविक स्तर पर प्रोटीन के कार्यों को समझने के लिए अधिकांशतः प्रोटीन की तृतीयक संरचना त्रि-आयामी संरचना को निर्धारित करना आवश्यक होता है। यह संरचनात्मक जीव विज्ञान के वैज्ञानिक क्षेत्र का विषय है, जो प्रोटीन की संरचना निर्धारित करने के लिए एक्स - रे क्रिस्टलोग्राफी, प्रोटीन एनएमआर, क्रायोजेनिक इलेक्ट्रॉन माइक्रोस्कोपी क्रायो इलेक्ट्रॉन माइक्रोस्कोपी (क्रायो-ईएम) और दोहरी ध्रुवीकरण इंटरफेरोमेट्री जैसी तकनीकों को नियोजित करता है।

प्रोटीन संरचना आकार में दसियों से लेकर कई हजार अमीनो एसिड तक होती है। भौतिक आकार के अनुसार, प्रोटीन को 1-100 एनएम के बीच नैनोकणों के रूप में वर्गीकृत किया जाता है। प्रोटीन सबयूनिट से बहुत बड़े प्रोटीन कॉम्प्लेक्स बन सकते हैं। उदाहरण के लिए, हजारों एक्टिन अणु माइक्रोफिलामेंट में एकत्र होते हैं।

प्रोटीन सामान्यतः अपने जैविक कार्य को करने में प्रतिवर्ती प्रक्रिया (थर्मोडायनामिक्स) के गठनात्मक परिवर्तन से निकलता है। एक ही प्रोटीन की वैकल्पिक संरचनाओं को अलग-अलग गठनात्मक समावयवता कहा जाता है, और उनके बीच के संक्रमणों को गठनात्मक परिवर्तन कहा जाता है।

प्रोटीन संरचना का स्तर
प्रोटीन संरचना के चार अलग-अलग स्तर हैं।

प्राथमिक संरचना
प्रोटीन की प्राथमिक संरचना पॉलीपेप्टाइड श्रृंखला में अमीनो एसिड के अनुक्रम को संदर्भित करती है। प्राथमिक संरचना पेप्टाइड बॉन्ड्स द्वारा साथ रखी जाती है जो प्रोटीन जैवसंश्लेषण की प्रक्रिया के समय बनाई जाती है। प्रत्येक छोर पर मुक्त समूह की प्रकृति के आधार पर पॉलीपेप्टाइड श्रृंखला के दो सिरों को कार्बोक्सिल टर्मिनस (सी-टर्मिनस) और अमीनो टर्मिनस (एन-टर्मिनस) के रूप में संदर्भित किया जाता है। अवशेषों की गिनती सदैव एन-टर्मिनल अंत (NH2-ग्रुप), जो अंत है जहां अमीनो समूह पेप्टाइड बंधन में सम्मिलित नहीं है। प्रोटीन की प्राथमिक संरचना प्रोटीन के अनुरूप जीन द्वारा निर्धारित की जाती है। डीएनए में न्यूक्लियोटाइड का विशिष्ट अनुक्रम एमआरएनए में प्रतिलेखन (आनुवांशिकी) आनुवांशिकी है, जिसे राइबोसोम द्वारा अनुवाद (जीव विज्ञान) नामक प्रक्रिया में पढ़ा जाता है। फ्रेडरिक सिंगर द्वारा इंसुलिन में अमीनो एसिड के अनुक्रम की खोज की गई, यह स्थापित करते हुए कि प्रोटीन में अमीनो एसिड अनुक्रम को परिभाषित किया गया है। प्रोटीन का अनुक्रम उस प्रोटीन के लिए अद्वितीय होता है, और प्रोटीन की संरचना और कार्य को परिभाषित करता है। एडमैन गिरावट या मास स्पेक्ट्रोमेट्री प्रोटीन पहचान जैसे विधियों से प्रोटीन का अनुक्रम निर्धारित किया जा सकता है। अधिकांशतः, तथापि, इसे आनुवंशिक कोड का उपयोग करके सीधे जीन के अनुक्रम से पढ़ा जाता है। प्रोटीन की चर्चा करते समय अमीनो एसिड अवशेष शब्दों का उपयोग करने की सख्त अनुशंसा की जाती है क्योंकि जब पेप्टाइड बंधन बनता है, तो पानी का अणु खो जाता है, और इसलिए प्रोटीन अमीनो एसिड अवशेषों से बने होते हैं। फास्फारिलीकरण और ग्लाइकोसिलेशन जैसे अनुवाद के बाद का संशोधन को सामान्यतः प्राथमिक संरचना का एक भाग माना जाता है, और इसे जीन से नहीं पढ़ा जा सकता है। उदाहरण के लिए, इंसुलिन 2 श्रृंखलाओं में 51 अमीनो एसिड से बना होता है। श्रृंखला में 31 अमीनो एसिड होते हैं, और दूसरे में 20 अमीनो एसिड होते हैं।

माध्यमिक संरचना


माध्यमिक संरचना वास्तविक पॉलीपेप्टाइड रीढ़ की हड्डी श्रृंखला पर अत्यधिक नियमित स्थानीय उप-संरचनाओं को संदर्भित करती है। दो मुख्य प्रकार की माध्यमिक संरचना, अल्फा हेलिक्स α-हेलिक्स और बीटा स्ट्रैंड β-स्ट्रैंड या बीटा शीट β-शीट्स, लिनस पॉलिंग द्वारा 1951 में सुझाए गए थे। इन माध्यमिक संरचनाओं को मुख्य-श्रृंखला पेप्टाइड समूहों के बीच हाइड्रोजन बांड के पैटर्न द्वारा परिभाषित किया गया है। उनके पास नियमित ज्यामिति है, जो रामचंद्रन भूखंड पर डायहेड्रल कोण ψ और φ के विशिष्ट मूल्यों के लिए विवश है। Α-हेलिक्स और β-शीट दोनों पेप्टाइड बैकबोन में सभी हाइड्रोजन बांड दाताओं और स्वीकारकर्ताओं को संतृप्त करने का विधि दर्शाते हैं। प्रोटीन के कुछ भाग क्रमित होते हैं लेकिन कोई नियमित संरचना नहीं बनाते हैं। उन्हें यादृच्छिक कॉइल के साथ भ्रमित नहीं होना चाहिए, अनफोल्डेड पॉलीपेप्टाइड श्रृंखला जिसमें कोई निश्चित त्रि-आयामी संरचना नहीं होती है। कई अनुक्रमिक माध्यमिक संरचनाएं अतिमाध्यमिक संरचना बना सकती हैं।

तृतीयक संरचना
तृतीयक संरचना एकल प्रोटीन अणु ( एकल पॉलीपेप्टाइड श्रृंखला) द्वारा बनाई गई त्रि-आयामी संरचना को संदर्भित करती है। इसमें प्रोटीन डोमेन सम्मिलित हो सकता है। Α-हेलिसेस और β-प्लीटेड-शीट्स को कॉम्पैक्ट गोलाकार संरचना में जोड़ दिया जाता है। तह गैर-विशिष्ट हाइड्रोफोबिक इंटरैक्शन द्वारा संचालित होता है, पानी से हाइड्रोफोबिक अवशेष का दफन होता है, लेकिन संरचना केवल तभी स्थिर होती है जब प्रोटीन डोमेन के कुछ भागों को विशिष्ट तृतीयक इंटरैक्शन, जैसे नमक पुल (प्रोटीन और सुपरमॉलेक्यूलर) द्वारा लॉक किया जाता है। हाइड्रोजन बॉन्ड, और साइड चेन और डाइसल्फ़ाइड बॉन्ड की तंग पैकिंग होती है। साइटोसोलक प्रोटीन में डाइसल्फ़ाइड बंधन अत्यंत दुर्लभ हैं, क्योंकि साइटोसोल (इंट्रासेल्युलर द्रव) सामान्यतः रिडॉक्स वातावरण है।

चतुर्धातुक संरचना
चतुर्धातुक संरचना त्रि-आयामी संरचना है जिसमें दो या दो से अधिक अलग-अलग पॉलीपेप्टाइड चेन (सबयूनिट्स) का एकत्रीकरण होता है जो एकल कार्यात्मक इकाई (मल्टीमर) के रूप में काम करता है। परिणामी मल्टीमर समान गैर-सहसंयोजक अंतःक्रियाओं और तृतीयक संरचना के रूप में डाइसल्फ़ाइड बांडों द्वारा स्थिर किया जाता है। कई संभावित चतुर्धातुक संरचना संगठन हैं। दो या दो से अधिक पॉलीपेप्टाइड्स (अर्थात् एकाधिक सबयूनिट्स) के संकुलों को मल्टीमर कहा जाता है। विशेष रूप से इसे डिमर (रसायन विज्ञान) कहा जाएगा यदि इसमें दो सबयूनिट हैं, ट्रिमर (रसायन विज्ञान) यदि इसमें तीन सबयूनिट्स हैं, टेट्रामर अगर इसमें चार सबयूनिट हैं, और एक पंचक है अगर इसमें पांच सबयूनिट्स हैं। उपइकाइयां अधिकांशतः समरूपता समूह द्वारा एक दूसरे से संबंधित होती हैं, जैसे कि मंदक में 2-गुना अक्ष। समान सबयूनिट्स से बने मल्टीमर को होमो के उपसर्ग के साथ संदर्भित किया जाता है- और जो विभिन्न सबयूनिट्स से बने होते हैं, उन्हें हेटेरो- के उपसर्ग के साथ संदर्भित किया जाता है, उदाहरण के लिए, हेटेरोटेट्रामर, जैसे हीमोग्लोबिन की दो अल्फा और दो बीटा श्रृंखलाएं।

डोमेन, रूपांकनों, और प्रोटीन संरचना में सिलवटों
प्रोटीन को अधिकांशतः कई संरचनात्मक इकाइयों से मिलकर वर्णित किया जाता है। इन इकाइयों में डोमेन, स्ट्रक्चरल मोटिफ प्रोटीन में, और फोल्ड सम्मिलित हैं। इस तथ्य के अतिरिक्त कि यूकेरियोटिक प्रणालियों में लगभग 100,000 अलग-अलग प्रोटीन व्यक्त किए गए हैं, बहुत कम भिन्न डोमेन, संरचनात्मक रूपांकनों और सिलवटें हैं।

संरचनात्मक डोमेन
संरचनात्मक डोमेन प्रोटीन की समग्र संरचना का तत्व है जो स्व-स्थिरीकरण है और अधिकांशतः प्रोटीन बाकी प्रोटीन श्रृंखला से स्वतंत्र रूप से तह करता है। कई डोमेन जीन या जीन परिवार के प्रोटीन उत्पादों के लिए अद्वितीय नहीं हैं, बल्कि विभिन्न प्रकार के प्रोटीन में दिखाई देते हैं। डोमेन को अधिकांशतः नामित और एकल किया जाता है क्योंकि वे उस प्रोटीन के जैविक कार्य में प्रमुखता से सम्मिलित होते हैं जिससे वे संबंधित होते हैं; उदाहरण के लिए, शांतोडुलिन का कैल्शियम-बाध्यकारी डोमेन। क्योंकि वे स्वतंत्र रूप से स्थिर हैं, जेनेटिक इंजीनियरिंग द्वारा प्रोटीन और दूसरे के बीच काइमेरा (प्रोटीन) प्रोटीन बनाने के लिए डोमेन की अदला-बदली की जा सकती है। प्रोटीन टायरोसिन फॉस्फेट डोमेन और c2 डोमेन जोड़ी जैसे विभिन्न प्रोटीनों में होने वाले कई डोमेन के रूढ़िवादी संयोजन को सुपरडोमेन कहा जाता था जो इकाई के रूप में विकसित हो सकता है।

संरचनात्मक और अनुक्रम प्रारूप
संरचनात्मक रूप और अनुक्रम मूल भाव प्रोटीन त्रि-आयामी संरचना या अमीनो एसिड अनुक्रम के छोटे खंडों को संदर्भित करता है जो बड़ी संख्या में विभिन्न प्रोटीनों में पाए गए थे।

सुपरमाध्यमिक संरचना
तृतीयक प्रोटीन संरचनाओं में एक ही पॉलीपेप्टाइड श्रृंखला पर कई माध्यमिक तत्व हो सकते हैं। सुपरसेकंडरी संरचना माध्यमिक संरचना तत्वों के विशिष्ट संयोजन को संदर्भित करती है, जैसे कि β-α-β इकाइयां या हेलिक्स-टर्न-हेलिक्स आकृति। उनमें से कुछ को संरचनात्मक रूपांकनों के रूप में भी संदर्भित किया जा सकता है।

प्रोटीन फोल्ड
प्रोटीन फोल्ड सामान्य प्रोटीन आर्किटेक्चर को संदर्भित करता है, जैसे हेलिक्स बंडल, β-बैरल, रॉसमैन फोल्ड या प्रोटीन डेटाबेस के संरचनात्मक वर्गीकरण में प्रदान किए गए विभिन्न फोल्ड। संबंधित अवधारणा प्रोटीन टोपोलॉजी है।

प्रोटीन गतिकी और गठनात्मक पहनावा
प्रोटीन स्थिर वस्तुएं नहीं हैं, बल्कि गठनात्मक परिवर्तन के समूहों को खुला छोड़ा करते हैं। इन अवस्थाओं के बीच संक्रमण सामान्यतः नैनोस्कोपिक पैमानों पर होते हैं, और इन्हें कार्यात्मक रूप से प्रासंगिक घटनाओं जैसे कि एलोस्टेरिक विनियमन से जोड़ा गया है और एंजाइम कटैलिसीस। प्रोटीन गतिकी और संरूपण परिवर्तन प्रोटीन को कोशिकाओं के अन्दर नैनोस्केल जैविक मशीन के रूप में कार्य करने की अनुमति देते हैं, अधिकांशतः प्रोटीन जटिल, मल्टी-प्रोटीन कॉम्प्लेक्स के रूप में। उदाहरणों में मोटर प्रोटीन सम्मिलित हैं, जैसे कि मायोसिन, जो मांसपेशियों के संकुचन के लिए उत्तरदायी है, काइनेज, जो सूक्ष्मनलिकाएं के साथ कोशिका केंद्रक से दूर कोशिकाओं के अंदर कार्गो को ले जाता है, और डायनेन, जो न्यूक्लियस की ओर कोशिकाओं के अंदर कार्गो को ले जाता है और सिलिया की एक्सोनमल बीटिंग मोटाइल सिलिया और कशाभिका उत्पन्न करता है। n प्रभाव, मोटाइल सिलियम आणविक परिसरों में संभवतः 600 से अधिक प्रोटीनों से बनी नैनोमशीन है, जिनमें से कई स्वतंत्र रूप से नैनोमैचिन्स के रूप में कार्य करती हैं लचीले लिंकर्स प्रोटीन डोमेन डोमेन और उनके द्वारा जुड़े प्रोटीन लचीलेपन की अनुमति देते हैं अपने बाध्यकारी भागीदारों की भर्ती करें और प्रोटीन गतिकी वैश्विक लचीलापन: एकाधिक डोमेन के माध्यम से लंबी दूरी के आवंटन को प्रेरित करें।

प्रोटीन को अधिकांशतः अपेक्षाकृत स्थिर प्रोटीन तृतीयक संरचना के रूप में माना जाता है जो अन्य प्रोटीन के साथ या एंजाइमी गतिविधि के एक भाग के रूप में प्रभावित होने के बाद गठनात्मक परिवर्तन का अनुभव करता है। चुकीं, प्रोटीन में स्थिरता की अलग-अलग डिग्री हो सकती हैं, और कुछ कम स्थिर वेरिएंट आंतरिक रूप से अव्यवस्थित प्रोटीन होते हैं। ये प्रोटीन स्थिर प्रोटीन तृतीयक संरचना के अभाव में अपेक्षाकृत 'अव्यवस्थित' अवस्था में उपस्थित और कार्य करते हैं। परिणामस्वरूप, निश्चित प्रोटीन तृतीयक संरचना द्वारा उनका वर्णन करना मुश्किल है। आंतरिक रूप से अव्यवस्थित प्रोटीनों के संरूपण की स्थिति का अधिक स्पष्ट और 'गतिशील' प्रतिनिधित्व प्रदान करने के विधियों के रूप में गठनात्मक पहनावा का तैयार किया गया है। प्रोटीन कन्फॉर्मल एन्सेम्बल फाइलें प्रोटीन का प्रतिनिधित्व करती हैं जिसे लचीली संरचना माना जा सकता है। इन फ़ाइलों को बनाने के लिए यह निर्धारित करने की आवश्यकता होती है कि कौन से सैद्धांतिक रूप से संभव प्रोटीन अनुरूपता वास्तव में उपस्थित हैं। दृष्टिकोण यह है कि प्रोटीन डेटा के लिए कम्प्यूटेशनल एल्गोरिदम को प्रयुक्त किया जाए ताकि कन्फॉर्मेशन एनसेंबल फ़ाइल के लिए सबसे अधिक संभावना वाले सेट को निर्धारित करने की प्रयास की जा सके। प्रोटीन एन्सेम्बल डेटाबेस के लिए डेटा तैयार करने के लिए कई तरीके हैं जो दो सामान्य पद्धतियों में आते हैं - पूल और आणविक गतिकी ( एमडी) दृष्टिकोण (आकृति में आरेखित)। पूल आधारित दृष्टिकोण प्रोटीन के अमीनो एसिड अनुक्रम का उपयोग यादृच्छिक अनुरूपताओं का विशाल पूल बनाने के लिए करता है। इस पूल को तब अधिक कम्प्यूटेशनल प्रसंस्करण के अधीन किया जाता है जो संरचना के आधार पर प्रत्येक रचना के लिए सैद्धांतिक मापदंडों का सेट बनाता है। इस पूल से गठनात्मक उपसमुच्चय, जिनके औसत सैद्धांतिक पैरामीटर इस प्रोटीन के लिए ज्ञात प्रयोगात्मक डेटा से निकटता से मेल खाते हैं, का चयन किया जाता है। वैकल्पिक आणविक गतिशीलता दृष्टिकोण समय में कई यादृच्छिक अनुरूपताएं लेता है और उन सभी को प्रायोगिक डेटा के अधीन करता है। यहां प्रयोगात्मक डेटा अनुरूपताओं (जैसे परमाणुओं के बीच ज्ञात दूरी) पर रखी जाने वाली सीमाओं के रूप में कार्य कर रहा है। केवल अनुरूपताएं जो प्रयोगात्मक डेटा द्वारा निर्धारित सीमाओं के अन्दर रहने का प्रबंधन करती हैं, स्वीकार की जाती हैं। यह दृष्टिकोण अधिकांशतः बड़ी मात्रा में प्रयोगात्मक डेटा को अनुरूपताओं पर प्रयुक्त करता है जो बहुत ही कम्प्यूटेशनल रूप से मांग वाला कार्य है।

अत्यधिक गतिशील और आंशिक रूप से सामने आए प्रोटीनों के लिए गठनात्मक पहनावा उत्पन्न किया गया था, जैसे कि अनफोल्डेड प्रोटीन, जैसे कि [ Sic1/Cdc4] कोशिका विभाजन नियंत्रण प्रोटीन p15 पीएएफ,एमकेके7, क्या अशिष्ट है बीटा-सिंक्यूक्लिन और सीडीकेएन1बी है ।

प्रोटीन की तह
जैसा कि इसका अनुवाद किया गया है, पॉलीपेप्टाइड राइबोसोम से अधिकांशतः यादृच्छिक कुंडल के रूप में बाहर निकलते हैं और अपनी मूल अवस्था में मुड़ जाते हैं। प्रोटीन श्रृंखला की अंतिम संरचना को सामान्यतः इसके अमीनो एसिड अनुक्रम (एनफिन्सन की हठधर्मिता) द्वारा निर्धारित किया जाता है।

प्रोटीन स्थिरता
प्रोटीन की थर्मोडायनामिक स्थिरता तह और विकृतीकरण (जैव रसायन) प्रोटीन राज्यों के बीच गिब्स मुक्त ऊर्जा का प्रतिनिधित्व करती है। यह मुक्त ऊर्जा अंतर तापमान के प्रति बहुत संवेदनशील होता है, इसलिए तापमान में बदलाव के परिणामस्वरूप खुलासा या विकृतीकरण हो सकता है। विकृतीकरण (जैव रसायन) के परिणामस्वरूप कार्य की हानि हो सकती है, और मूल स्थिति का हानि हो सकता है। घुलनशील ग्लोबुलर प्रोटीन के स्थिरीकरण की मुक्त ऊर्जा सामान्यतः 50 केजे/मोल से अधिक नहीं होती है। माध्यमिक संरचनाओं के स्थिरीकरण और हाइड्रोफोबिक इंटरैक्शन के माध्यम से आंतरिक कोर के स्थिरीकरण के लिए होने वाली बड़ी संख्या में हाइड्रोजन बांडों को ध्यान में रखते हुए, स्थिरीकरण की मुक्त ऊर्जा बड़ी संख्या के बीच छोटे अंतर के रूप में उभरती है।

प्रोटीन संरचना निर्धारण
प्रोटीन डेटा बैंक में उपलब्ध प्रोटीन संरचनाओं का लगभग 90% एक्सरे क्रिस्टलोग्राफी द्वारा निर्धारित किया गया है। यह विधि किसी को क्रिस्टलीकृत अवस्था में प्रोटीन में इलेक्ट्रॉन के त्रि-आयामी (3-डी) घनत्व वितरण को मापने की अनुमति देती है, और इस तरह निश्चित संकल्प के लिए निर्धारित किए जाने वाले सभी परमाणुओं के 3-डी निर्देशांक का अनुमान लगाती है। ज्ञात प्रोटीन संरचनाओं का लगभग 7% प्रोटीन एनएमआर (एनएमआर) तकनीकों द्वारा प्राप्त किया गया है। बड़े प्रोटीन परिसरों के लिए, क्रायो-इलेक्ट्रॉन माइक्रोस्कोपी प्रोटीन संरचनाओं को निर्धारित कर सकती है। रिज़ॉल्यूशन सामान्यतः एक्स-रे क्रिस्टलोग्राफी या एनएमआर की तुलना में कम होता है, लेकिन अधिकतम रिज़ॉल्यूशन लगातार बढ़ रहा है। यह तकनीक अभी भी बहुत बड़े प्रोटीन कॉम्प्लेक्स जैसे वायरस कोट प्रोटीन और एमिलॉयड फाइबर के लिए विशेष रूप से मूल्यवान है।

सामान्य माध्यमिक संरचना संरचना को वृत्ताकार द्वैतवाद के माध्यम से निर्धारित किया जा सकता है। कंपन स्पेक्ट्रोस्कोपी का उपयोग पेप्टाइड्स, पॉलीपेप्टाइड्स और प्रोटीन की रचना को चिह्नित करने के लिए भी किया जा सकता है। लचीले पेप्टाइड्स और प्रोटीन की संरचनाओं की जांच करने के लिए द्वि-आयामी अवरक्त स्पेक्ट्रोस्कोपी मूल्यवान विधि बन गया है जिसका अन्य विधियों से अध्ययन नहीं किया जा सकता है। प्रोटीन संरचना का अधिक गुणात्मक चित्र अधिकांशतः प्रोटियोलिसिस द्वारा प्राप्त किया जाता है, जो अधिक क्रिस्टलीय प्रोटीन प्रमाणों की जांच के लिए भी उपयोगी होता है। तेजी से समानांतर प्रोटियोलिसिस (फास्टपीपी) सहित इस दृष्टिकोण के उपन्यास कार्यान्वयन, शुद्धिकरण की आवश्यकता के बिना संरचित अंश और इसकी स्थिरता की जांच कर सकते हैं। एक बार प्रोटीन की संरचना प्रयोगात्मक रूप से निर्धारित हो जाने के बाद, उस संरचना के आणविक गतिशीलता सिमुलेशन का उपयोग करके, आगे विस्तृत अध्ययन कम्प्यूटेशनल रूप से किया जा सकता है।

प्रोटीन संरचना डेटाबेस
प्रोटीन संरचना डेटाबेस जो विभिन्न प्रोटीन संरचना निर्धारण प्रोटीन संरचनाओं के आसपास मॉडलिंग की दिनांक करता है। अधिकांश प्रोटीन संरचना डेटाबेस का उद्देश्य प्रोटीन संरचनाओं को व्यवस्थित और एनोटेट करना है, जिससे जैविक समुदाय को प्रायोगिक डेटा तक उपयोगी विधियों से पहुंच प्रदान की जा सके। प्रोटीन संरचना डेटाबेस में सम्मिलित डेटा में अधिकांशतः 3डी निर्देशांक के साथ-साथ प्रायोगिक जानकारी भी सम्मिलित होती है, जैसे कि एक्स-रे क्रिस्टलोग्राफी के लिए यूनिट सेल आयाम और कोण बायोलॉजिकल मैक्रोमोलेक्युलर क्रिस्टलोग्राफी एक्स-रे क्रिस्टलोग्राफी निर्धारित संरचनाएं है। चुकीं अधिकांश उदाहरण, इस स्थितियों में या तो प्रोटीन या प्रोटीन की विशिष्ट संरचना निर्धारण में अनुक्रम की जानकारी भी होती है और कुछ डेटाबेस अनुक्रम आधारित प्रश्नों को करने के लिए साधन भी प्रदान करते हैं, संरचना डेटाबेस की प्राथमिक विशेषता संरचनात्मक जानकारी होती है, जबकि अनुक्रम डेटाबेस पर ध्यान केंद्रित किया जाता है। अनुक्रम जानकारी, और अधिकांश प्रविष्टियों के लिए कोई संरचनात्मक जानकारी नहीं है। कम्प्यूटेशनल बायोलॉजी विज्ञान में कई प्रयासों के लिए प्रोटीन संरचना डेटाबेस महत्वपूर्ण हैं जैसे कि ड्रग डिज़ाइन संरचना आधारित, उपयोग किए गए कम्प्यूटेशनल विधियों को विकसित करने और प्रोटीन के कार्य के बारे में अंतर्दृष्टि प्रदान करने के लिए कुछ विधियों द्वारा उपयोग किए जाने वाले बड़े प्रयोगात्मक डेटासेट प्रदान करने में होती है।

प्रोटीन का संरचनात्मक वर्गीकरण
प्रोटीन संरचनाओं को उनकी संरचनात्मक समानता, सर्किट टोपोलॉजी या एक सामान्य विकासवादी उत्पत्ति के आधार पर समूहीकृत किया जा सकता है। प्रोटीन डेटाबेस का संरचनात्मक वर्गीकरण और कैथ डेटाबेस प्रोटीन के दो भिन्न संरचनात्मक वर्गीकरण प्रदान करते हैं। जब संरचनात्मक समानता बड़ी होती है तो दो प्रोटीन संभवतः सामान्य पूर्वज से अलग हो जाते हैं, और प्रोटीन के बीच साझा संरचना को होमोलॉजी (जीव विज्ञान) का प्रमाण माना जाता है। संरचना समानता का उपयोग तब प्रोटीन को एक साथ प्रोटीन सुपरफैमिली में समूहित करने के लिए किया जा सकता है। यदि साझा संरचना महत्वपूर्ण है लेकिन साझा किया गया अंश छोटा है, तो साझा किया गया टुकड़ा अधिक नाटकीय विकासवादी घटना का परिणाम हो सकता है जैसे कि क्षैतिज जीन स्थानांतरण, और इन टुकड़ों को प्रोटीन सुपरफैमिली में साझा करने वाले प्रोटीन में सम्मिलित होना अब उचित नहीं है। प्रोटीन की टोपोलॉजी का उपयोग प्रोटीन को वर्गीकृत करने के लिए भी किया जा सकता है। गाँठ सिद्धांत और सर्किट टोपोलॉजी क्रमशः चेन क्रॉसिंग और इंट्राचैन कॉन्टैक्ट्स के आधार पर प्रोटीन फोल्ड के वर्गीकरण के लिए विकसित दो टोपोलॉजी फ्रेमवर्क हैं।

प्रोटीन संरचना की कम्प्यूटेशनल भविष्यवाणी
प्रोटीन संरचना के निर्धारण की तुलना में प्रोटीन अनुक्रम की उत्पत्ति बहुत सरल है। चुकीं, प्रोटीन की संरचना प्रोटीन के कार्य में उसके अनुक्रम की तुलना में बहुत अधिक जानकारी देती है। इसलिए, इसके अनुक्रम से प्रोटीन संरचना की कम्प्यूटेशनल भविष्यवाणी के लिए कई विधियाँ विकसित की गई हैं। प्रारंभ से ही भविष्यवाणी के विधियाँ केवल प्रोटीन के अनुक्रम का उपयोग करते हैं। थ्रेडिंग (प्रोटीन अनुक्रम) और समरूपता मॉडलिंग की विधियाँ प्रोटीन परिवार कहे जाने वाले क्रमिक रूप से संबंधित प्रोटीन की प्रायोगिक संरचनाओं से अज्ञात संरचना के प्रोटीन के लिए 3-डी मॉडल का निर्माण कर सकते हैं।

यह भी देखें

 * जैव आणविक संरचना
 * जीन संरचना
 * न्यूक्लिक एसिड संरचना
 * पीसीआरपीआई-डीबी
 * रिबन आरेख प्रोटीन का 3डी योजनाबद्ध प्रतिनिधित्व

अग्रिम पठन

 * 50 Years of Protein Structure Determination Timeline - HTML Version - National Institute of General Medical Sciences at NIH