केप्लर वैज्ञानिक कार्यप्रवाह प्रणाली

केप्लर वैज्ञानिक कार्यप्रवाह प्रणाली को डिज़ाइन करने, निष्पादित करने, पुन: उपयोग करने, विकसित करने, संग्रह करने एवं विचारित करने के लिए निःशुल्क सॉफ़्टवेयर प्रणाली है।  केप्लर की सुविधाएं प्रक्रिया एवं डेटा निरीक्षण, ​​उद्गम जानकारी एवं उच्च गति डेटा संचलन प्रदान करती हैं। सामान्य रूप से कार्यप्रवाह, एवं विशेष रूप से वैज्ञानिक कार्यप्रवाह, निर्देशित ग्राफ होते हैं जहां नोड्स भिन्न-भिन्न कम्प्यूटेशनल घटकों का प्रतिनिधित्व करते हैं, एवं किनारे उन पथों का प्रतिनिधित्व करते हैं जिनके साथ डेटा एवं परिणाम घटकों के मध्य प्रवाहित हो सकते हैं। केप्लर में, नोड्स को 'एक्टर' एवं किनारों को 'चैनल' कहा जाता है। केपलर में डेस्कटॉप वातावरण में कार्यप्रवाह की रचना करने के लिए  ग्राफिकल यूजर इंटरफ़ेस, जीयूआई के अंदर एवं कमांड-लाइन से स्वतंत्र रूप से कार्यप्रवाह निष्पादित करने के लिए  रनटाइम इंजन एवं  वितरित कंप्यूटिंग विकल्प सम्मिलित है जो कार्यप्रवाह कार्यों को कंप्यूटर क्लस्टर में कंप्यूट नोड्स के मध्य वितरित करने की अनुमति देता है। या ग्रिड कंप्यूटिंग केप्लर प्रणाली मुख्य रूप से कम्प्यूटेशनल कार्यों को व्यवस्थित करने के लिए कार्यप्रवाह रूपक के उपयोग को लक्षित करती है जो विशेष वैज्ञानिक विश्लेषण एवं मॉडलिंग लक्ष्यों की ओर निर्देशित होते हैं। इस प्रकार, केपलर वैज्ञानिक कार्यप्रवाह सामान्यतः गणनाओं की श्रृंखला में  चरण से दूसरे चरण तक डेटा के प्रवाह को मॉडल करते हैं जो कुछ वैज्ञानिक लक्ष्य प्राप्त करते हैं।

वैज्ञानिक कार्यप्रवाह
वैज्ञानिक कार्यप्रवाह डेटा एवं प्रक्रियाओं को विन्यास योग्य, संरचित चरणों के समूह में संयोजित करने की प्रक्रिया है, जो वैज्ञानिक समस्या के लिए अर्ध-स्वचालित कम्प्यूटेशनल समाधान प्रारम्भ करता है। वैज्ञानिक कार्यप्रवाह प्रणालियाँ प्रायः विभिन्न प्रविधियों को संयोजित करने के साथ-साथ उनका उपयोग करने के लिए कुशल प्रविधियों के लिए ग्राफिकल यूजर इंटरफेस प्रदान करती हैं, एवं इस प्रकार वैज्ञानिकों की दक्षता में वृद्धि होती है।

वैज्ञानिक डेटा तक पहुंच
केप्लर वैज्ञानिक डेटा तक सीधी पहुंच प्रदान करता है जिसे सामान्यतः उपयोग किए जाने वाले कई डेटा अभिलेखागार में संग्रहीत किये गए है। उदाहरण के लिए, केपलर नॉलेज नेटवर्क फॉर बायोकॉम्प्लेक्सिटी (केएनबी) मेटाकैट सर्वर में संग्रहीत डेटा तक पहुंच प्रदान करता है एवं पारिस्थितिक मेटाडेटा भाषा का उपयोग करके वर्णन किया गया है। समर्थित अतिरिक्त डेटा स्रोतों में डीआइजीआईआर

प्रोटोकॉल, OPeNDAP प्रोटोकॉल, ग्रिडएफटीपी, जेडीबीसी, भंडारण संसाधन दलाल एवं अन्य का उपयोग करके पहुंच योग्य डेटा सम्मिलित होते है।

संगणना के मॉडल
केपलर कई अन्य जैव सूचना विज्ञान कार्यप्रवाह प्रबंधन प्रणालियों से भिन्न है, जिसमें यह कार्यप्रवाह मॉडल की संरचना को उसके गणना मॉडल से भिन्न करता है, जैसे कि कार्यप्रवाह की गणना के लिए विभिन्न मॉडल किसी दिए गए कार्यप्रवाह ग्राफ़ से बंधे हो सकते हैं। केप्लर को टॉलेमी प्रोजेक्ट (कंप्यूटिंग) से गणना के कई सामान्य मॉडल उत्तराधिकार में मिले हैं, जिनमें सिंक्रोनस डेटा फ्लो (एसडीएफ), सतत समय (सीटी), प्रोसेस नेटवर्क (पीएन), एवं डायनेमिक डेटा फ्लो (डीडीएफ) सम्मिलित हैं।

पदानुक्रमित कार्यप्रवाह
केप्लर कार्यप्रवाह में पदानुक्रम का समर्थन करता है, जो जटिल कार्यों को सरल घटकों से बनाने की अनुमति देता है। यह सुविधा कार्यप्रवाह लेखकों को पुन: प्रयोज्य, मॉड्यूलर घटकों का निर्माण करने की अनुमति देती है जिन्हें कई भिन्न-भिन्न कार्यप्रवाह में उपयोग के लिए रखा जा सकता है।

कार्यप्रवाह शब्दार्थ
केप्लर ओन्टोलॉजी (सूचना विज्ञान) से ली गई प्रतिबंधो का उपयोग करके कार्यप्रवाह घटकों की अर्थपूर्ण टिप्पणी के लिए मॉडल प्रदान करता है। ये टिप्पणी कई उन्नत सुविधाओं का समर्थन करते हैं, जिनमें उत्तम शोध क्षमताएं, स्वचालित कार्यप्रवाह सत्यापन एवं उत्तम कार्यप्रवाह संपादन सम्मिलित होता हैं।

कार्यप्रवाह विचारित करना
केप्लर घटकों को कार्यप्रवाह या घटक को केपलर आर्काइव (KAR) फ़ाइल में निर्यात करके विचारित किया जा सकता है, जो जावा से JAR फ़ाइल प्रारूप का विस्तार है। जो KAR फ़ाइल बन जाने के पश्चात, इसे सहकर्मियों को ईमेल किया जा सकता है, वेब साइटों पर विचारित किया जा सकता है, या केपलर कंपोनेंट रिपोजिटरी पर अपलोड किया जा सकता है। कंपोनेंट रिपॉजिटरी केप्लर कार्यप्रवाह को विचारित करने के लिए केंद्रीकृत प्रणाली है जो वेब पोर्टल एवं वेब सेवा अंतरापृष्ठ दोनों के माध्यम से पहुंच योग्य होती है। उपयोगकर्ता सीधे केपलर कार्यप्रवाह कंपोज़िशन जीयूआई के अंदर से रिपॉजिटरी से घटकों का शोध एवं उपयोग कर सकते हैं।

उद्गम
वैज्ञानिक कार्यप्रवाह में प्रोवेंस महत्वपूर्ण अवधारणा है, क्योंकि यह वैज्ञानिकों को उनके परिणामों की उत्पत्ति को समझने, उनके प्रयोगों को दोहराने एवं डेटा उत्पादों को प्राप्त करने के लिए उपयोग की जाने वाली प्रक्रियाओं को मान्य करने की अनुमति देता है। कार्यप्रवाह को पुन: प्रस्तुत करने के लिए, उद्गम जानकारी दर्ज की जानी चाहिए जो इंगित करती है कि डेटा कहाँ उत्पन्न हुआ, इसे कैसे बदला गया, एवं कौन से घटक एवं कौन से पैरामीटर सेटिंग्स का उपयोग किया गया था। इससे अन्य वैज्ञानिकों को परिणामों की पुष्टि करते हुए प्रयोग को दोबारा करने की अनुमति मिल जाएगी। वर्तमान प्रणालियों में अंतिम उपयोगकर्ताओं को वैज्ञानिक रूप से सार्थक तरीकों से उद्गम जानकारी को क्वेरी करने की अनुमति देने के लिए बहुत कम समर्थन मौजूद है, विशेष रूप से जब उन्नत कार्यप्रवाह निष्पादन मॉडल सरल डीएजी (प्रक्रिया नेटवर्क में) से परे जाते हैं।

केप्लर इतिहास
केपलर प्रोजेक्ट 2002 में साइंस एनवायरनमेंट फॉर इकोलॉजिकल नॉलेज (SEEK) प्रोजेक्ट के सदस्यों द्वारा बनाया गया था। एवं वैज्ञानिक डेटा प्रबंधन (एसडीएम) परियोजना। इस परियोजना की स्थापना कैलिफोर्निया विश्वविद्यालय, सांता बारबरा के पारिस्थितिक विश्लेषण एवं संश्लेषण के लिए राष्ट्रीय केंद्र (एनसीईएएस) एवं कैलिफोर्निया विश्वविद्यालय, सैन डिएगो के सैन डिएगो सुपरकंप्यूटर सेंटर के शोधकर्ताओं द्वारा की गई थी। केपलर टॉलेमी II का विस्तार करता है, जो यूसी बर्कले में विकसित समवर्ती, वास्तविक समय, एम्बेडेड सिस्टम के मॉडलिंग, सिमुलेशन एवं डिजाइन के लिए सॉफ्टवेयर प्रणाली है। केप्लर पर सहयोग तेजी से बढ़ा क्योंकि विभिन्न वैज्ञानिक विषयों के सदस्यों ने विश्लेषण एवं मॉडलिंग के लिए वैज्ञानिक कार्यप्रवाह के लाभों को महसूस किया एवं सिस्टम में योगदान देना शुरू कर दिया। 2008 तक, केपलर सहयोगी कई विज्ञान विषयों से आते हैं, जिनमें पारिस्थितिकी, आणविक जीव विज्ञान, आनुवंशिकी, भौतिकी, रसायन विज्ञान, संरक्षण विज्ञान, समुद्र विज्ञान, जल विज्ञान, पुस्तकालय विज्ञान, कंप्यूटर विज्ञान एवं अन्य सम्मिलित हैं। केप्लर कार्यप्रवाह ऑर्केस्ट्रेशन इंजन है जिसका उपयोग ्टर के रूप में कार्य को अधिक आसान बनाने के लिए किया जाता है।

यह भी देखें

 * अपाचे टवेर्ना
 * डिस्कवरी नेट
 * विज़ट्रेल्स
 * लोनी पाइपलाइन
 * जैव सूचना विज्ञान कार्यप्रवाह प्रबंधन प्रणाली
 * डेटाऑन अन्वेषक टूलकिट

बाहरी संबंध

 * Kepler Project website
 * Kepler Component Repository
 * Ptolemy II project website
 * Knowledge Network for Biocomplexity (KNB) Data archive
 * List of software tools related to workflows on the DataONE website