ऑरेंज (सॉफ्टवेयर)

ऑरेंज ओपन स्रोत सॉफ्टवेयर, डेटा विज़ुअलाइज़ेशन, मशीन लर्निंग और डेटा माइनिंग उपकरण किट है। यह शोध पूर्ण तीव्र गुणात्मक डेटा विश्लेषण और इंटरैक्टिव डेटा सूचना विज़ुअलाइज़ेशन के लिए दृश्य प्रोग्रामिंग फ्रंट-एंड की सुविधा प्रदान करता है।



विवरण
ऑरेंज डेटा विज़ुअलाइज़ेशन, मशीन लर्निंग, डेटा माइनिंग और डेटा विश्लेषण के लिए घटक-आधारित विज़ुअल प्रोग्रामिंग सॉफ़्टवेयर पैकेज है।

ऑरेंज घटकों को विगेट्स कहा जाता है और वे सरल डेटा विज़ुअलाइज़ेशन, उप-समुच्चय चयन और प्री-प्रोसेसिंग से लेकर लर्निंग एल्गोरिदम के अनुभवजन्य मूल्यांकन तक होते हैं और द्वितीय भविष्य कहने वाला मॉडलिंग है।

विज़ुअल प्रोग्रामिंग इंटरफ़ेस के माध्यम से कार्यान्वित किया जाता है जिसमें पूर्वनिर्धारित या उपयोगकर्ता-डिज़ाइन किए गए विजेट्स को जोड़कर वर्कफ़्लोज़ बनाए जाते हैं, जबकि उन्नत उपयोगकर्ता डेटा परिवर्तन और विजेट परिवर्तन के लिए ऑरेंज को पायथन लाइब्रेरी के रूप में उपयोग कर सकते हैं।

सॉफ्टवेयर
ऑरेंज जीपीएल के अनुसार प्रस्तावित ओपन सोर्स सॉफ्टवेयर पैकेज है। 3.0 तक के संस्करणों में सी++ में मुख्य घटक सम्मलित हैं जिनमें पायथन में रैपर गिटहब पर, आवरण फंक्शन के साथ उपलब्ध हैं। संस्करण 3.0 के पश्चात से, ऑरेंज वैज्ञानिक कंप्यूटिंग के लिए साधारण पायथन ओपन-सोर्स लाइब्रेरी का उपयोग करता है, जैसे कि सुन्न, स्किपी और स्किकिट-लर्न, जबकि इसका ग्राफिकल यूजर इंटरफेस क्रॉस-प्लेटफॉर्म क्यूटी (सॉफ्टवेयर) रूपरेखा के अंतर्गत कार्य करता है।

डिफ़ॉल्ट स्थापना में 6 विजेट सेट (डेटा, विज़ुअलाइज़, वर्गीकृत, प्रतिगमन, मूल्यांकन और अनुपयोगी) में कई मशीन लर्निंग, प्री-प्रोसेसिंग और डेटा विज़ुअलाइज़ेशन एल्गोरिदम सम्मलित हैं। अतिरिक्त कार्यात्मकता ऐड-ऑन (जैव सूचना विज्ञान, डेटा फ्यूजन और टेक्स्ट-माइनिंग) के रूप में उपलब्ध हैं।

ऑरेंज मैकओएस, माइक्रोसॉफ़्ट विंडोज़ और लिनक्स पर समर्थित है और इसे पायथन पैकेज इंडेक्स रिपॉजिटरी (पाइप इंस्टॉल ऑरेंज 3) से भी इंस्टॉल किया जा सकता है।

सुविधाएँ
ऑरेंज में एक कैनवास इंटरफ़ेस (कंप्यूटिंग) होता है, जिस पर उपयोगकर्ता विजेट रखता है और डेटा विश्लेषण वर्कफ़्लो बनाता है। विजेट डेटा पढ़ने, डेटा तालिका दिखाने, सुविधाओं का चयन करने, प्रशिक्षण भविष्यवाणियों, सीखने के एल्गोरिदम की तुलना करने, डेटा तत्वों की कल्पना करने आदि जैसी बुनियादी कार्यक्षमताओं की प्रस्तुति करते हैं। उपयोगकर्ता अंतःक्रियात्मक रूप से विज़ुअलाइज़ेशन का पता लगा सकता है या चयनित सबसेट को अन्य विजेट्स में फीड कर सकता है।

कैनवास: डेटा विश्लेषण के लिए ग्राफिकल फ्रंट-एंड
 * विजेट:
 * डेटा: डेटा इनपुट, डेटा फ़िल्टरिंग, नमूनाकरण, अभियोग, सुविधा हेरफेर और सुविधा चयन के लिए विजेट
 * विज़ुअलाइज़ करें: सामान्य विज़ुअलाइज़ेशन (बॉक्स प्लॉट, हिस्टोग्राम, स्कैटर प्लॉट) और मल्टीवेरेट विज़ुअलाइज़ेशन (मोज़ेक डिस्प्ले, सीव डायग्राम) के लिए विजेट।
 * वर्गीकृत करें: वर्गीकरण के लिए पर्यवेक्षित पेपर लर्निंग एल्गोरिदम का एक सेट
 * प्रतिगमन: प्रतिगमन के लिए पर्यवेक्षित पेपर लर्निंग एल्गोरिदम का एक सेट
 * मूल्यांकन करें: क्रॉस-वैलिडेशन, सैंपलिंग-आधारित प्रक्रियाएं, विश्वसनीयता अनुमान और भविष्यवाणी विधियों का स्कोरिंग
 * अनपर्यवेक्षित: क्लस्टर विश्लेषण (के-मीन्स, पदानुक्रमित क्लस्टरिंग) और डेटा प्रोजेक्शन तकनीक (बहुआयामी स्केलिंग, प्रमुख घटक विश्लेषण, पत्राचार विश्लेषण) के लिए अनसुपरवाइज्ड लर्निंग एल्गोरिदम।
 * ऐड-ऑन:
 * एसोसिएट: बार-बार आइटम सेट करने और एसोसिएशन नियम सीखने के लिए विजेट
 * जैव सूचना विज्ञान: जीन सेट विश्लेषण, जीन सेट संवर्धन, और पाथवे पुस्तकालयों तक पहुंच के लिए विजेट
 * डेटा फ्यूजन: विभिन्न डेटा सेटों को फ्यूज करने के लिए विजेट,सामूहिक मैट्रिक्स फैक्टराइजेशन और अव्यक्त कारकों की खोज
 * शैक्षिक: शिक्षण पेपर सीखने की अवधारणाओं के लिए विजेट, जैसे कि के-मीन्स क्लस्टरिंग, बहुपद प्रतिगमन, स्टोकेस्टिक ग्रेडिएंट डिसेंट, ...
 * भू: भू-स्थानिक विश्लेषण के साथ कार्य करने के लिए विजेट
 * इमेज एनालिटिक्स: इमेज और इमेज नेट शब्द एम्बेडिंग के साथ कार्य करने के लिए विजेट
 * नेटवर्क: ग्राफ और नेटवर्क सिद्धांत के लिए विजेट
 * टेक्स्ट माइनिंग: प्राकृतिक भाषा प्रसंस्करण और टेक्स्ट माइनिंग के लिए विजेट्स
 * समय श्रृंखला: समय श्रृंखला विश्लेषण और मॉडलिंग के लिए विजेट
 * स्पेक्ट्रोस्कोपी:(हाइपर)हाइपरस्पेक्ट्रल इमेजिंग के विश्लेषण और विज़ुअलाइज़ेशन के लिए विजेट |



उद्देश्य
कार्यक्रम प्रयोग चयन, अनुशंसा प्रणाली और भविष्य कहने वाला मॉडलिंग के लिए एक मंच प्रदान करता है और इसका उपयोग बायोमेडिसिन, जैव सूचना विज्ञान, जीनोमिक्स और शिक्षण में किया जाता है। विज्ञान में, इसका उपयोग नई पेपर लर्निंग एल्गोरिदम के परीक्षण और आनुवंशिकी और जैव सूचना विज्ञान में नई तकनीकों को लागू करने के लिए एक मंच के रूप में किया जाता है। शिक्षा में, जीव विज्ञान, बायोमेडिसिन और सूचना विज्ञान के छात्रों को पेपर सीखने और डेटा खनन विधियों को पढ़ाने के लिए इसका प्रयोग किया गया था।

एक्सटेंशन
ऑरेंज पर विभिन्न परियोजनाएं ऐड-ऑन के साथ मुख्य घटकों का विस्तार करके या कार्यान्वित दृश्य प्रोग्रामिंग सुविधाओं और जीयूआई का लाभ उठाने के लिए केवल ऑरेंज कैनवस का उपयोग करके निर्माण करती हैं।


 * ओएसिस - ऑरेंज सिंक्रोट्रॉन सुइट
 * एससी ऑरेंज - सिंगल सेल बायोस्टैटिस्टिक्स
 * क्वासर - प्राकृतिक विज्ञान में डेटा विश्लेषण

इतिहास

 * 1996 में, लजुब्जाना विश्वविद्यालय और जोज़ेफ़ स्टीफ़न संस्थान ने एमएल का विकास प्रारम्भ किया, जो C++ में एक पेपर लर्निंग फ्रेमवर्क है।
 * 1997 में, पेपर लर्निंग के लिए पायथन (प्रोग्रामिंग लैंग्वेज) बाइंडिंग विकसित की गई थी, जो उभरते हुए पायथन मॉड्यूल के साथ मिलकर ऑरेंज नामक एक संयुक्त रूपरेखा का निर्माण करती है।
 * बाद के वर्षों के दौरान, डेटा माइनिंग और पेपर लर्निंग के लिए अधिकांश प्रमुख एल्गोरिदम C++ (ऑरेंज कोर) या पायथन मॉड्यूल में विकसित किए गए हैं।
 * 2002 में, पीडब्लूएम (विंडो मैनेजर) का उपयोग करके एक लचीला ग्राफिकल यूजर इंटरफेस बनाने के लिए पहला प्रोटोटाइप डिजाइन किया गया था।
 * 2003 में, पीईक्यूटी पायथन बाइंडिंग का उपयोग करके क्यूटी (सॉफ्टवेयर) फ्रेमवर्क के लिए ग्राफिकल यूजर इंटरफेस को नया रूप दिया गया और फिर से विकसित किया गया। दृश्य प्रोग्रामिंग ढांचे को परिभाषित किया गया था, और विगेट्स (डेटा विश्लेषण पाइपलाइन के ग्राफिकल घटक) का विकास प्रारम्भ हो गया है।
 * 2005 में जैव सूचना विज्ञान में डेटा विश्लेषण के लिए एक्सटेंशन बनाए गए थे।
 * 2008 में,मैकओएस एक्स डीएमजी और फिंक-आधारित स्थापना पैकेज विकसित किए गए थे।
 * 2009 में,100 से अधिक विजेट बनाए गए और रखे गए थे।
 * 2009 से,ऑरेंज 2.0 बीटा में है और वेब साइट दैनिक संकलन चक्र के आधार पर इंस्टॉलेशन पैकेज प्रदान करती है।
 * 2012 में,पुराने मॉड्यूल-आधारित संरचना की जगह, नया ऑब्जेक्ट पदानुक्रम लगाया गया था।
 * 2013 में,ग्राफिकल यूजर इंटरफेस के महत्वपूर्ण नए स्वरूप में एक नया टूलबॉक्स और वर्कफ़्लो का चित्रण सम्मिलित था।
 * 2015 में,ऑरेंज 3.0 रिलीज़ हुई।
 * 2016 में,ऑरेंज संस्करण 3.3 में है। विकास मासिक स्थिर रिलीज चक्र का उपयोग करता है।

अग्रिम पठन

 * Demšar, Janez and Blaž Zupan, Orange: Data Mining Fruitful and Fun - A Historical Perspective, Informatica 37, pgs. 55–60, (2013).
 * Capurso M., Data Science and Engineering - A learning path – Volume 1: Methodological Aspects, Data Acquisition, Management and Cleaning, Analysis and Visualization in the Python-based Orange environment , Amazon , ISBN                              979-8825476490
 * Capurso M. Data Science and Engineering - A learning path - Volume 2 Exploratory Data Analysis, Metrics, Models: with applications in the Orange Python-based environment, Amazon, ISBN 979-8358265325

इस पेज में लापता आंतरिक लिंक की सूची

 * पायथन (प्रोग्रामिंग भाषा)
 * मैक ओएस
 * GitHub
 * Numpy
 * फीचर चयन
 * डाटा संलयन
 * अनियंत्रित शिक्षा
 * एसोसिएशन नियम सीखना
 * पर्यवेक्षित अध्ययन
 * बायोइनफॉरमैटिक्स
 * सिफारिश प्रणाली
 * फिंक (सॉफ्टवेयर)

बाहरी संबंध

 * OASYS
 * scOrange
 * Quasar
 * Quasar