कैर्रेट 2

From Vigyanwiki

कैर्रेट 2[1] ओपन सोर्स का परिणामी क्लस्टरिंग इंजन शोध है।[2]यह स्वचालित रूप से दस्तावेज़ों के लघु संग्रहों को समूहित कर सकता है, उदा.- विषयगत श्रेणियों में शोध परिणाम या दस्तावेज़ सार इत्यादि। कैर्रेट 2 जावा में लिखा गया है और बीएसडी लाइसेंस के अंतर्गत वितरित किया गया है।

इतिहास

पोलिश में क्लस्टरिंग शोध परिणामों के लिए एसटीसी क्लस्टरिंग एल्गोरिदम की प्रयोज्यता को मान्य करने के लिए अपने एमएससी (MSc) थीसिस के भाग के रूप में कैर्रेट 2 का प्रारंभिक संस्करण 2001 में दाविद वीस द्वारा लागू किया गया था। 2003 में, लिंगो सहित कई अन्य शोध परिणाम क्लस्टरिंग एल्गोरिदम जोड़े गए,[3]उपन्यास टेक्स्ट क्लस्टरिंग एल्गोरिदम विशेष रूप से शोध परिणामों के क्लस्टरिंग के लिए डिज़ाइन किया गया। जबकि कैर्रेट 2 का सोर्स कोड 2002 से उपलब्ध था, यह केवल 2006 में था जब संस्करण 1.0 आधिकारिक रूप में प्रस्तावित किया गया था। उसी वर्ष, संस्करण 2.0 को उत्तम यूजर इंटरफेस और विस्तारित उपकरण समुच्चय के साथ प्रस्तावित किया गया था। 2009 में, संस्करण 3.0 ने ग्रहण रिच क्लाइंट प्लेटफॉर्म के आधार पर क्लस्टरिंग गुणवत्ता, सरलीकृत एपीआई और ट्यूनिंग क्लस्टरिंग के लिए नए जीयूआई आवेदन में महत्वपूर्ण सुधार लाए। 2020 में, संस्करण 4.0.0 ने एपीआई, कोड क्लीनअप और डेस्कटॉप वर्कबेंच को हटाने के लिए और सरलीकरण लाया। संस्करण 4.1.0 कार्यक्षेत्र को वेब-आधारित अनुप्रयोग के रूप में वापस लाता है।

कैर्रेट 2 रिलीज
रिलीज रिलीज़ की तारीख प्रमुख परिवर्तन और नई सुविधाएँ
4.5.0 नवंबर 2022 निर्भरता अद्यतन, बग फिक्स।
4.4.3 अगस्त 2022 निर्भरता अद्यतन, एसटीसी और स्टेमिंग बुनियादी ढांचे के लिए बग फिक्स।
4.4.0, 4.4.1, 4.4.2 दिसंबर 2021 सुरक्षा सुधार और निर्भरता अद्यतन।
4.3.0 जुलाई 2021 मामूली एपीआई परिवर्तन और बग फिक्स। कार्यक्षेत्र में सुधार (DCS खोज दृश्यपटल)।
4.2.0, 4.2.1 मार्च 2021 JSON शब्दकोशों और कार्यक्षेत्र में सुधार। कंप्यूटर प्रोग्राम या प्रणाली में बग को दूर करना।
4.1.0 जनवरी 2021 वेब आधारित कार्यक्षेत्र। JSON शब्दकोश और नए फ़िल्टरिंग विकल्प। एपीआई पॉलिशिंग।
4.0.0 जुलाई 2020 एपीआई परिवर्तन और कोडबेस भर में सरलीकरण। बहिष्कृत प्रौद्योगिकियों और उपकरणों को हटाना। नया दस्तावेज़ीकरण और कोड क्लीनअप।
3.16.2 सितंबर 2019 तृतीय पक्ष पुस्तकालयों को अद्यतन करें (सुरक्षा संबंधी मुद्दे)।
3.16.1 जनवरी 2019 जेएस विज़ुअलाइज़ेशन का अद्यतन। माइक्रोसॉफ्ट बिंग एपीआई v5 से v7 का माइग्रेशन।
3.16.0 मई 2018 जावा 9+ संगतता मुद्दों का ओवरहाल। उबंटू डिस्ट्रोस के लिए वर्कबेंच संगतता। दस्तावेज़ सोर्स अद्यतन और गैर-कार्यात्मक दस्तावेज़ सोर्सों को हटाना।
3.15.1 मार्च 2017 .NET रिलीज़ के लिए एक बग फिक्स जिसके परिणामस्वरूप अप्राप्य वर्तमान कार्यशील निर्देशिका पर अनियंत्रित I/O अपवाद हो सकते हैं।
3.15.0 अक्टूबर 2016 Bing API V2 से V5 संक्रमण। तृतीय पक्ष निर्भरता का उन्नयन। आंतरिक सौंदर्य प्रसाधन।
3.14.0 सितंबर 2016 कार्यक्षेत्र में सुधार (उच्च DPI समर्थन, MacOSX सुधार, बग फिक्स)। PubMed HTTP पर स्विच कर रहा है। अन्य मामूली सुधार।
3.13.0 जुलाई 2016 सर्वलेट एपीआई बग फिक्स, वर्कबेंच बग फिक्स, हटाए गए Google दस्तावेज़ सोर्स, कुछ भाषाओं के लिए निश्चित भाषा कोड।
3.12.0 फरवरी 2016 Morfologik पोलिश शब्दकोश का उन्नयन, ढांचागत परिवर्तन और समायोजन C2 को अधिक सख्त सुरक्षा प्रबंधक नीतियों के तहत संचालित करने की अनुमति देता है।
3.11.0 अक्टूबर 2015 Apache Lucene का अपग्रेड, बग फिक्स और 3.10.x माइनर से परिवर्तनों का रोलअप।
3.10.4 अक्टूबर 2015 मोर्फोलॉजिक पुस्तकालय का उन्नयन।
3.10.3 अगस्त 2015 सोलर में टकराव से बचने के लिए Google अमरूद को दोबारा पैक किया।
3.10.2 जुलाई 2015 वर्कबेंच (अरबी क्लस्टर डिस्प्ले) में मामूली सुधार।
3.10.1 मई 2015 Aduna विज़ुअलाइज़ेशन MacOS वितरण से हटा दिया गया। कार्यक्षेत्र में मामूली सुधार।
3.10.0 मई 2015 विज़ुअलाइज़ेशन अद्यतन। कंप्यूटर प्रोग्राम या प्रणाली में बग को दूर करना। पुस्तकालय निर्भरता अद्यतन।
3.9.4 नवंबर 2014 फोमट्री अपडेट। बहुभाषी क्लस्टरिंग के लिए नई विशेषताएँ। विज़ुअलाइज़ेशन ठीक करता है।
3.9.3 जुलाई 2014 फोमट्री अपडेट। इन्फ्रास्ट्रक्चर फिक्स और ट्वीक्स (jflex, sonatype रिपॉजिटरी URL)।
3.9.2 अप्रैल 2014 फोमट्री एचटीएमएल5 में बग फिक्स।
3.9.1 अप्रैल 2014 बग फिक्स, HTML5 विज़ुअलाइज़ेशन का अपग्रेड।
3.9.0 फरवरी 2014 फ़्लैश की जगह HTML5 विज़ुअलाइज़ेशन, लाइब्रेरी डिपेंडेंसी अपडेट, बग फिक्स।
3.8.1 अक्टूबर 2013 बग फिक्स, कार्यक्षमता में मामूली बदलाव।
3.8.0 जुलाई 2013 बग फिक्स, पुस्तकालय निर्भरता अद्यतन।
3.7.1 मई 2013 मामूली बग फिक्स (3.7.0 रखरखाव रिलीज़)।
3.7.0 अप्रैल 2013 कोर (स्ट्रिंग आईडी) में इंफ्रास्ट्रक्चर परिवर्तन, बेहतर सोलर इंटीग्रेशन एक्सएसएलटी, बड़े इनपुट के लिए वर्कबेंच ट्वीक्स, अपडेटेड डिपेंडेंसी।
3.6.3 अप्रैल 2013 मामूली बग फिक्स और सुधार: सोलर एडॉप्टर XSLT का अनुकूलन, बड़े इनपुट के लिए कार्यक्षेत्र में बदलाव, अद्यतन निर्भरताएँ।
3.6.2 नवंबर 2012 मामूली बग फिक्स और सुधार।
3.6.1 अगस्त 2012 छोटे सुधार।
3.6.0 जून 2012 अवसंरचनात्मक परिवर्तन, रीफैक्टरिंग और बग फिक्स।
3.5.3 दिसंबर 2011 गिटहब में माइग्रेशन के परिणामस्वरूप इंफ्रास्ट्रक्चर अपडेट। वर्कबेंच SWT 3.7.1 के लिए अद्यतन।
3.5.2 सितंबर 2011 दस्तावेज़ क्लस्टरिंग सर्वर में अजाक्स समर्थन, बिंग दस्तावेज़ सोर्स में सुधार, वर्कबेंच सुधार, बग फिक्स।
3.5.1 जून 2011 बग फिक्स, विज़ुअलाइज़ेशन इंटीग्रेशन सुधार, Yahoo BOSS API के लिए समर्थन हटा दिया गया।
3.5.0 मई 2011 फोमट्री विज़ुअलाइज़ेशन, बाइसेक्टिंग के-मतलब क्लस्टरिंग, संसाधन प्रबंधन में सुधार
3.4.3 मार्च 2011 मावेन केंद्रीय भंडार को वितरण
3.4.2 अक्टूबर 2010 कंप्यूटर प्रोग्राम या प्रणाली में बग को दूर करना
3.4.1 सितंबर 2010 Solr 1.4.x संगतता पैकेज, बग फिक्स
3.4.0 अगस्त 2010 गाजर² क्लस्टरिंग को कॉल करने के लिए .NET API
3.3.0 अप्रैल 2010 एसटीसी क्लस्टरिंग एल्गोरिथम में महत्वपूर्ण मापनीयता सुधार
3.2.0 मार्च 2010 क्लस्टरिंग अरबी और कोरियाई सामग्री के लिए प्रायोगिक समर्थन, बैच मोड में क्लस्टरिंग के लिए कमांड लाइन एप्लिकेशन, एलजीपीएल -लाइसेंस प्राप्त निर्भरताएं हटा दी गईं
3.1.0 सितंबर 2009 क्लस्टरिंग चीनी सामग्री के लिए प्रायोगिक समर्थन, अपाचे सोलर के लिए खोज परिणाम क्लस्टरिंग प्लगइन
3.1.0 सितंबर 2009 क्लस्टरिंग चीनी सामग्री के लिए प्रायोगिक समर्थन, अपाचे सोलर के लिए खोज परिणाम क्लस्टरिंग प्लगइन
3.0.1 मार्च 2009 दस्तावेज़ क्लस्टरिंग कार्यक्षेत्र मैक ओएस एक्स के लिए उपलब्ध है
3.0.0 जनवरी 2009 दस्तावेज़ क्लस्टरिंग वर्कबेंच गाजर² क्लस्टरिंग के साथ आसान प्रयोग के लिए जोड़ा गया, मूल रूप से सरलीकृत जावा एपीआई, खोज परिणाम क्लस्टरिंग वेब एप्लिकेशन को फिर से लागू किया गया, उपयोगकर्ता मैनुअल उपलब्ध
2.1.0 अगस्त 2007 क्लस्टरिंग को REST सेवा के रूप में उजागर करने के लिए दस्तावेज़ क्लस्टरिंग सर्वर जोड़ा गया
2.0.0 सितंबर 2006 खोज परिणाम क्लस्टरिंग वेब अनुप्रयोग का नया उपयोगकर्ता इंटरफ़ेस
1.0.0 जनवरी 2006 पहला आधिकारिक रिलीज, सोर्सफोर्ज पर बायनेरिज़ उपलब्ध
0.0.0 2002 से इनक्यूबेशन रिलीज़, सोर्स कोड SourceForge पर उपलब्ध है
Carrot2
Developer(s)कैर्रेट शोध
Stable release
4.5.0 / November 3, 2022 (2022-11-03)
Repositorygithub.com/carrot2/carrot2/
Written inJava
Operating systemक्रॉस-प्लेटफ़ॉर्म
Typeटेक्स्ट माइनिंग और क्लस्टर विश्लेषण
Licenseबीएसडी लाइसेंस
Websitesearch.carrot2.org

आर्किटेक्चर

कैर्रेट 2 4.0 मुख्य रूप से भाषा-विशिष्ट संसाधनों, एल्गोरिथम कॉन्फ़िगरेशन और निष्पादन के प्रबंधन के लिए सार्वजनिक एपीआई के साथ जावा प्रोग्रामिंग लाइब्रेरी करता है। अन्य भाषाओं के साथ इंटर-ऑपरेबिलिटी के लिए एचटीटीपी (HTTP)/रेस्ट (REST) घटक (दस्तावेज़ क्लस्टरिंग सर्वर) प्रदान किया जाता है।

क्लस्टरिंग एल्गोरिदम

कैर्रेट 2 कुछ दस्तावेज़ क्लस्टरिंग एल्गोरिदम प्रदान करता है जो क्लस्टर लेबल की गुणवत्ता पर बल देता है:

  • लिंगो:[1] क्लस्टरिंग एल्गोरिदम एकवचन मूल्य अपघटन पर आधारित है I
  • एसटीसी:[2] प्रत्यय ट्री क्लस्टरिंग पर आधारित है I

स्पिन-ऑफ

कैर्रेट शोध

कैर्रेटशोध,[4] कैर्रेट 2 परियोजना का वाणिज्यिक स्पिन-ऑफ, के आगे के विकास पर कार्य करता है, रीयल-टाइम टेक्स्ट क्लस्टरिंग एल्गोरिदम प्रदान करता है[3] जो कैर्रेट 2 के रूप के साथ-साथ खुले सोर्स पर सॉफ्टवेयर के आधार पर पाठ खनन परामर्श सेवाएं प्रदान करता है।

कैर्रेट शोध लैब्स

कैर्रेट 2 ने सर्च लैब्स के आश्रय में प्रस्तावित कई स्वतंत्र ओपन सोर्स परियोजनाओं को उत्पन्न किया।[5] इस कार्य में भाग के रूप में निम्नलिखित परियोजनाएं प्रकाशित की गई हैं या प्रकाशित की गई थीं:

  • रैंडमाइज्ड टेस्टिंग: प्रत्येक परीक्षण को अल्प भिन्न (यादृच्छिक) चलाने के लिए अंतर्निहित उपयोगिताओं के साथ जे इकाई परीक्षण धावक, लोड संतुलन और अन्य बेल्स के समानांतर जेवीएम (JVMs) पर जे इकाई परीक्षण चलाने के लिए भी एएनटी कार्य करता है।
  • जावा के लिए उच्च प्रदर्शन आदिम संग्रह (एचपीपीसी): जावा के लिए सूची, समुच्चय, मानचित्र और प्रिमिटिव्स के अन्य संग्रह उच्चतम प्रदर्शन और मेमोरी दक्षता के लिए प्रदर्शित किए गए हैं।
  • स्मार्टस्प्राइट्स: सीएसएस स्प्राइट्स को पूर्ण रूप से स्वचालित सुरक्षा; स्प्राइटेड छवियों को जोड़ते या परिवर्तित करते सीएसएस में कोई निरुद्देश्य कॉपी और पेस्ट नहीं करना चाहिए।

बंद परियोजनाएं:

  • जे सफ़्फ़िक्स ऐरेस: विभिन्न प्रदर्शन और स्मृति विशेषताओं के साथ प्रत्यय सरणी डेटा संरचना के कई जावा कार्यान्वयन है।
  • जे इकाई बेंचमार्क्स: जेइकाई4 परीक्षणों को जीसी मॉनिटरिंग, समय विचरण माप और सरल ग्राफिकल विज़ुअलाइज़ेशन के साथ प्रदर्शन माइक्रो-बेंचमार्क में परिवर्तन के लिए एक्सटेंशन का समुच्चय हैं।

यह भी देखें

ओपन सॉफ्टवेयर पोर्टल

संदर्भ

  1. 1.0 1.1 Stanisław Osiński, Dawid Weiss: A Concept-Driven Algorithm for Clustering Search Results. IEEE Intelligent Systems, May/June, 3 (vol. 20), 2005, pp. 48–54.
  2. 2.0 2.1 Oren Zamir, Oren Etzioni: Web Document Clustering: A Feasibility Demonstration, Proceedings of the 21st annual international ACM SIGIR conference on Research and development in information retrieval (1998), pp. 46–54
  3. 3.0 3.1 Carrot Search s.c. "गाजर खोज: Lingo3G: टेक्स्ट दस्तावेज़ क्लस्टरिंग इंजन".
  4. Carrot Search s.c. "गाजर खोज: दस्तावेज़ क्लस्टरिंग और विज़ुअलाइज़ेशन सॉफ़्टवेयर".
  5. Carrot Search s.c. "गाजर खोज लैब्स".