कैर्रेट 2

कैर्रेट 2 ओपन सोर्स का परिणामी क्लस्टरिंग इंजन शोध है। यह स्वचालित रूप से दस्तावेज़ों के लघु संग्रहों को समूहित कर सकता है, उदा.- विषयगत श्रेणियों में शोध परिणाम या दस्तावेज़ सार इत्यादि। कैर्रेट 2 जावा में लिखा गया है और बीएसडी लाइसेंस के अंतर्गत वितरित किया गया है।

इतिहास
पोलिश में क्लस्टरिंग शोध परिणामों के लिए एसटीसी क्लस्टरिंग एल्गोरिदम की प्रयोज्यता को मान्य करने के लिए अपने एमएससी (MSc) थीसिस के भाग के रूप में कैर्रेट 2 का प्रारंभिक संस्करण 2001 में दाविद वीस द्वारा लागू किया गया था। 2003 में, लिंगो सहित कई अन्य शोध परिणाम क्लस्टरिंग एल्गोरिदम जोड़े गए, उपन्यास टेक्स्ट क्लस्टरिंग एल्गोरिदम विशेष रूप से शोध परिणामों के क्लस्टरिंग के लिए डिज़ाइन किया गया। जबकि कैर्रेट 2 का सोर्स कोड 2002 से उपलब्ध था, यह केवल 2006 में था जब संस्करण 1.0 आधिकारिक रूप में प्रस्तावित किया गया था। उसी वर्ष, संस्करण 2.0 को उत्तम यूजर इंटरफेस और विस्तारित उपकरण समुच्चय के साथ प्रस्तावित किया गया था। 2009 में, संस्करण 3.0 ने ग्रहण रिच क्लाइंट प्लेटफॉर्म के आधार पर क्लस्टरिंग गुणवत्ता, सरलीकृत एपीआई और ट्यूनिंग क्लस्टरिंग के लिए नए जीयूआई आवेदन में महत्वपूर्ण सुधार लाए। 2020 में, संस्करण 4.0.0 ने एपीआई, कोड क्लीनअप और डेस्कटॉप वर्कबेंच को हटाने के लिए और सरलीकरण लाया। संस्करण 4.1.0 कार्यक्षेत्र को वेब-आधारित अनुप्रयोग के रूप में वापस लाता है।

आर्किटेक्चर
कैर्रेट 2 4.0 मुख्य रूप से भाषा-विशिष्ट संसाधनों, एल्गोरिथम कॉन्फ़िगरेशन और निष्पादन के प्रबंधन के लिए सार्वजनिक एपीआई के साथ जावा प्रोग्रामिंग लाइब्रेरी करता है। अन्य भाषाओं के साथ इंटर-ऑपरेबिलिटी के लिए एचटीटीपी (HTTP)/रेस्ट (REST) घटक (दस्तावेज़ क्लस्टरिंग सर्वर) प्रदान किया जाता है।

क्लस्टरिंग एल्गोरिदम
कैर्रेट 2 कुछ दस्तावेज़ क्लस्टरिंग एल्गोरिदम प्रदान करता है जो क्लस्टर लेबल की गुणवत्ता पर बल देता है:


 * लिंगो: क्लस्टरिंग एल्गोरिदम एकवचन मूल्य अपघटन पर आधारित है I
 * एसटीसी: प्रत्यय ट्री क्लस्टरिंग पर आधारित है I

कैर्रेट शोध
कैर्रेटशोध, कैर्रेट 2 परियोजना का वाणिज्यिक स्पिन-ऑफ, के आगे के विकास पर कार्य करता है, रीयल-टाइम टेक्स्ट क्लस्टरिंग एल्गोरिदम प्रदान करता है जो कैर्रेट 2 के रूप के साथ-साथ खुले सोर्स पर सॉफ्टवेयर के आधार पर पाठ खनन परामर्श सेवाएं प्रदान करता है।

कैर्रेट शोध लैब्स
कैर्रेट 2 ने सर्च लैब्स के आश्रय में प्रस्तावित कई स्वतंत्र ओपन सोर्स परियोजनाओं को उत्पन्न किया। इस कार्य में भाग के रूप में निम्नलिखित परियोजनाएं प्रकाशित की गई हैं या प्रकाशित की गई थीं:


 * रैंडमाइज्ड टेस्टिंग: प्रत्येक परीक्षण को अल्प भिन्न (यादृच्छिक) चलाने के लिए अंतर्निहित उपयोगिताओं के साथ जे इकाई परीक्षण धावक, लोड संतुलन और अन्य बेल्स के समानांतर जेवीएम (JVMs) पर जे इकाई परीक्षण चलाने के लिए भी एएनटी कार्य करता है।
 * जावा के लिए उच्च प्रदर्शन आदिम संग्रह (एचपीपीसी): जावा के लिए सूची, समुच्चय, मानचित्र और प्रिमिटिव्स के अन्य संग्रह उच्चतम प्रदर्शन और मेमोरी दक्षता के लिए प्रदर्शित किए गए हैं।
 * स्मार्टस्प्राइट्स: सीएसएस स्प्राइट्स को पूर्ण रूप से स्वचालित सुरक्षा; स्प्राइटेड छवियों को जोड़ते या परिवर्तित करते सीएसएस में कोई निरुद्देश्य कॉपी और पेस्ट नहीं करना चाहिए।

बंद परियोजनाएं:


 * जे सफ़्फ़िक्स ऐरेस: विभिन्न प्रदर्शन और स्मृति विशेषताओं के साथ प्रत्यय सरणी डेटा संरचना के कई जावा कार्यान्वयन है।
 * जे इकाई बेंचमार्क्स: जेइकाई4 परीक्षणों को जीसी मॉनिटरिंग, समय विचरण माप और सरल ग्राफिकल विज़ुअलाइज़ेशन के साथ प्रदर्शन माइक्रो-बेंचमार्क में परिवर्तन के लिए एक्सटेंशन का समुच्चय हैं।

यह भी देखें


ओपन सॉफ्टवेयर पोर्टल