कैर्रेट 2

कैर्रेट² ओपन स्रोत का शोध परिणामी क्लस्टरिंग इंजन है। यह स्वचालित रूप से दस्तावेजों के छोटे संग्रह का विश्लेषण कर सकता है, उदा- विषयगत श्रेणियों में शोध परिणाम या दस्तावेज़ सार इत्यादि। कैर्रेट² जावा में लिखा गया है और बीएसडी लाइसेंस के अंतर्गत वितरित किया गया है।

इतिहास
पोलिश में क्लस्टरिंग खोज परिणामों के लिए STC क्लस्टरिंग एल्गोरिदम की प्रयोज्यता को मान्य करने के लिए अपने एमएससी थीसिस के हिस्से के रूप में  कैर्रेट² का प्रारंभिक संस्करण 2001 में दाविद वीस द्वारा लागू किया गया था। 2003 में, लिंगो सहित कई अन्य खोज परिणाम क्लस्टरिंग एल्गोरिदम जोड़े गए, विशेष रूप से खोज परिणामों के क्लस्टरिंग के लिए डिज़ाइन किया गया एक उपन्यास टेक्स्ट क्लस्टरिंग एल्गोरिदम। जबकि   कैर्रेट² का स्रोत कोड 2002 से उपलब्ध था, यह केवल 2006 में था जब संस्करण 1.0 आधिकारिक तौर पर जारी किया गया था। उसी वर्ष, संस्करण 2.0 को बेहतर यूजर इंटरफेस और विस्तारित टूल सेट के साथ जारी किया गया था। 2009 में, संस्करण 3.0 ने ग्रहण रिच क्लाइंट प्लेटफॉर्म के आधार पर क्लस्टरिंग गुणवत्ता, सरलीकृत एपीआई और ट्यूनिंग क्लस्टरिंग के लिए नए जीयूआई आवेदन में महत्वपूर्ण सुधार लाए। 2020 में, संस्करण 4.0.0 ने एपीआई, कोड क्लीनअप और डेस्कटॉप वर्कबेंच को हटाने के लिए और सरलीकरण लाया। संस्करण 4.1.0 कार्यक्षेत्र को वेब-आधारित अनुप्रयोग के रूप में वापस लाता है।

वास्तु
कैर्रेट² 4.0 मुख्य रूप से भाषा-विशिष्ट संसाधनों, एल्गोरिथम कॉन्फ़िगरेशन और निष्पादन के प्रबंधन के लिए सार्वजनिक एपीआई के साथ एक जावा प्रोग्रामिंग लाइब्रेरी है। अन्य भाषाओं के साथ इंटरऑपरेबिलिटी के लिए एक HTTP/REST घटक (दस्तावेज़ क्लस्टरिंग सर्वर) प्रदान किया जाता है।

क्लस्टरिंग एल्गोरिदम
कैर्रेट² कुछ दस्तावेज़ क्लस्टरिंग एल्गोरिदम प्रदान करता है जो क्लस्टर लेबल की गुणवत्ता पर जोर देता है:


 * लिंगो: एकवचन मूल्य अपघटन के आधार पर एक क्लस्टरिंग एल्गोरिदम
 * एसटीसी: प्रत्यय ट्री क्लस्टरिंग

गाजर खोज
गाजर खोज,  कैर्रेट² परियोजना का एक वाणिज्यिक स्पिन-ऑफ,   कैर्रेट² के आगे के विकास पर काम करता है, एक रीयल-टाइम टेक्स्ट क्लस्टरिंग एल्गोरिदम प्रदान करता है ओपन सोर्स और मालिकाना सॉफ्टवेयर के आधार पर   कैर्रेट² ढांचे के साथ-साथ पाठ खनन परामर्श सेवाओं के अनुरूप।

गाजर खोज लैब्स
कैर्रेट² ने गाजर सर्च लैब्स की छत्रछाया में जारी कई स्वतंत्र ओपन सोर्स परियोजनाओं को जन्म दिया। इस पहल के हिस्से के रूप में निम्नलिखित परियोजनाएं प्रकाशित की गई हैं या प्रकाशित की गई थीं:


 * रैंडमाइज्ड टेस्टिंग: हर टेस्ट रन को थोड़ा अलग (यादृच्छिक) बनाने के लिए बिल्ट-इन यूटिलिटीज के साथ एक JUnit टेस्ट रनर। लोड संतुलन और अन्य घंटियों और सीटी के साथ समानांतर JVMs पर JUnit परीक्षण चलाने के लिए भी एक ANT कार्य।
 * जावा के लिए उच्च प्रदर्शन आदिम संग्रह (एचपीपीसी): उच्चतम प्रदर्शन और स्मृति दक्षता के लिए ट्यून किए गए जावा के लिए सूची, सेट, मानचित्र और आदिम के अन्य संग्रह।
 * स्मार्टस्प्राइट्स: सीएसएस स्प्राइट्स का पूरी तरह से स्वचालित रखरखाव; स्प्राइटेड छवियों को जोड़ते या बदलते समय CSS में कोई थकाऊ कॉपी और पेस्ट नहीं करना।

बंद परियोजनाएं:


 * jSuffixArrays: विभिन्न प्रदर्शन और स्मृति विशेषताओं के साथ प्रत्यय सरणी डेटा संरचना के कई जावा कार्यान्वयन।
 * JUnitBenchmarks: JUnit4 परीक्षणों को GC मॉनिटरिंग, समय विचरण माप और सरल ग्राफिकल विज़ुअलाइज़ेशन के साथ प्रदर्शन माइक्रो-बेंचमार्क में बदलने के लिए एक्सटेंशन का एक सेट।

इस पेज में लापता आंतरिक लिंक की सूची

 * क्लस्टर विश्लेषण
 * विलक्षण मान अपघटन
 * प्रत्यय वृक्ष