कैर्रेट 2

गाजर² एक खुला स्रोत खोज परिणाम क्लस्टरिंग इंजन है। यह स्वचालित रूप से दस्तावेजों के छोटे संग्रह का विश्लेषण कर सकता है, उदा। विषयगत श्रेणियों में खोज परिणाम या दस्तावेज़ सार। गाजर² जावा में लिखा गया है और बीएसडी लाइसेंस के तहत वितरित किया गया है।

इतिहास
पोलिश में क्लस्टरिंग खोज परिणामों के लिए STC क्लस्टरिंग एल्गोरिदम की प्रयोज्यता को मान्य करने के लिए अपने एमएससी थीसिस के हिस्से के रूप में गाजर² का प्रारंभिक संस्करण 2001 में दाविद वीस द्वारा लागू किया गया था। 2003 में, लिंगो सहित कई अन्य खोज परिणाम क्लस्टरिंग एल्गोरिदम जोड़े गए, विशेष रूप से खोज परिणामों के क्लस्टरिंग के लिए डिज़ाइन किया गया एक उपन्यास टेक्स्ट क्लस्टरिंग एल्गोरिदम। जबकि गाजर² का स्रोत कोड 2002 से उपलब्ध था, यह केवल 2006 में था जब संस्करण 1.0 आधिकारिक तौर पर जारी किया गया था। उसी वर्ष, संस्करण 2.0 को बेहतर यूजर इंटरफेस और विस्तारित टूल सेट के साथ जारी किया गया था। 2009 में, संस्करण 3.0 ने ग्रहण रिच क्लाइंट प्लेटफॉर्म के आधार पर क्लस्टरिंग गुणवत्ता, सरलीकृत एपीआई और ट्यूनिंग क्लस्टरिंग के लिए नए जीयूआई आवेदन में महत्वपूर्ण सुधार लाए। 2020 में, संस्करण 4.0.0 ने एपीआई, कोड क्लीनअप और डेस्कटॉप वर्कबेंच को हटाने के लिए और सरलीकरण लाया। संस्करण 4.1.0 कार्यक्षेत्र को वेब-आधारित अनुप्रयोग के रूप में वापस लाता है।

वास्तु
गाजर² 4.0 मुख्य रूप से भाषा-विशिष्ट संसाधनों, एल्गोरिथम कॉन्फ़िगरेशन और निष्पादन के प्रबंधन के लिए सार्वजनिक एपीआई के साथ एक जावा प्रोग्रामिंग लाइब्रेरी है। अन्य भाषाओं के साथ इंटरऑपरेबिलिटी के लिए एक HTTP/REST घटक (दस्तावेज़ क्लस्टरिंग सर्वर) प्रदान किया जाता है।

क्लस्टरिंग एल्गोरिदम
गाजर² कुछ दस्तावेज़ क्लस्टरिंग एल्गोरिदम प्रदान करता है जो क्लस्टर लेबल की गुणवत्ता पर जोर देता है:


 * लिंगो: एकवचन मूल्य अपघटन के आधार पर एक क्लस्टरिंग एल्गोरिदम
 * एसटीसी: प्रत्यय ट्री क्लस्टरिंग

गाजर खोज
गाजर खोज, गाजर² परियोजना का एक वाणिज्यिक स्पिन-ऑफ, गाजर² के आगे के विकास पर काम करता है, एक रीयल-टाइम टेक्स्ट क्लस्टरिंग एल्गोरिदम प्रदान करता है ओपन सोर्स और मालिकाना सॉफ्टवेयर के आधार पर गाजर² ढांचे के साथ-साथ पाठ खनन परामर्श सेवाओं के अनुरूप।

गाजर खोज लैब्स
गाजर² ने गाजर सर्च लैब्स की छत्रछाया में जारी कई स्वतंत्र ओपन सोर्स परियोजनाओं को जन्म दिया। इस पहल के हिस्से के रूप में निम्नलिखित परियोजनाएं प्रकाशित की गई हैं या प्रकाशित की गई थीं:


 * रैंडमाइज्ड टेस्टिंग: हर टेस्ट रन को थोड़ा अलग (यादृच्छिक) बनाने के लिए बिल्ट-इन यूटिलिटीज के साथ एक JUnit टेस्ट रनर। लोड संतुलन और अन्य घंटियों और सीटी के साथ समानांतर JVMs पर JUnit परीक्षण चलाने के लिए भी एक ANT कार्य।
 * जावा के लिए उच्च प्रदर्शन आदिम संग्रह (एचपीपीसी): उच्चतम प्रदर्शन और स्मृति दक्षता के लिए ट्यून किए गए जावा के लिए सूची, सेट, मानचित्र और आदिम के अन्य संग्रह।
 * स्मार्टस्प्राइट्स: सीएसएस स्प्राइट्स का पूरी तरह से स्वचालित रखरखाव; स्प्राइटेड छवियों को जोड़ते या बदलते समय CSS में कोई थकाऊ कॉपी और पेस्ट नहीं करना।

बंद परियोजनाएं:


 * jSuffixArrays: विभिन्न प्रदर्शन और स्मृति विशेषताओं के साथ प्रत्यय सरणी डेटा संरचना के कई जावा कार्यान्वयन।
 * JUnitBenchmarks: JUnit4 परीक्षणों को GC मॉनिटरिंग, समय विचरण माप और सरल ग्राफिकल विज़ुअलाइज़ेशन के साथ प्रदर्शन माइक्रो-बेंचमार्क में बदलने के लिए एक्सटेंशन का एक सेट।

इस पेज में लापता आंतरिक लिंक की सूची

 * क्लस्टर विश्लेषण
 * विलक्षण मान अपघटन
 * प्रत्यय वृक्ष