कैर्रेट 2

From Vigyanwiki
Revision as of 22:08, 18 January 2023 by alpha>Artiverma
Carrot2
Developer(s)Carrot Search
Stable release
4.5.0 / November 3, 2022 (2022-11-03)
Repositorygithub.com/carrot2/carrot2/
Written inJava
Operating systemCross-platform
TypeText mining and cluster analysis
LicenseBSD license
Websitesearch.carrot2.org

कैर्रेट²[1] एक खुला स्रोत खोज परिणाम क्लस्टरिंग इंजन है।[2] यह स्वचालित रूप से दस्तावेजों के छोटे संग्रह का विश्लेषण कर सकता है, उदा। विषयगत श्रेणियों में खोज परिणाम या दस्तावेज़ सार। कैर्रेट² जावा में लिखा गया है और बीएसडी लाइसेंस के तहत वितरित किया गया है।

इतिहास

पोलिश में क्लस्टरिंग खोज परिणामों के लिए STC क्लस्टरिंग एल्गोरिदम की प्रयोज्यता को मान्य करने के लिए अपने एमएससी थीसिस के हिस्से के रूप में कैर्रेट² का प्रारंभिक संस्करण 2001 में दाविद वीस द्वारा लागू किया गया था।[3] 2003 में, लिंगो सहित कई अन्य खोज परिणाम क्लस्टरिंग एल्गोरिदम जोड़े गए,[4]विशेष रूप से खोज परिणामों के क्लस्टरिंग के लिए डिज़ाइन किया गया एक उपन्यास टेक्स्ट क्लस्टरिंग एल्गोरिदम। जबकि कैर्रेट² का स्रोत कोड 2002 से उपलब्ध था, यह केवल 2006 में था जब संस्करण 1.0 आधिकारिक तौर पर जारी किया गया था। उसी वर्ष, संस्करण 2.0 को बेहतर यूजर इंटरफेस और विस्तारित टूल सेट के साथ जारी किया गया था। 2009 में, संस्करण 3.0 ने ग्रहण रिच क्लाइंट प्लेटफॉर्म के आधार पर क्लस्टरिंग गुणवत्ता, सरलीकृत एपीआई और ट्यूनिंग क्लस्टरिंग के लिए नए जीयूआई आवेदन में महत्वपूर्ण सुधार लाए। 2020 में, संस्करण 4.0.0 ने एपीआई, कोड क्लीनअप और डेस्कटॉप वर्कबेंच को हटाने के लिए और सरलीकरण लाया। संस्करण 4.1.0 कार्यक्षेत्र को वेब-आधारित अनुप्रयोग के रूप में वापस लाता है।

Carrot² releases
Release Release Date Major changes and new features
4.5.0 November 2022 Dependency updates, bug fixes.
4.4.3 August 2022 Dependency updates, bug fixes to STC and stemming infrastructure.
4.4.0, 4.4.1, 4.4.2 December 2021 Security fixes and dependency updates.
4.3.0 July 2021 Minor API changes and bug fixes. Improvements to the workbench (DCS search frontend).
4.2.0, 4.2.1 March 2021 Improvements to JSON dictionaries and the workbench. Bug fixes.
4.1.0 January 2021 Web-based Workbench. JSON dictionaries and new filtering options. API polishing.
4.0.0 July 2020 API changes and simplifications across the codebase. Removal of deprecated technologies and tools. New documentation and code cleanups.
3.16.2 September 2019 Update third party libraries (security-related issues).
3.16.1 January 2019 Update of JS visualizations. Migration of Microsoft Bing API v5 to v7.
3.16.0 May 2018 An overhaul of Java 9+ compatibility issues. Workbench compatibility for Ubuntu distros. Document source updates and removals of non-functional document sources.
3.15.1 March 2017 A bugfix for .NET release that could result in unchecked I/O exceptions on inaccessible current working directory.
3.15.0 October 2016 Bing API V2 to V5 transition. Upgrade of third party dependencies. Internal cosmetics.
3.14.0 September 2016 Workbench improvements (high DPI support, MacOSX improvements, bug fixes). PubMed switching to HTTPs. Other minor improvements.
3.13.0 July 2016 Servlet API bug fixes, Workbench bug fixes, removed Google document source, fixed language codes for a few languages.
3.12.0 February 2016 Upgrade of Morfologik Polish dictionary, infrastructural changes and adjustments allowing C2 to operate under more strict security manager policies.
3.11.0 October 2015 Upgrade of Apache Lucene, bug fixes and a rollup of changes from 3.10.x minors.
3.10.4 October 2015 Upgrade of Morfologik library.
3.10.3 August 2015 Repackaged Google Guava to avoid conflicts in Solr.
3.10.2 July 2015 Minor fixes to the Workbench (Arabic cluster display).
3.10.1 May 2015 Aduna visualization dropped from MacOS distribution. Minor fixes to the Workbench.
3.10.0 May 2015 Visualization updates. Bug fixes. Library dependency updates.
3.9.4 November 2014 FoamTree update. New attributes for multilingual clustering. Visualization fixes.
3.9.3 July 2014 FoamTree update. Infrastructure fixes and tweaks (jflex, sonatype repository URLs).
3.9.2 April 2014 Bug fix to FoamTree HTML5.
3.9.1 April 2014 Bug fixes, upgrades of HTML5 visualizations.
3.9.0 February 2014 HTML5 visualizations replacing flash, library dependencies update, bugfixes.
3.8.1 October 2013 Bug fixes, minor tweaks to functionality.
3.8.0 July 2013 Bug fixes, library dependency updates.
3.7.1 May 2013 Minor bug fixes (3.7.0 maintenance release).
3.7.0 April 2013 Infrastructure changes to the core (string IDs), better Solr integration XSLT, Workbench tweaks for larger inputs, updated dependencies.
3.6.3 April 2013 Minor bug fixes and improvements: customization of Solr adapter XSLT, Workbench tweaks for larger inputs, updated dependencies.
3.6.2 November 2012 Minor bug fixes and improvements.
3.6.1 August 2012 Minor bug fixes.
3.6.0 June 2012 Infrastructural changes, refactorings and bug fixes.
3.5.3 December 2011 Infrastructure updates resulting from migration to GitHub. Workbench update to SWT 3.7.1.
3.5.2 September 2011 Ajax support in Document Clustering Server, Bing document source improved, Workbench improvements, bug fixes.
3.5.1 June 2011 Bug fixes, visualization integration improvements, support for Yahoo BOSS API removed.
3.5.0 May 2011 FoamTree visualization, bisecting k-means clustering, resource management improvements
3.4.3 March 2011 Distribution to Maven central repository
3.4.2 October 2010 Bug fixes
3.4.1 September 2010 Solr 1.4.x compatibility package, bug fixes
3.4.0 August 2010 .NET API for calling Carrot² clustering
3.3.0 April 2010 Significant scalability improvements in the STC clustering algorithm
3.2.0 March 2010 Experimental support for clustering Arabic and Korean content, command line application for clustering in batch mode, LGPL-licensed dependencies removed
3.1.0 September 2009 Experimental support for clustering Chinese content, search results clustering plugin for Apache Solr
3.1.0 September 2009 Experimental support for clustering Chinese content, search results clustering plugin for Apache Solr
3.0.1 March 2009 Document Clustering Workbench available for Mac OS X
3.0.0 January 2009 Document Clustering Workbench added for easy experimenting with Carrot² clustering, radically simplified Java API, search results clustering web application re-implemented, user manual[5] available
2.1.0 August 2007 Document Clustering Server added for exposing clustering as a REST service
2.0.0 September 2006 New user interface of the search results clustering web application
1.0.0 January 2006 First official release, binaries available on SourceForge
0.0.0 since 2002 Incubation releases, source code available on SourceForge


वास्तु

कैर्रेट² 4.0 मुख्य रूप से भाषा-विशिष्ट संसाधनों, एल्गोरिथम कॉन्फ़िगरेशन और निष्पादन के प्रबंधन के लिए सार्वजनिक एपीआई के साथ एक जावा प्रोग्रामिंग लाइब्रेरी है। अन्य भाषाओं के साथ इंटरऑपरेबिलिटी के लिए एक HTTP/REST घटक (दस्तावेज़ क्लस्टरिंग सर्वर) प्रदान किया जाता है।

क्लस्टरिंग एल्गोरिदम

कैर्रेट² कुछ दस्तावेज़ क्लस्टरिंग एल्गोरिदम प्रदान करता है जो क्लस्टर लेबल की गुणवत्ता पर जोर देता है:

  • लिंगो:[4] एकवचन मूल्य अपघटन के आधार पर एक क्लस्टरिंग एल्गोरिदम
  • एसटीसी:[6] प्रत्यय ट्री क्लस्टरिंग

स्पिन-ऑफ

गाजर खोज

गाजर खोज,[7] कैर्रेट² परियोजना का एक वाणिज्यिक स्पिन-ऑफ, कैर्रेट² के आगे के विकास पर काम करता है, एक रीयल-टाइम टेक्स्ट क्लस्टरिंग एल्गोरिदम प्रदान करता है[8] ओपन सोर्स और मालिकाना सॉफ्टवेयर के आधार पर कैर्रेट² ढांचे के साथ-साथ पाठ खनन परामर्श सेवाओं के अनुरूप।

गाजर खोज लैब्स

कैर्रेट² ने गाजर सर्च लैब्स की छत्रछाया में जारी कई स्वतंत्र ओपन सोर्स परियोजनाओं को जन्म दिया।[9] इस पहल के हिस्से के रूप में निम्नलिखित परियोजनाएं प्रकाशित की गई हैं या प्रकाशित की गई थीं:

  • रैंडमाइज्ड टेस्टिंग: हर टेस्ट रन को थोड़ा अलग (यादृच्छिक) बनाने के लिए बिल्ट-इन यूटिलिटीज के साथ एक JUnit टेस्ट रनर। लोड संतुलन और अन्य घंटियों और सीटी के साथ समानांतर JVMs पर JUnit परीक्षण चलाने के लिए भी एक ANT कार्य।
  • जावा के लिए उच्च प्रदर्शन आदिम संग्रह (एचपीपीसी): उच्चतम प्रदर्शन और स्मृति दक्षता के लिए ट्यून किए गए जावा के लिए सूची, सेट, मानचित्र और आदिम के अन्य संग्रह।
  • स्मार्टस्प्राइट्स: सीएसएस स्प्राइट्स का पूरी तरह से स्वचालित रखरखाव; स्प्राइटेड छवियों को जोड़ते या बदलते समय CSS में कोई थकाऊ कॉपी और पेस्ट नहीं करना।

बंद परियोजनाएं:

  • jSuffixArrays: विभिन्न प्रदर्शन और स्मृति विशेषताओं के साथ प्रत्यय सरणी डेटा संरचना के कई जावा कार्यान्वयन।
  • JUnitBenchmarks: JUnit4 परीक्षणों को GC मॉनिटरिंग, समय विचरण माप और सरल ग्राफिकल विज़ुअलाइज़ेशन के साथ प्रदर्शन माइक्रो-बेंचमार्क में बदलने के लिए एक्सटेंशन का एक सेट।

यह भी देखें


इस पेज में लापता आंतरिक लिंक की सूची

  • क्लस्टर विश्लेषण
  • विलक्षण मान अपघटन
  • प्रत्यय वृक्ष

संदर्भ

  1. Carrot2 Project, Stanislaw Osinski, Dawid Weiss. "Carrot2 - मुक्त स्रोत खोज परिणाम क्लस्टरिंग इंजन".{{cite web}}: CS1 maint: multiple names: authors list (link)
  2. Carrot2 search results clustering demo
  3. Dawid Weiss: A Clustering Interface for Web Search Results in Polish and English. MSc thesis. Poznan University of Technology, Poznań, Poland, 2001 download PDF
  4. 4.0 4.1 Stanisław Osiński, Dawid Weiss: A Concept-Driven Algorithm for Clustering Search Results. IEEE Intelligent Systems, May/June, 3 (vol. 20), 2005, pp. 48–54.
  5. "Carrot2".
  6. Oren Zamir, Oren Etzioni: Web Document Clustering: A Feasibility Demonstration, Proceedings of the 21st annual international ACM SIGIR conference on Research and development in information retrieval (1998), pp. 46–54
  7. Carrot Search s.c. "गाजर खोज: दस्तावेज़ क्लस्टरिंग और विज़ुअलाइज़ेशन सॉफ़्टवेयर".
  8. Carrot Search s.c. "गाजर खोज: Lingo3G: टेक्स्ट दस्तावेज़ क्लस्टरिंग इंजन".
  9. Carrot Search s.c. "गाजर खोज लैब्स".