• Carrot2工作台是一个可靠的文件群集工作台,它可以帮助你进行高级搜索,爬和索引的网站组成。 该计划是一个适当的工具,用于测试群算法上网搜索的结果,或在数据的提供。

    Carrot2工作台是Java-建造和允许你来进行高级搜索和组织的搜索到的各种主题。 它可以使该过程自动化,使用的综合功能,不需要第三方的工具,例如分类或预先分类的内容。

    该计划提供你们两个文件群集的算法,这能让你集群的基于搜索结果的后缀树群和术语方法。 该程序也可以获取的数据搜索引擎,支持具体Api,例如Microsoft兵或PubMed和来源的文件。

    分类:设,Apache Solr或略任支持,作为源文件,再加上他们被用作替代的司机履带和索引的。

    即使Carrot2工作台不功地履和索引的功能,它支持若干项目,可取代这些特征。 例如,Nutch可用于网站爬行,你可以指数或通过搜索你的内容,使用分类:设的,Solr。

    而且,程序不爬一个网站,但它可以添加的搜索结果的聚类功能,以现有的引擎。

    Carrot2工作台可以自动群集的搜索结果,但它也允许你在手动配置的集群的设置和微调进程。

    Carrot2工作台作为一个独立的程序,但它也可以集成到其他基于Java的应用以帮助你实现其他集群功能。 此外,可以扩展其功能,通过将它与所支持的爬行或索引编制算法。 此外,它可以帮助你集了大量的文件若干段落的每一个。

  • Carrot2 कार्यक्षेत्र एक विश्वसनीय दस्तावेज़ clustering कार्यक्षेत्र के हैं, जो आप मदद कर सकते हैं उन्नत खोजों प्रदर्शन, क्रॉल और सूचकांक वेबसाइट घटकों. कार्यक्रम है एक उपयुक्त उपकरण के परीक्षण के लिए क्लस्टरिंग एल्गोरिदम पर वेब खोज परिणामों पर या डेटा है कि आप प्रदान करते हैं.

    Carrot2 कार्यक्षेत्र है जावा-बनाया गया है और अनुमति देता है आप करने के लिए उन्नत खोजों प्रदर्शन और व्यवस्थित खोज में विभिन्न विषयों है । यह स्वचालित कर सकते हैं इस प्रक्रिया का उपयोग कर एकीकृत कार्यों की जरूरत नहीं, तीसरे पक्ष के उपकरण, इस तरह के रूप में taxonomies या पूर्व में वर्गीकृत सामग्री है ।

    कार्यक्रम प्रदान करता है, आप दो दस्तावेजों क्लस्टरिंग एल्गोरिदम की अनुमति है, जो आप करने के लिए क्लस्टर के आधार पर खोज परिणामों प्रत्यय के पेड़ के क्लस्टरिंग और शब्दावली के तरीके. इस कार्यक्रम में भी कर सकते हैं, से डेटा लाने के लिए खोज इंजन का समर्थन है जो विशिष्ट एपीआई, इस तरह के रूप में माइक्रोसॉफ्ट बिंग या PubMed और सूत्रों के दस्तावेजों.

    Lucene, अपाचे Solr या ElasticSearch का समर्थन कर रहे हैं के स्रोतों के रूप में दस्तावेजों, प्लस वे इस्तेमाल कर रहे हैं के रूप में प्रतिस्थापन के लिए देशी क्रॉलर और अनुक्रमणिका.

    हालांकि Carrot2 कार्यक्षेत्र की सुविधा नहीं है देशी क्रॉलर और अनुक्रमणिका कार्य है, यह समर्थन करता है कई परियोजनाओं की जगह ले सकता है कि इन सुविधाओं की है । उदाहरण के लिए, Nutch इस्तेमाल किया जा सकता है के लिए वेबसाइट रेंगने और आप कर सकते हैं सूचकांक या खोज के माध्यम से अपनी सामग्री का उपयोग कर Lucene, Solr.

    इसके अलावा, कार्यक्रम के लिए क्रॉल नहीं कर सकते एक वेबसाइट है, लेकिन यह जोड़ सकते हैं खोज परिणाम clustering सुविधाओं के लिए एक मौजूदा इंजन है ।

    Carrot2 कार्यक्षेत्र कर सकते हैं स्वचालित रूप से क्लस्टर आपके खोज परिणाम है, लेकिन यह भी आप की अनुमति दें करने के लिए मैन्युअल रूप से कॉन्फ़िगर clustering सेटिंग्स और ठीक धुन प्रक्रिया है ।

    Carrot2 कार्यक्षेत्र काम करता है के रूप में एक स्वसंपूर्ण कार्यक्रम है, लेकिन यह भी कर सकते हैं में एकीकृत किया जा सकता अन्य जावा आधारित अनुप्रयोगों में मदद करने के लिए आप को लागू अन्य क्लस्टरिंग का कार्य करता है । इसके अलावा, आप कर सकते हैं अपनी कार्यक्षमता का विस्तार से जोड़ के साथ समर्थित रेंगने या अनुक्रमण एल्गोरिदम. इसके अतिरिक्त, यह आप मदद कर सकते हैं क्लस्टर ऊपर दस्तावेजों की एक भीड़, कई के साथ प्रत्येक पैराग्राफ.

  • Carrot2 Workbench is a reliable document clustering workbench, which can help you perform advanced searches, crawl and index website components. The program is a suitable tool for testing clustering algorithms on Web search results or on data that you provide.

    Carrot2 Workbench is Java-built and allows you to perform advanced searches and organize the search into various topics. It can automate this process using the integrated functions, not needing third-party tools, such as taxonomies or pre-classified content.

    The program offers you two documents clustering algorithms, which allow you to cluster the search results based on Suffix Tree Clustering and Lingo methods. The program can also fetch data from searching engines, which support specific APIs, such as Microsoft Bing or PubMed and sources of documents.

    Lucene, Apache Solr or ElasticSearch are supported as sources of documents, plus they are used as replacements for the native crawler and indexer.

    Even though Carrot2 Workbench does not feature native crawler and indexer functions, it supports several projects that can replace these features. For example, Nutch can be used for website crawling and you can index or search through your content using Lucene, Solr.

    Moreover, the program cannot crawl a website, but it can add search results clustering features to an existing engine.

    Carrot2 Workbench can automatically cluster your search results, but it also allow you to manually configure the clustering settings and fine tune the process.

    Carrot2 Workbench works as a standalone program, but it can also be integrated into other Java-based applications to help you implement other clustering functions. Moreover, you can extend its functionality by associating it with the supported crawling or indexing algorithms. Additionally, it can help you cluster up a multitude of documents with several paragraphs each.