• 考虑到爆炸的数据量的公司要求管理日常的基础上,这并不令人感到惊讶,技术提供更好的资源的利用变得更具有吸引力。 虽然总体良好的做法,如果你有严重的问题的数据存储费用,那么也许你可以考虑删除重复的数据解决方案。


    强劲一点的程序,源于它采用的方法来确定和消除过时的数据。 简单地说,应用程序采用了一种算法,允许它分析潜在的相似之处可能存在两个数据库之间的这似乎没有一个唯一的标识符。

    根据该数据库的大小和时间,你可以选择比较的数据采用的编辑,以卦相似的功能或两者。 而卦相似的功能是一个好选择当寻找大的差异,编辑功能可以更有帮助的情况下,当你需要找到小的偏差。

    之后,你设置的标准比较,就需要解释的解决方案,使程序知道如何处理的重复,它可以识别的。 值得一提的是,你可以配置多种解决方案的单个项目,一个选项,可以节省你的时间要探索一个大型数据库。

    你可以定义的解决方案通过填写必要的信息在专门领域,这意味着头,搭配关系和其他制约因素。 当配置的前述方案的部分,它建议限制分析的一个子集的数据,并确保你得到更多的相关结果。

    另一方面,你应该知道实用程序采用远程PostgreSQL服务器进行处理的数据,但复杂的操作SQL queries大大减少,由于直观的界面。


  • विचार विस्फोट मात्रा के डेटा कंपनियों की आवश्यकता का प्रबंधन करने के लिए, एक दैनिक आधार पर यह नहीं आया है, के रूप में एक आश्चर्य है कि प्रौद्योगिकी प्रदान करते हैं कि बेहतर संसाधनों के उपयोग में होते जा रहे हैं और अधिक आकर्षक है । जबकि एक समग्र अच्छा दृष्टिकोण, यदि आप कर रहे हैं गंभीर मुद्दों के साथ डेटा भंडारण की लागत, तो शायद आप पर विचार कर सकते हैं एक डेटा deduplication समाधान है ।

    Remadder पोर्टेबल है कि एक उपयोगिता है करने के लिए सक्षम बनाता ट्रैक डुप्लिकेट के भीतर बड़े डेटाबेस युक्त कच्चे डेटा और उन्हें हटाने के लिए इतना है कि आप कमी कर सकते हैं अपने भंडारण की जरूरत है और लागत के साथ जुड़े है उन्हें.

    मजबूत बिंदु के कार्यक्रम की वजह से उपजी विधि यह रोजगार की पहचान करने और खत्म करने अप्रचलित डेटा. यह डाल करने के लिए बस, एप्लिकेशन का उपयोग करता है कि एक एल्गोरिथ्म की अनुमति देता है यह विश्लेषण करने के लिए संभावित समानता है कि मौजूद हो सकता है के बीच दो डेटाबेस नहीं है, जो प्रकट करने के लिए एक अद्वितीय पहचानकर्ता है ।

    के आकार के आधार पर डेटाबेस और उपलब्ध समय, आप चुन सकते हैं की तुलना करने के लिए डेटा का उपयोग Levenshtein, Trigram समानता समारोह या दोनों. जबकि Trigram समानता समारोह है एक अच्छा विकल्प के लिए खोज जब बड़े मतभेद, Levenshtein समारोह हो सकता है और अधिक उपयोगी स्थितियों में, जब आप की जरूरत है खोजने के लिए छोटे से विचलन है ।

    के बाद आप निर्धारित मापदंड के लिए की तुलना में, आप की जरूरत समझाने के लिए, इसलिए है कि समाधान कार्यक्रम जानता है कि कैसे संभाल करने के लिए डुप्लिकेट यह दिखाता है. यह उल्लेख के लायक है कि आप कॉन्फ़िगर कर सकते हैं कई समाधान के लिए एक एकल परियोजना, एक विकल्प है कि कर सकते हैं आप समय बचाने के लिए जब खोज के लिए एक बड़ी डेटाबेस है ।

    आप को परिभाषित कर सकते हैं समाधान में भरने के द्वारा आवश्यक जानकारी में समर्पित क्षेत्रों, जिसका अर्थ है हैडर, मैच संबंधों और अन्य बाधाओं । जब विन्यास aforementioned समाधान वर्गों, यह अनुशंसित है कि आप अपनी सीमा का विश्लेषण करने के लिए एक सबसेट का डेटा और सुनिश्चित करें कि आप अधिक प्रासंगिक परिणाम है.

    एक तरफ ध्यान दें पर, आपको पता होना चाहिए कि उपयोगिता को रोजगार के लिए एक दूरस्थ PostgreSQL सर्वर के प्रसंस्करण के लिए डेटा, अभी तक जटिलता के संचालन के एसक्यूएल प्रश्नों काफी कम है, धन्यवाद करने के लिए सहज ज्ञान युक्त अंतरफलक है ।

    मामले में आप विचार कर रहे हैं विभिन्न तरीकों के नीचे काटने आपरेशन लागत, तो Remadder पोर्टेबल मदद कर सकते हैं आप को बचाने के लिए कुछ भंडारण अंतरिक्ष को नष्ट करने के द्वारा अनावश्यक डेटा है कि आप हो सकता है ध्यान में रखते हुए भी साकार करने के बिना.

  • Considering the exploding volumes of data companies require to manage on a daily basis, it does not come as a surprise that technologies that provide better resources utilization are becoming more attractive. While an overall good approach, if you are having serious issues with data storage costs, then perhaps you can consider a data deduplication solution.

    Remadder Portable is a utility that enables you to track duplicates within large databases containing RAW data and delete them so that you can decrease your storage needs and the costs associated with them.

    The strong point of the program stems from the method it employs to identify and eliminate obsolete data. To put it simply, the app uses an algorithm that allows it to analyze potential similarities that could exist between two databases which do not appear to have a unique identifier.

    Depending on the size of the database and time available, you can choose to compare the data using the Levenshtein, Trigram similarity function or both. While the Trigram similarity function is a good option when searching for large differences, the Levenshtein function could be more helpful in situations when you need to find small deviations.

    After you set the criteria for the comparison, you need to explain the solution, so that the program knows how to handle the duplicates it identifies. It is worth mentioning that you can configure multiple solutions for a single project, an option that can save you time when exploring a large database.

    You can define the solution by filling in the necessary information in the dedicated fields, meaning the header, match relations and the other constraints. When configuring the aforementioned solution sections, it is recommended that you limit your analysis to a subset of data and ensure you get more relevant results.

    On a side note, you should know that the utility employs a remote PostgreSQL server for processing the data, yet the complexity of operating the SQL queries is considerably reduced, thanks to the intuitive interface.

    In case you are considering various methods of cutting down operation costs, then Remadder Portable can help you save some storage space by eliminating redundant data that you might be keeping without even realizing.