DataCleaner ist eine All-in-One-Software für Datenanalyse und Datenbankreinigung

DataCleaner ist eine All-in-One-Software für Datenanalyse und Datenbankreinigung
DataCleaner ist eine All-in-One-Software für Datenanalyse und Datenbankreinigung

Video: DataCleaner ist eine All-in-One-Software für Datenanalyse und Datenbankreinigung

Video: DataCleaner ist eine All-in-One-Software für Datenanalyse und Datenbankreinigung
Video: Temple Run OZ Download 2023, September
Anonim

Datenbankanalysetools helfen Datenbankadministratoren dabei, Diskrepanzen und unlogische Verbindungen zwischen Datensätzen zu erkennen, sodass sie aus der Datenbank entfernt werden können. Die Fähigkeit von Datenbankanalysetools hängt jedoch von der Plattform ab, auf der die Datenbank aufgebaut ist. Zum Beispiel erfordert eine in MS Access erstellte kleine relationale Datenbank eine ganze Reihe anderer DB-Analyseprogramme als die, die mit MySQL erstellt wurden. Wenn Sie nach einem All-in-One-Datenbankanalysetool suchen, mit dem Sie redundante Einträge aus der Datenbank ermitteln und bereinigen können, ist die Wahrscheinlichkeit hoch, dass Sie auf ein kostenpflichtiges Dienstprogramm stoßen. Heute haben wir ein auf Java basierendes Open Source-Hilfsprogramm entdeckt DataCleaner Das implementiert eine Vielzahl von Datenbankanalyse- und Reinigungskonzepten einschließlich Datenqualität, Stammdatenverwaltung, Datenprofilierung, und Überwachung der Datenqualität, um alle überflüssigen Datenbestände aus dem angegebenen Datenspeicher zu entfernen.Die Anwendung unterstützt eine Vielzahl von Datenbankplattformen und Datendateien, einschließlich CSV, MS Excel (XLS und XLSX), MS Access, SAS-Bibliothek, DBase-Datenbank, Datei mit fester Breite, XML, OpenOffice-Datenbank, MonoDB, MySQL, Oracle und MS SQL Server.

Darüber hinaus enthält es Beispielverbindungszeichenfolgen und andere Optionen, mit denen Sie schnell Verbindungen mit Ihrer Datenbank herstellen können. Sobald die Datenbank verbunden ist oder Datensätze aus der angegebenen Datenbank abgerufen werden, können Sie sie vollständig anzeigen Metadaten Informationen zu DB-Tabellen, mit denen Sie die erforderlichen Felder und Zeilen einfach ändern können. Darüber hinaus enthält es eine umfangreiche Filter Diese Funktion kann Ihnen helfen, nur den erforderlichen Teil der Datenbank anzuzeigen. Sie können zahlreiche bedingte Filter auf die Datenbank anwenden, einschließlich Gleich, Max. Zeilen, Nullprüfung, Zahlenbereich, Einzelwort, Übereinstimmung mit Zeichenkettenmuster, und String-Wertebereich. Sie haben auch die Freiheit, mit ausgewählten Filtern an die Data Mining-Anforderungen anzupassen.

DataCleaner wird mit einem Transformator Mit dieser Funktion können Sie die Daten vorverarbeiten, um separate Werte zu extrahieren, zu kombinieren und zu generieren. Das eingebaute Analysator bietet umfassende Datenqualität und Datenprofilierung Operationen, die Sie bei der Analyse des Inhalts der ausgewählten Datenbank unterstützen. Es enthält eine Reihe von Analysefunktionen wie z Boolescher Analysator, Zeichensatzverteilung, Datenlückenanalysator, Matching-Analysator, Pattern-Finder, String-Analysator, Wochentag und Werteverteilung und mehr.

Die Hauptschnittstelle zeigt die unterstützten Datastore-Typen. Sie müssen lediglich den Datenbanktyp auswählen und die Verbindungsdetails konfigurieren. Wenn Sie beispielsweise die MySQL-Datenbank bereinigen und analysieren möchten, geben Sie Datenbankname, Name der Laufwerksklasse, Verbindungszeichenfolge sowie Benutzername und Kennwort ein. Sie können die Excel- oder Access-Datenbankdatei öffnen, indem Sie einfach den vollständigen Pfad angeben. Sobald die Verbindung hergestellt ist, wird die Datenbank der Liste hinzugefügt. Überprüfen Sie nun die Datenbank, die Sie analysieren möchten, und klicken Sie auf Analysieren.

Image
Image

Die linke Seitenleiste enthält Datenbanken aus dem ausgewählten Datastore, sodass Sie die Datasets untersuchen können. Sie müssen die Felder auswählen, um die Analyse durchzuführen. Doppelklicken Sie einfach auf die Felder, die Sie aufnehmen möchten, und es werden sie aufgelistet Quelle Tab. Sie können die Datasets und ihren Typ überprüfen und nicht benötigte Felder entfernen.

Image
Image

Unter Metadaten Auf dieser Registerkarte finden Sie alle Metadaten-Informationen, einschließlich Tabelle, Spalte, Typfamilie (basierend auf gespeicherten Daten), Typ, Native Type, Größe, Nullwertbedingung, Indexstatus.

Image
Image

Das Filter Auf dieser Registerkarte können Sie alle zuvor genannten Filter einschließen, um bestimmte Informationen aus Spalten zu extrahieren. Sie können der Liste mehrere Filtertypen hinzufügen, um die erforderlichen Datensätze einfach herauszufiltern. Wenn Sie einen Filter hinzugefügt haben, schließen Sie das Filterfenster und klicken Sie auf OK Filter hinzufügen um den Typ des Filters auszuwählen, den Sie verwenden möchten.

Image
Image

Analysator ist wahrscheinlich das nützlichste Feature der Anwendung. Wie bereits erwähnt, können Sie zahlreiche Analysearten auswählen. Sie erhalten nicht nur detaillierte Analyseberichte, sondern können auch Analysediagramme erstellen. Wählen Sie einfach die gewünschte Art der Analyse aus und geben Sie die erforderlichen Informationen ein. Wenn Sie fertig sind, klicken Sie auf Analyse ausführen.

Image
Image

Nach dem Klicken wird der Analysebericht erstellt. Das Fortschritt Die Registerkarte "Information" zeigt alle Prozesse an, die während der Erstellung der Analyse ausgeführt werden.

Image
Image

Sie können auf das Symbol doppelklicken Graph Schaltfläche im ersten Feld vorhanden, um die Daten in der Grafik darzustellen. Mit DataCleaner können Sie die Jobs speichern. Es erstellt eine XML-Datei, die den Analysebericht enthält. Analyse-Auftragsdateien können durch Öffnen der XML-Datei von angezeigt werden Datei -> Analyse öffnen Job.

DataCleaner bietet die Option zum Schreiben von Daten in verschiedenen Phasen der Datenanalyse. Zum Beispiel. Mit der Filterfunktion können Sie bereinigte Daten in eine separate Datei schreiben. Sie können die gefilterten Daten in eine CSV-Datei exportieren, eine Excel-Tabelle erstellen, eine Staging-Tabelle erstellen oder die Daten direkt in eine Tabelle einfügen.
DataCleaner bietet die Option zum Schreiben von Daten in verschiedenen Phasen der Datenanalyse. Zum Beispiel. Mit der Filterfunktion können Sie bereinigte Daten in eine separate Datei schreiben. Sie können die gefilterten Daten in eine CSV-Datei exportieren, eine Excel-Tabelle erstellen, eine Staging-Tabelle erstellen oder die Daten direkt in eine Tabelle einfügen.
DataCleaner ist ein umfangreiches Dienstprogramm zur Datenanalyse und -bereinigung, das Windows, Linux und Mac OS X unterstützt. Wir haben versucht, die wichtigsten Funktionen der Anwendung abzudecken und haben möglicherweise einige nützliche Tools und Optionen übersehen. Ausführliche Handbücher und Gebrauchsanleitungen finden Sie auf der Produktseite. Es muss beachtet werden, dass die neueste JRE (Java Runtime Environment) erforderlich ist, um zu funktionieren.
DataCleaner ist ein umfangreiches Dienstprogramm zur Datenanalyse und -bereinigung, das Windows, Linux und Mac OS X unterstützt. Wir haben versucht, die wichtigsten Funktionen der Anwendung abzudecken und haben möglicherweise einige nützliche Tools und Optionen übersehen. Ausführliche Handbücher und Gebrauchsanleitungen finden Sie auf der Produktseite. Es muss beachtet werden, dass die neueste JRE (Java Runtime Environment) erforderlich ist, um zu funktionieren.

Laden Sie DataCleaner herunter

Empfohlen: