Datenreinigung von Duplikaten und Reihen

Bei der Überpruefung or Zusammenführung von einer oder mehreren Listen oder Datenbasen, sind Duplikate oft einProblem, dieser Artikel wird im Detail zeigen wie man erfolgreich seine Dateien reinigt. Der Zweck vom Löschen der doppelten Zeilen und Datensätze ist die Reinigung der unterliegenden Daten welche die Produkitivätsteigerung ankurbelt, und auch die doppelte Aussendungen an den Kunden spart und die Kundenzufriedenheit erhöht. Das Löschen der Duplikate kann sehr zeitaufwendig und fehleranfällig sein,weshalb die Entfernung von Duplikaten ein unverzichtbares Werkzeug der Datenbank-Administration ist. Datamatch ist unser Flaggship Produkt für das Löschen von Duplikaten der Dateien. Probieren sie eine kostenlose Testversion oder lesen sie mehr über die besten Taktiken der Massenzusammenfürhung von Datenbanken.

Zusammenfürhung von Datenbanken

Die Zusammenfürung unterschiedlicher Datenbanken mit unterschiedlichen Quellen (SQL Server, MYSQL, Excel, ODBC, etc.) und die Zusammenführung dieser in eine gemeinsame Struktur ist der erste Abschchnitt dieses Prozesses. Gewöhnliche Duplikate sitzen zwischen Datenbanken, aber manchmal sind diese auch in einzelnen Dateien vorhanden. DataMatch kann Datenbanken in die häufigsten Datenbankformate importieren, verbinden und exportieren. Zusätzlich passt Datamatch ähnliche Felder aus verschieden Datenquellen aneinander an ( welche angepasst oder überschrieben werden können.)

Duplikate

Eine Schlüsselkomponente der Eliminierung von Duplikaten ist die Definition der Duplikate. The folgenden Praxen sind Kernpunkt und sind alle in DataMatch enthalten
> Fuzzy Logic Identifizierung von Prozentualübereinstimmung zwischenDatensätzen und die Festlegung von Mindestanforderungen um überenstimmende Schwellenfelder zu erreichen
> Abkürzung für Identifizierung der Übereinstimmung (Match International Business Machines IBM)
> Reinigung und Standardisierung von Daten vor Übereinstimmung (Straße zu Straße,unnötige Syntax Telefonnummern, usw.)
> Anwenden in Bibliotheken für Standardisierung, insbesondere für Vornamen (Jon, Jonathan,und John etc.) Datamatch umfasst über 300.000 Standardisierungsregeln für Namen,Adressen, Telefonnummern und Firmennamen.

Hinterbliebenenpension:

Einer der kritischen Stücke vom Löschen von Duplikaten ist Hinterbliebenenpension. Wenn Sie doppelte Datensätze haben, welche dieser Datensäzte soll bleiben ( oder überleben) und welcher sollte eliminiert werden?
Datamatch ermöglicht Einstellungen in denen zusammengeführte Daten überleben.

merge1

In diesem Beispiel gibt es zwei doppelte Datensätze. Jeder hat etwas andere Daten in den Feld Notizen. Sie können es vorziehen, alle Register zu führen, aber oftmals ist ein Stammdatensatz notwendig, um die Datenqualität zu halten.

Mit Datamatch können Sie wählen, welcher Datensatz überlebt, indem Sie das Feld wählen in welchem sie zusammenführen, in diesem Fall Kundennummer und aufsteigende oder absteigender Reihenfolge. Wenn der erste Kunde die aufsteigende Anzahl hält, würde er Priorität’1005643 halten “, wenn die spätere absteigende Kundennummer ‘1106789 ‘ hätte er Priorität. Hinweis: Sie können jederzeit ändern welche Aufnahme das Meistermanuell in Datamatch ist.

Leider können normale Duplikatsentfernungs-Softwareprogramme routinemässig wichtige geschäftlicheDaten löschen.

Was, wenn Sie beide Informationen im gleichen Stammsatz behalten wollen?

Die beste Lösung wäre, alle Daten die verschieden sind in einem neuen Feld zu halten.Datamatch hat diese Fähigkeit.

merge2

Das Ergebnis wäre folgendes:

merge3

Beachten Sie dass die alternativen Informationen in ein neues Feld aufgenommen werden. Der Vorteil ist ein einziger Stammsatz, ohne wichtigen Datenverlust (alte Kundennummer wird gehalten für spaetere Referenzierung und kritische Kommentare von Kunden, wie Interesse an einem neuen Produkt, wird gehalten).
Probieren Sie die kostenlose Testversion auf Ihrem eigenen Datensatz!!

FreeTrialButton

Note Hinweis-Datamatch löscht nie alle Informationen aus den Quelldateien , alle Informationen werden vorübergehend im Speicher gehalten, wo Sie ohne Folgen unterschiedliche Enfernungseinstellungen testen koennen . Sie koennen aber auch ihre ursprünglichen Quelldateien überschreiben.