Skip to main content

Verwijder dubbele rijen gegevens in Excel

Excel - Dubbele gegevens verwijderen in Excel - Ontdubbelen - Unieke lijst met filter in Excel (April 2025)

Excel - Dubbele gegevens verwijderen in Excel - Ontdubbelen - Unieke lijst met filter in Excel (April 2025)
Anonim
01 van 02

Verwijder dubbele gegevensrecords in Excel

Spreadsheetprogramma's zoals Excel worden vaak gebruikt als databases voor zaken als onderdelenvoorraden, verkooprecords en mailinglijsten.

Databases in Excel bestaan ​​uit tabellen met gegevens die normaal gesproken zijn georganiseerd in rijen met gegevens, records genaamd.

In een record zijn de gegevens in elke cel of elk veld in de rij gerelateerd, zoals de naam, het adres en het telefoonnummer van een bedrijf.

Een veelvoorkomend probleem dat optreedt wanneer een database groter wordt, is dat van dubbele records of rijen met gegevens.

Deze duplicatie kan optreden als:

  • Volledige records worden meer dan eens in de database ingevoerd, wat resulteert in twee of meer identieke records
  • Meerdere records hebben een of meer velden - zoals een naam en adres - die dezelfde gegevens bevatten.

Hoe dan ook, dubbele records kunnen een hele reeks problemen veroorzaken - zoals het mailen van meerdere exemplaren van documenten naar dezelfde persoon wanneer de database-informatie wordt gebruikt in een samenvoegmodus - dus is het een goed idee om te scannen naar en dubbele records te verwijderen op een normale basis.

En hoewel het gemakkelijk is om dubbele records te selecteren in een kleine steekproef zoals die in de bovenstaande afbeelding, kunnen datatabellen eenvoudig honderden of zelfs duizenden records bevatten, waardoor het erg moeilijk wordt om dubbele records te kiezen - vooral gedeeltelijk overeenkomende records.

Om het gemakkelijker te maken om deze taak te volbrengen, heeft Excel een ingebouwde data-tool genaamd, niet verrassend, Verwijder duplicaten, waarmee identieke en gedeeltelijk overeenkomende records kunnen worden gevonden en verwijderd.

Echter, de manier waarop de Verwijder duplicaten tool is ontworpen, identieke en gedeeltelijk overeenkomende records moeten afzonderlijk worden behandeld.

Dit komt omdat het Verwijder duplicaten dialoogvenster toont de veldnamen voor de geselecteerde gegevenstabel en u kiest welke velden u wilt opnemen bij het zoeken naar overeenkomende records:

  • Zoek voor identieke records naar alle velden - laat vinkjes achter naast alle kolom- of veldnamen;
  • Voor gedeeltelijke overeenkomende records: laat vinkjes achter naast die velden die moeten worden vergeleken.

Veldnamen versus kolomletters

Zoals vermeld, de Verwijder duplicaten tool bestaat uit een dialoogvenster waarin u kiest welke overeenkomende velden u zoekt door de gewenste veld- of kolomnamen af ​​te vinken.

De informatie die in het dialoogvenster wordt weergegeven - veldnamen of kolomletters - is afhankelijk van het feit of uw gegevens een rij met koppen bevatten - of headers - aan de bovenkant van de gegevenstabel zoals te zien in de bovenstaande afbeelding.

Als dit het geval is, zorg dan dat de optie aan de rechterkant van het dialoogvenster - Mijn gegevens hebben headers - is uitgeschakeld en Excel geeft de namen in deze rij weer als veldnamen in het dialoogvenster.

Als uw gegevens geen kopregel bevatten, geeft het dialoogvenster de juiste kolomletters weer in het dialoogvenster voor het geselecteerde gegevensbereik.

Aaneengesloten bereik van gegevens

Voor de Verwijder duplicaten om correct te werken, moet de gegevenstabel een aaneengesloten bereik van gegevens zijn - dat wil zeggen dat het geen lege rijen, kolommen en, indien mogelijk, geen lege cellen in de tabel moet hebben.

Geen lege cellen in een gegevenstabel hebben, is een goede gewoonte als het gaat om gegevensbeheer in het algemeen en niet alleen bij het zoeken naar dubbele gegevens. De andere gegevenshulpmiddelen van Excel - zoals sorteren en filteren - werken het beste wanneer de gegevenstabel een aaneengesloten gegevensbereik is.

Voorbeeld dubbele gegevensrecords verwijderen

In de bovenstaande afbeelding bevat de gegevenstabel twee identieke records voor A. Thompson en twee gedeeltelijk overeenkomende records voor R. Holt - waar alle velden overeenkomen behalve het studentnummer.

De onderstaande stappen beschrijven hoe u de Verwijder duplicaten data tool om:

  1. Verwijder de tweede van twee identieke records voor A. Thompson .
  2. Verwijder de tweede gedeeltelijk overeenkomende record voor R. Holt .

Het dialoogvenster Duplicaten verwijderen openen

  1. Klik op een cel die gegevens bevat in de voorbeelddatabase.
  2. Klik op de Gegevens tab op het lint.
  3. Klik op de Verwijder duplicaten pictogram om alle gegevens in de gegevenstabel te markeren en om de te openen Verwijder duplicaten dialoog venster.
  4. De Verwijder duplicaten dialoogvenster toont alle kolomkoppen of veldnamen uit ons datamonster
  5. De vinkjes naast de veldnamen geven aan in welke kolommen Excel zal proberen overeen te komen bij het zoeken naar dubbele records
  6. Standaard worden bij het openen van het dialoogvenster alle veldnamen aangevinkt

Identieke records zoeken

  1. Aangezien we in dit voorbeeld op zoek zijn naar volledig identieke records, laten we alle kolomkoppen aangevinkt
  2. Klik OK

Op dit punt moeten de volgende resultaten worden gezien:

  • Het dialoogvenster moet sluiten en worden vervangen door een bericht met de tekst: 1 dubbele waarden gevonden en verwijderd; Er zijn nog 7 unieke waarden over.
  • De rij die het duplicaat bevat A. Thompson record zal uit de database zijn verwijderd
  • Ook al zijn er twee gedeeltelijk overeenkomende records voor R. Hol t, omdat niet alle velden overeenkomen - het studentnummer voor de twee records verschilt - Excel beschouwt het als een uniek gegevensrecord
02 van 02

Zoek en verwijder gedeeltelijk overeenkomende records met het verwijderen van duplicaten

Eén veld tegelijk controleren

Aangezien Excel alleen gegevensrecords verwijdert die exact overeenkomen met de geselecteerde gegevensvelden, is de beste manier om alle gedeeltelijk overeenkomende gegevensrecords te vinden, door het vinkje voor slechts één veld tegelijk te verwijderen, zoals in de onderstaande stappen wordt gedaan.

Daaropvolgende zoekopdrachten naar records die overeenkomen in alle velden, behalve naam, leeftijd of programma, zullen alle mogelijke combinaties voor gedeeltelijk overeenkomende records verwijderen.

Gedeeltelijk overeenkomende records zoeken

  1. Klik indien nodig op een cel met gegevens in de gegevenstabel
  2. Klik op de Gegevens tab op het lint.
  3. Klik op de Verwijder duplicaten pictogram om alle gegevens in de gegevenstabel te markeren en om de te openen Verwijder duplicaten dialoog venster.
  4. Alle veldnamen of kolomkoppen voor de gegevenstabel zijn geselecteerd.
  5. Om records te vinden en te verwijderen die geen overeenkomst in elk veld hebben, verwijdert u het vinkje naast de veldnamen die Excel moet negeren.
  6. Klik voor dit voorbeeld op het selectievakje naast de Student-ID kolomkop om het vinkje te verwijderen.
  7. Excel zoekt en verwijdert nu alleen records met overeenkomende gegevens in de Achternaam , Eerste , en Programma velden.
  8. Klik OK
  9. Het dialoogvenster moet sluiten en worden vervangen door een bericht met de tekst: 1 dubbele waarden gevonden en verwijderd; Er zijn nog 6 unieke waarden over.
  10. De rij met het tweede record voor R. Holt met de student-ID van ST348-252 zal uit de database zijn verwijderd.
  11. Klik OK om het berichtvenster te sluiten

Op dit punt moet de voorbeeldgegevenstabel vrij zijn van alle dubbele gegevens.