Skip to main content

Ta bort dubbletrader av data i Excel

Ta bort saliv stenar (Maj 2025)

Ta bort saliv stenar (Maj 2025)
Anonim
01 av 02

Ta bort duplicerade dataregister i Excel

Kalkylarksprogram som Excel används ofta som databaser för saker som lagervaror, försäljningsrekord och e-postlistor.

Databaser i Excel består av datatabeller som normalt organiseras i rader av data som heter poster.

I en post är uppgifterna i varje cell eller fält i raden relaterade - till exempel företagets namn, adress och telefonnummer.

Ett vanligt problem som uppstår som en databas växer i storlek är den för dubbla poster eller rader med data.

Denna dubbelarbete kan uppstå om:

  • Hela dokumenten läggs in i databasen mer än en gång vilket resulterar i två eller flera identiska poster
  • Flera poster har ett eller flera fält - till exempel ett namn och en adress - som innehåller samma data.

Hur som helst kan dubbla poster ge upphov till en mängd problem - som att skicka flera kopior av dokument till samma person när databasinformationen används i en mailfusion - så det är en bra idé att skanna och ta bort dubbla poster på en vanlig grund.

Och medan det är lätt att välja dubbla poster i ett litet prov som det som finns på bilden ovan kan datatabeller enkelt innehålla hundratals om inte tusentals poster gör det väldigt svårt att välja dubbla poster - särskilt delvis matchande poster.

För att göra det enklare att uppnå denna uppgift har Excel ett inbyggt datavärde som kallas, inte överraskande, Ta bort dubbletter, som kan användas för att hitta och ta bort identiska såväl som delvis matchande poster.

Men hur den Ta bort dubbletter verktyget är utformat, identiska och delvis matchande poster måste hanteras separat.

Detta beror på att Ta bort dubbletter dialogrutan visar fältnamnen för den valda datatabellen och du väljer vilka fält som ska inkluderas i sökningen efter matchande poster:

  • För identiska register, sök efter alla fält - lämna kontroller bredvid alla kolumn- eller fältnamn;
  • För delvis matchande poster - lämna kontrollerna bredvid endast de fält som ska matchas.

Fältnamn vs Column Letters

Som nämnts Ta bort dubbletter Verktyget består av en dialogruta där du väljer vilka matchande fält att söka efter genom att markera önskade fält eller kolumnnamn.

Informationen som dialogrutan visar - fältnamn eller kolumnbokstäver - beror på om din data innehåller en rad med rubriker - eller headers - högst upp i datatabellen som framgår av bilden ovan.

Om det gör - se till att alternativet till höger om dialogrutan - Mina data har rubriker - är markerad och Excel kommer att visa namnen i den här raden som fältnamn i dialogrutan.

Om din data inte har en rubrikrad visas dialogrutan för lämpliga kolumnbokstäver i dialogrutan för det valda datamängden.

Kontinuerlig datauppsättning

För Ta bort dubbletter verktyget för att fungera korrekt måste datatabellen vara ett sammanhängande antal data - det får inte innehålla några tomma rader, kolumner, och om det inte finns några tomma celler som ligger i tabellen.

Att inte ha ämnen i en datatabell är en bra metod när det gäller datahantering i allmänhet och inte bara när man söker efter dubbla data. Excels andra datainställningar - till exempel sortering och filtrering - fungerar bäst när datatabellen är ett sammanhängande utbud av data.

Ta bort Duplicate Data Records Exempel

I bilden ovan innehåller datatabellen två identiska poster för A. Thompson och två delvis matchande poster för R. Holt - där alla fält matchar utom studentnummer

Stegen nedan anges hur du använder Ta bort dubbletter dataredskap till:

  1. Ta bort den andra av två identiska poster för A. Thompson .
  2. Ta bort den andra delvis matchande posten för R. Holt .

Öppnar dialogrutan Ta bort dubbletter

  1. Klicka på vilken cell som innehåller data i provdatabasen.
  2. Klicka på Data flik på bandet.
  3. Klicka på Ta bort dubbletter ikon för att markera alla data i datatabellen och för att öppna Ta bort dubbletter dialog ruta.
  4. De Ta bort dubbletter dialogrutan visar alla kolumnrubriker eller fältnamn från vårt dataprov
  5. Markeringen bredvid fältnamnen anger vilka kolumner Excel som ska försöka matcha när du söker efter dubbla poster
  6. Som standard öppnas alla fältnamn när dialogrutan öppnas

Hitta identiska poster

  1. Eftersom vi söker efter helt identiska poster i det här exemplet kommer vi att lämna alla kolumnrubriker kontrollerade
  2. Klick ok

Vid denna tidpunkt bör följande resultat ses:

  • Dialogrutan bör stängas och ersättas av ett meddelande som säger: 1 dubbla värden som hittats och avlägsnades 7 unika värden kvarstår.
  • Raden som innehåller duplicatet A. Thompson posten har tagits bort från databasen
  • Även om det finns två delvis matchande poster för R. Hol t, eftersom inte alla fält matchade - studentenummeret för de två dokumenten skiljer sig - Excel anser att det är en unik datapost
02 av 02

Hitta och ta bort delvis matchande poster med bort duplikat

Kontrollera ett fält i taget

Eftersom Excel bara tar bort dataposter som exakt matchar för de valda datafälten, är det bästa sättet att hitta alla delvis matchande dataposter att ta bort kryssrutan för endast ett fält i taget, vilket görs i stegen nedan.

Efterföljande sökningar efter poster som matchar alla fält utom namn, ålder eller program, tar bort alla möjliga kombinationer för delvis matchande poster.

Hitta delvis matchande poster

  1. Klicka på en cell som innehåller data i datatabellen om det behövs
  2. Klicka på Data flik på bandet.
  3. Klicka på Ta bort dubbletter ikon för att markera alla data i datatabellen och för att öppna Ta bort dubbletter dialog ruta.
  4. Alla fältnamn eller kolumnrubriker för datatabellen väljs.
  5. För att hitta och ta bort poster som inte har matchning i alla fält, ta bort markeringen förutom de fältnamn som Excel ska ignorera.
  6. För det här exemplet klickar du på kryssrutan bredvid Student-ID kolumnrubrik för att ta bort markeringen.
  7. Excel kommer nu bara att söka och ta bort poster som har matchande data i Efternamn , Första , och Program fält.
  8. Klick ok
  9. Dialogrutan bör stängas och ersättas av ett meddelande som säger: 1 dubbla värden som hittats och avlägsnades 6 unika värden kvarstår.
  10. Raden som innehåller den andra posten för R. Holt med studentens ID för ST348-252 kommer att ha tagits bort från databasen.
  11. Klick ok för att stänga meddelandeboxen

Vid den här tiden borde exempeltatabellen vara fri från alla dubbla data.