Cómo eliminar valores duplicados de una tabla en SQL Server

Resumen: en este tutorial, aprenderás cómo eliminar filas duplicadas de una tabla en SQL Server.

Introducción eliminar filas duplicadas

Para eliminar las filas duplicadas en una tabla en SQL Server, sigue estos pasos:

Encuentra filas duplicadas usando la cláusula GROUP BY o la función ROW_NUMBER().
Use la declaración DELETE para eliminar las filas duplicadas.

Configuración de una tabla de ejemplo

Primero, crea una nueva tabla llamada sales.contacts de la siguiente manera:

DROP TABLE IF EXISTS sales.contacts;

CREATE TABLE sales.contacts(
    contact_id INT IDENTITY(1,1) PRIMARY KEY,
    first_name NVARCHAR(100) NOT NULL,
    last_name NVARCHAR(100) NOT NULL,
    email NVARCHAR(255) NOT NULL,
);

En segundo lugar, insertar algunas filas en la tabla sales.contacts:

INSERT INTO sales.contacts
    (first_name,last_name,email)
VALUES
    ('Syed','Abbas','[email protected]'),
    ('Catherine','Abel','[email protected]'),
    ('Kim','Abercrombie','[email protected]'),
    ('Kim','Abercrombie','[email protected]'),
    ('Kim','Abercrombie','[email protected]'),
    ('Hazem','Abolrous','[email protected]'),
    ('Hazem','Abolrous','[email protected]'),
    ('Humberto','Acevedo','[email protected]'),
    ('Humberto','Acevedo','[email protected]'),
    ('Pilar','Ackerman','[email protected]');

Tercero, consultar los datos de la tabla sales.contacts:

SELECT
   contact_id,
   first_name,
   last_name,
   email
FROM
   sales.contacts;

Resultado:

contact_id	first_name	last_name	email
1	Syed	Abbas	[email protected]
2	Catherine	Abel	[email protected]
3	Kim	Abercrombie	[email protected]
4	Kim	Abercrombie	[email protected]
5	Kim	Abercrombie	[email protected]
6	Hazem	Abolrous	[email protected]
7	Hazem	Abolrous	[email protected]
8	Humberto	Acevedo	[email protected]
9	Humberto	Acevedo	[email protected]
10	Pilar	Ackerman	[email protected]

Hay muchas filas duplicadas (3,4,5), (6,7) y (8,9) para los contactos que tienen el mismo nombre, apellido y correo electrónico.

Eliminar filas duplicadas en la tabla de ejemplo

La siguiente instrucción utiliza una expresión de tabla común (CTE) para eliminar filas duplicadas:

WITH cte AS (
    SELECT
        contact_id,
        first_name,
        last_name,
        email,
        ROW_NUMBER() OVER (
            PARTITION BY
                first_name,
                last_name,
                email
            ORDER BY
                first_name,
                last_name,
                email
        ) row_num
     FROM
        sales.contacts
)
DELETE FROM cte
WHERE row_num > 1;

Resultado

(4 rows affected)

En esta declaración:

Primero, el CTE usa la función ROW_NUMBER() para encontrar las filas duplicadas especificadas por valores en las columnas first_name, last_name y email.
Luego, la declaración DELETE elimina todas las filas duplicadas, pero mantiene solo una aparición de cada grupo duplicado.

Si vuelves a consultar los datos de la tabla sales.contacts, verá que se eliminan todas las filas duplicadas.

SELECT contact_id,
       first_name,
       last_name,
       email
FROM sales.contacts
ORDER BY first_name,
         last_name,
         email;

Resultado:

contact_id	first_name	last_name	email
1	Syed	Abbas	[email protected]
2	Catherine	Abel	[email protected]
3	Kim	Abercrombie	[email protected]
6	Hazem	Abolrous	[email protected]
8	Humberto	Acevedo	[email protected]
10	Pilar	Ackerman	[email protected]