• Saltar al contenido principal
  • Skip to secondary menu
  • Saltar a la barra lateral principal
  • Saltar al pie de página
  • Inicio
  • Secciones
    • Ciencia de datos
    • Criptografía
    • Herramientas
    • Machine Learning
    • Noticias
    • Opinión
    • Productividad
    • Programación
      • JavaScript
      • Julia
      • Matlab
      • Python
      • R
  • Programación
    • JavaScript
    • Julia
    • Matlab
    • Python
    • R
  • Laboratorio
    • Estadística
      • Calculadora del Tamaño Muestral en Encuestas
      • Calculadora de estadísticos descriptivos
      • Test de normalidad
      • Calculadora de contrastes de hipotesis
      • Calculadora de tamano del efecto
      • Simulador de Regresión Lineal con Ruido
      • Visualizador de PCA
      • Visualizador de Series Temporales
      • Simulador de Regresión Logística
      • Simulador de K-Means
      • Simulador de DBSCAN
      • Detector de la Ley de Benford
    • Probabilidad
      • Calculadora de Probabilidad de Distribuciones
      • Calculadora de Probabilidades de Lotería
      • Simulador del Problema de Monty Hall
      • Simulador de la Estrategia Martingala
    • Finanzas
      • Calculadora de Préstamos e Hipotecas
      • Conversor TIN ↔ TAE
      • Calculadora DCA con ajuste por inflación
      • Calculadora XIRR con Flujos Irregulares
      • Simulador FIRE (Financial Independence, Retire Early)
    • Riesgo
      • Constructor de Scorecards de Crédito
      • Aplicar Scorecard de Crédito
    • Herramientas
      • Formateador / Minificador de JSON
      • Conversor CSV ↔ JSON
      • Comparador y Formateador de Texto y JSON
      • Formateador y Tester de Expresiones Regulares
      • Inspector de JWT
      • Generador y verificador de hashes
      • Codificador / Decodificador Base64 y URL
      • Conversor de bases numericas
      • Conversor de Timestamp Unix
      • Conversor de colores
      • Generador de UUIDs
    • Juegos
      • Tres en Raya
      • Nim con Q-Learning
    • Más
      • Método D’Hondt
      • Generador de Contraseñas Seguras
  • Noticias
  • Boletín
  • Contacto
  • Tienda
    • Libros
    • Equipamiento de oficina
    • Equipamiento en movilidad

Analytics Lane

Ciencia e ingeniería de datos aplicada

  • Ciencia de datos
  • Machine Learning
  • IA Generativa
  • Python
  • Pandas
  • NumPy
  • R
  • Excel

Identificar y eliminar duplicados en Excel

marzo 13, 2019 Por Daniel Rodríguez Deja un comentario
Tiempo de lectura: 3 minutos


Una situación habitual a la hora de trabajar con conjuntos de datos es la existencia de registros duplicados en los mismos. Siendo esto un problema para muchos análisis. Si no se identifica correctamente los valores duplicados los resultados que se obtengan pueden no ser válidos. Una de las herramientas más utilizadas para realizar análisis básicos es Excel. Por lo que saber cómo identificar y eliminar duplicados en Excel puede ser de utilidad.

Identificación valores duplicados

A modo de ejemplo se va a utilizar un archivo con 20 clientes generados aleatoriamente. Cada registro cuenta con un identificador único, nombre, apellido, correo electrónico, género y dirección IP. El contenido del archivo utilizado se puede ver en la siguiente captura de pantalla.

Fichero de ejemplo con los datos de los clientes
Fichero de ejemplo con los datos de los clientes

Una forma de identificar los registros duplicados es mediante la utilización de formatos condicionales. En primer lugar, es necesario seleccionar los registros e ir a menu Inicio > Formato Condicional > Reglas para resaltar las celdas > Valores duplicados.

Selección del formato para resaltar valores duplicados
Selección del formato para resaltar valores duplicados

Al seleccionar el menú aparecerá un asistente en el que se pueden seleccionar las siguientes opciones.

Opciones del formato para valores duplicados
Opciones del formato para valores duplicados

Obteniendo como resultado que las celdas con valores duplicados se marcaran de un color diferente.

Nuevo test de normalidad interactivo en el laboratorio de Analytics Lane
En Analytics Lane
Nuevo test de normalidad interactivo en el laboratorio de Analytics Lane

Resultado de aplicar el formato de valores duplicados en excel
Resultado de aplicar el formato de valores duplicados en excel

Identificación de registros duplicados

En Excel se puede ver que se resaltan con un color diferente las celdas con valores duplicados. Aunque esta duplicidad de valores tenga sentido para los datos, como puede ser el género. Si se desea identificar los registros se puede concatenar las diferentes celdas de una fila y aplicar sobre esta celda el formato condicional. Por ejemplo, concatenando todas las columnas menos el identificador en la columna H mediante la fórmula

=CONCATENAR(B2;C2;D2;E2;F2)

Aplicando el formato condicional sobre esta columna se puede obtener una visión más clara de los registros duplicados. En el ejemplo son los registros con 5, 9, 14 y 20.

Resaltado por registro
Resaltado por registro

Publicidad


Eliminación de los registros duplicados en Excel

Finalmente, los registros que se han identificado como duplicados se pueden eliminar. No es necesario hacerlo a mano ya que Excel dispone de una herramienta para ello. En primer lugar, situarse en sobre los datos y seleccionar el menú Datos > Quitar Duplicados. Apareciendo una ventana en la que se puede seleccionar las columnas a utilizar para identificar un duplicado.

Asistente para seleccionar columnas para identificar duplicados
Asistente para seleccionar columnas para identificar duplicados

En el ejemplo es necesario seleccionar todas las columnas menos la A, en la que se encuentra el identificador. Al pulsar sobre aplicar se eliminan los dos registros duplicados.

Archivo con los registros duplicados eliminados
Archivo con los registros duplicados eliminados

Conclusiones

Hoy se ha visto cómo identificar y eliminar duplicados en Excel. Un problema que suele ser bastante habitual. Al saber como hacer esta tarea en Excel es posible realizar análisis básicos sin la necesidad de utilizar otros entornos como Python.

Imágenes: Pixabay (Engin Akyurt)

¿Te ha parecido de utilidad el contenido?

¡Puntúalo entre una y cinco estrellas!

Puntuación promedio 3 / 5. Votos emitidos: 2

Ya que has encontrado útil este contenido...

¡Síguenos en redes sociales!

¡Siento que este contenido no te haya sido útil!

¡Déjame mejorar este contenido!

Dime, ¿cómo puedo mejorar este contenido?

Publicaciones relacionadas

  • Nuevo test de normalidad interactivo en el laboratorio de Analytics Lane
  • Nuevo conversor de timestamp Unix en el laboratorio de Analytics Lane
  • Calculadora de Contrastes de Hipótesis: interpreta correctamente el p-valor y toma decisiones estadísticas con confianza
  • Calculadora de Tamaño del Efecto: la herramienta clave para entender cuánto importa realmente una diferencia
  • Simulador de DBSCAN: descubre cómo encontrar clusters reales (y ruido) sin fijar K
  • Conversor de Colores: convierte, compara y valida cualquier color en tiempo real
  • Analytics Lane lanza su Generador de UUIDs: identificadores únicos, seguros y listos para producción en segundos
  • 1200 publicaciones en Analytics Lane
  • Analytics Lane lanza su Conversor TIN ↔ TAE: la herramienta definitiva para entender el coste real de depósitos, préstamos e hipotecas

Publicado en: Herramientas Etiquetado como: Excel

Interacciones con los lectores

Deja una respuesta Cancelar la respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

I accept the Terms and Conditions and the Privacy Policy

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.

Barra lateral principal

Suscríbete a nuestro boletín

Suscríbete al boletín semanal para estar al día de todas las publicaciones.

Política de Privacidad

Analytics Lane en redes sociales

  • Amazon
  • Bluesky
  • Facebook
  • GitHub
  • Instagram
  • Mastodon
  • Pinterest
  • RSS
  • Telegram
  • Tumblr
  • Twitter
  • YouTube

Publicidad

Entradas recientes

Interés compuesto: la fuerza que multiplica tu dinero (y los errores que la anulan)

mayo 14, 2026 Por Daniel Rodríguez

Cómo comparar datos con barras en Matplotlib: agrupadas, apiladas y porcentuales

mayo 12, 2026 Por Daniel Rodríguez

Costes hundidos en ciencia de datos: cuándo mantener un modelo y cuándo migrar

mayo 7, 2026 Por Daniel Rodríguez

Publicidad

Es tendencia

  • Cerca La regresión logística publicado el julio 23, 2018 | en Ciencia de datos
  • Modificar los atajos de teclado en máquinas virtuales Modificar los atajos de teclado en máquinas virtuales VirtualBox publicado el octubre 1, 2018 | en Herramientas
  • La pantalla del sistema operativo anfitrión no se adapta al de la pantalla en VirtualBox Configuración del tamaño de pantalla en VirtualBox publicado el noviembre 11, 2022 | en Herramientas
  • Programador de tareas de Windows: Guía definitiva para automatizar tu trabajo (BAT, PowerShell y Python) publicado el octubre 7, 2025 | en Herramientas, Productividad
  • Seleccionar la opción para compactar la base de datos en Microsoft SQL Server Manager Studio Reducir el tamaño en SQL Server de una base de datos publicado el febrero 10, 2023 | en Herramientas

Publicidad

Lo mejor valorado

4.9 (24)

Seleccionar filas y columnas en Pandas con iloc y loc

4.6 (16)

Archivos JSON con Python: lectura y escritura

4.4 (14)

Ordenación de diccionarios en Python mediante clave o valor

4.7 (13)

Operaciones de filtrado de DataFrame con Pandas en base a los valores de las columnas

4.9 (11)

Pandas: Cambiar los tipos de datos en los DataFrames

Comentarios recientes

  • bif en JSON en bases de datos: cuándo es buena idea y cuándo no
  • bif en Cómo desinstalar Oracle Database 19c en Windows
  • M. Pilar en Cómo eliminar las noticias en Windows 11 y recuperar tu concentración
  • Daniel Rodríguez en Probabilidad básica: cómo entender el azar en nuestra vida diaria
  • Pepe en Probabilidad básica: cómo entender el azar en nuestra vida diaria

Publicidad


Footer

Analytics Lane

  • Acerca de Analytics Lane
  • Boletín de noticias
  • Contacto
  • Libros
  • Lo más popular
  • Noticias
  • Tienda
  • Tiendas afiliadas

Secciones

  • Ciencia de datos
  • Criptografía
  • Herramientas
  • Machine Learning
  • Opinión
  • Productividad
  • Programación
  • Reseñas

Sobre de Analytics Lane

En Analytics Lane tratamos de explicar los principales conceptos de la ciencia e ingeniería de datos con un enfoque práctico. Los principales temas tratados son ciencia de datos, ingeniería de datos, inteligencia artificial, machine learning, deep learning y criptografía. Además, también se habla de los principales lenguajes de programación y herramientas utilizadas por los científicos e ingenieros de datos.

Copyright © 2018-2026 Analytics Lane ·Términos y condiciones ·Política de Cookies ·Política de Privacidad ·Herramientas de privacidad ·Contacto