• Saltar al contenido principal
  • Skip to secondary menu
  • Saltar a la barra lateral principal
  • Saltar al pie de página
  • Inicio
  • Secciones
    • Ciencia de datos
    • Criptografía
    • Herramientas
    • Machine Learning
    • Noticias
    • Opinión
    • Productividad
    • Programación
      • JavaScript
      • Julia
      • Matlab
      • Python
      • R
  • Programación
    • JavaScript
    • Julia
    • Matlab
    • Python
    • R
  • Laboratorio
    • Encuestas: Tamaño de Muestra
    • Lotería: Probabilidad de Ganar
    • Reparto de Escaños (D’Hondt)
    • Tres en Raya con IA
  • Noticias
  • Boletín
  • Contacto
  • Tienda
    • Libros
    • Equipamiento de oficina
    • Equipamiento en movilidad
    • Tiendas afiliadas
      • AliExpress
      • Amazon
      • Banggood
      • GeekBuying
      • Lenovo

Analytics Lane

Ciencia e ingeniería de datos aplicada

  • Ciencia de datos
  • Machine Learning
  • IA Generativa
  • Python
  • Pandas
  • NumPy
  • Excel
  • Matlab

¿Media, mediana o moda en variables ordinales? Guía práctica para el análisis de datos

octubre 28, 2025 Por Daniel Rodríguez Deja un comentario
Tiempo de lectura: 7 minutos

Cuando comenzamos un análisis de datos, uno de los primeros pasos suele ser resumir las variables mediante medidas de tendencia central: la media, la mediana y la moda. Estas estadísticas nos ayudan a identificar el valor “típico” o más representativo de un conjunto de datos. Sin embargo, no todas las variables son iguales, y la elección de la medida más adecuada depende de la naturaleza de cada una. En particular, las variables ordinales representan un desafío especial por su combinación única de orden y limitaciones cuantitativas.

En esta entrada abordaremos una pregunta fundamental sobre los análisis que se pueden o deben realizar sobre este tipo de variables:

¿Tiene sentido calcular la media de una variable ordinal? ¿O es más adecuado usar la mediana o la moda?

Para lo que explicaremos qué representa cada medida en el contexto de las variables ordinales, cuándo es justificable utilizar una u otra y te mostraremos ejemplos prácticos que puedes aplicar fácilmente en tus análisis. Al finalizar, contarás con una base sólida para decidir cómo tratar las variables ordinales en tus encuestas, estudios o informes.

Tabla de contenidos

  • 1 ¿Qué son las variables ordinales?
    • 1.1 ¿Por qué es tan importante la falta de intervalos constantes en las variables ordinales?
  • 2 La media: ¿es válida para variables ordinales?
    • 2.1 ¿Qué implica calcular la media?
    • 2.2 Ejemplo práctico
    • 2.3 ¿Cuándo puede usarse la media?
    • 2.4 Riesgos al usar la media en variables ordinales
    • 2.5 Recomendación
  • 3 La mediana: la opción más robusta
    • 3.1 ¿Qué es la mediana?
      • 3.1.1 Ejemplo práctico
    • 3.2 Ventajas claras frente a la media
    • 3.3 ¿Y si hay empates?
  • 4 La moda: simple y directa
    • 4.1 ¿Qué es la moda?
      • 4.1.1 Ejemplo práctico
    • 4.2 Ventajas
    • 4.3 Limitaciones
  • 5 Comparación: ¿cuál elegir?
    • 5.1 Guía práctica
  • 6 Conclusiones

¿Qué son las variables ordinales?

Las variables ordinales son un tipo de variable categórica cuyas categorías poseen un orden lógico o jerárquico, pero sin una escala numérica que permita medir con precisión la distancia entre ellas. Esto las diferencia claramente de los otros dos tipos de variables:

¿Está concentrado el MSCI World? Un análisis con Gini, Lorenz y leyes de potencia
En Analytics Lane
¿Está concentrado el MSCI World? Un análisis con Gini, Lorenz y leyes de potencia

  • Nominales: no tienen un orden definido (por ejemplo, género, color).
  • Cuantitativas: tienen orden y permiten medir intervalos (por ejemplo, edad, ingresos).

A continuación, se muestran algunos ejemplos comunes de variables ordinales:

VariableCategorías (ordenadas)
Nivel educativoPrimaria < Secundaria < Universidad < Posgrado
SatisfacciónMuy insatisfecho < Insatisfecho < Neutral < Satisfecho < Muy satisfecho
Frecuencia de usoNunca < A veces < Frecuentemente < Siempre
CalificaciónMuy malo < Malo < Regular < Bueno < Excelente

Aunque estas categorías a menudo se codifican con números (por ejemplo, del 1 al 5), estos números solo representan el orden, no una magnitud real. Es decir, un “4” no es necesariamente el doble de un “2”, ni la diferencia entre “3” y “4” implica lo mismo que entre “4” y “5”.

Publicidad


¿Por qué es tan importante la falta de intervalos constantes en las variables ordinales?

La ausencia de intervalos constantes entre categorías implica que operaciones como sumar o promediar —fundamentales para calcular la media— pueden carecer de sentido teórico en este tipo de variables. Por eso, es crucial evaluar cuidadosamente qué medida de tendencia central utilizar cuando trabajamos con variables ordinales.

La media: ¿es válida para variables ordinales?

Probablemente la medida más conocida en estadística, pero… ¿tiene sentido usarla en variables ordinales?

Publicidad


¿Qué implica calcular la media?

La media aritmética se obtiene sumando todos los valores y dividiendo entre el número total de observaciones. Este cálculo asume que los valores representan cantidades reales con intervalos constantes, una suposición que no se cumple necesariamente en las variables ordinales.

Ejemplo práctico

Supongamos una encuesta de satisfacción con una escala de 1 a 5:

  • 1 = Muy insatisfecho
  • 2 = Insatisfecho
  • 3 = Neutral
  • 4 = Satisfecho
  • 5 = Muy satisfecho

Con los siguientes datos: [3, 4, 4, 5, 2, 3, 4, 4, 5, 3]

La media sería: \frac{3 + 4 + 4 + 5 + 2 + 3 + 4 + 4 + 5 + 3}{10} = 3,7

Aquí surge el problema: 3,7 no es una categoría real. ¿Qué significa estar “en un punto intermedio” entre Neutral (3) y Satisfecho (4)? La interpretación es ambigua porque estamos asumiendo que las diferencias entre niveles son constantes, algo que no siempre se puede justificar.

Publicidad


¿Cuándo puede usarse la media?

Aunque teóricamente discutible, en la práctica la media puede ser útil en ciertos contextos, como:

  • Cuando la escala tiene cinco o más niveles, lo que la hace comportarse aproximadamente como una variable continua.
  • Si las categorías parecen equitativamente espaciadas, como en algunas escalas Likert bien diseñadas.
  • Para comparar grupos, aun si no podemos interpretar el valor absoluto con precisión.

Por ejemplo:

  • Jóvenes: media = 4,2
  • Adultos: media = 3,5

Esto sugiere mayor satisfacción entre los jóvenes. Aunque no podamos afirmar cuánto más satisfechos están, sí nos da una idea clara de la tendencia general. Lo mismo ocurre al comparar productos o servicios: si un artículo tiene una media de 4,6 y otro de 3,8, podemos inferir que el primero genera más satisfacción, aunque no podamos cuantificar esa diferencia con precisión.

Riesgos al usar la media en variables ordinales

Aplicar la media a variables ordinales conlleva ciertos riesgos que conviene tener en cuenta al interpretar los resultados:

  • Falsa precisión: Un valor como 3,7 parece exacto, pero no corresponde a una categoría definida.
  • Distorsión: En distribuciones sesgadas o polarizadas (por ejemplo, muchas valoraciones de 1 y 5), la media puede ocultar patrones importantes.
  • Mala toma de decisiones: Basarse exclusivamente en la media puede llevar a conclusiones equivocadas, sobre todo si no se acompaña de otras estadísticas.

Publicidad


Recomendación

Si decides usar la media, hazlo con cautela y ten en cuenta los siguientes puntos:

  • Asegúrate de que la escala tenga suficientes niveles.
  • Acompaña la media con otras medidas (como la mediana o la distribución de frecuencias).
  • Sé consciente de que no estás midiendo cantidades reales, sino promedios de códigos simbólicos.

En resumen, la media puede ofrecer información útil, pero su validez depende del contexto y de cómo se interprete.

La mediana: la opción más robusta

En comparación con la media, la mediana es una alternativa más robusta, especialmente útil cuando hay valores extremos o distribuciones asimétricas. Pero, ¿tiene sentido usarla en variables ordinales? La respuesta es sí, y con buena razón.

Publicidad


¿Qué es la mediana?

La mediana es el valor central de un conjunto de datos ordenados: divide la distribución en dos mitades, dejando el 50 % de los valores por debajo y el 50 % por encima.

A diferencia de la media, no necesita asumir que los intervalos entre categorías son iguales, solo requiere que las observaciones están ordenadas. Esto la convierte en una medida ideal para variables ordinales.

Ejemplo práctico

Si volvemos sobre el ejemplo de datos del ejemplo usado en la media se tiene los datos originales: [3, 4, 4, 5, 2, 3, 4, 4, 5, 3]

Para obtener la mediana es necesario ordenarlos: [2, 3, 3, 3, 4, 4, 4, 4, 5, 5]

En este caso, como el número de electos es par, la mediana se calcula tomando el promedio del 5º y 6º valor: \text{Mediana} = \frac{4 + 4}{2} = 4
$$

Resultado: 4 → Satisfecho

En el caso de que las opciones fueran impares, el resultado sería simplemente el valor en el medio de los ordenados.

Ventajas claras frente a la media

A diferencia de la media (que daba 3,7), la mediana ofrece las siguientes ventajas a la hora de interpretar el resultado:

  • Es una categoría real (salvo empate que sería el punto intermedio de dos categorías).
  • No asume intervalos iguales.
  • Es robusta frente a valores extremos o asimetrías.
  • Refleja el punto central real de la distribución.
  • Siempre está en la escala original, facilitando así su interpretación.

Estas características hacen que la mediana sea más fiel al tipo de datos ordinales.

Publicidad


¿Y si hay empates?

Es común que en escalas ordinales haya muchas respuestas repetidas, especialmente en encuestas con opciones como “Neutral” o “Satisfecho”.

En estos casos, la mediana sigue siendo válida y útil. Sin embargo, puede resultar informativo complementar con la moda, especialmente si se quiere entender cuál fue la respuesta más frecuente.

La moda: simple y directa

Posiblemente el estadístico más sencillo de entender. Pero, ¿es una buena opción para variables ordinales?

Publicidad


¿Qué es la moda?

La moda es simplemente la categoría que más se repite. No necesita orden ni intervalos: solo cuenta ocurrencias.

Ejemplo práctico

Volviendo sobre el ejemplo visto en las secciones anteriores, los datos que se tienen son: [3, 4, 4, 5, 2, 3, 4, 4, 5, 3]

De los que se pueden obtener las frecuencias de cada uno:

  • 2: 1
  • 3: 3
  • 4: 4
  • 5: 2

Moda: 4 → Satisfecho

Ventajas

Las principales ventajas de la moda son:

  • Fácil de calcular e interpretar
  • Siempre corresponde a una categoría real (aquí si hay empate tendremos una distribución multimodal)
  • Útil para detectar respuestas mayoritarias o consensos

Publicidad


Limitaciones

A pesar de sus ventajas, la moda no está exenta de problemas:

  • Puede haber múltiples modas (bimodal, multimodal)
  • No considera el orden entre categorías

Comparación: ¿cuál elegir?

En la siguiente tabla se muestra una comparación entre los diferentes estadísticos en función de las características del conjunto de datos que se está estudiando:

CaracterísticaMediaMedianaModa
Requiere intervalos iguales✅ Sí❌ No❌ No
Necesita orden✅ Sí✅ Sí❌ No
Valor real en la escala❌ No✅ Sí✅ Sí
Robusta ante extremos❌ No✅ Sí✅ Sí
Recomendado para ordinales⚠️ Con reservas✅ Sí✅ Como complemento

Publicidad


Guía práctica

En resumen, usa cada estadístico en función de lo que quieras analizar en tus datos:

  • ✅ Mediana: Tu medida principal para representar el centro.
  • ✅ Moda: Complemento útil para ver cuál fue la opción más popular.
  • ⚠️ Media: Solo si tienes una buena justificación (poco habitual).

Conclusiones

Las variables ordinales tienen orden, pero no distancias iguales entre categorías. Esto limita el uso de algunas medidas estadísticas.

  • La mediana es la opción más robusta y representativa.
  • La moda aporta una perspectiva clara y fácil de entender.
  • La media puede ser engañosa y se debe usar con mucha precaución.

Recomendación final: usa la mediana como medida principal, acompáñala con la moda para enriquecer el análisis y evita depender exclusivamente de la media.

Nota: La imagen de este artículo fue generada utilizando un modelo de inteligencia artificial.

¿Te ha parecido de utilidad el contenido?

¡Puntúalo entre una y cinco estrellas!

Puntuación promedio 0 / 5. Votos emitidos: 0

Ya que has encontrado útil este contenido...

¡Síguenos en redes sociales!

¡Siento que este contenido no te haya sido útil!

¡Déjame mejorar este contenido!

Dime, ¿cómo puedo mejorar este contenido?

Publicidad


Publicaciones relacionadas

  • ¿Está concentrado el MSCI World? Un análisis con Gini, Lorenz y leyes de potencia
  • Curiosidad: ¿Por qué usamos p < 0.05? Un umbral que cambió la historia de la ciencia
  • Programador de tareas de Windows: Guía definitiva para automatizar tu trabajo (BAT, PowerShell y Python)
  • La Paradoja del Cumpleaños, o por qué no es tan raro compartir fecha de nacimiento
  • Cómo abrir una ventana de Chrome con tamaño y posición específicos desde la línea de comandos en Windows
  • Curiosidad: El sesgo de supervivencia, o por qué prestar atención sólo a los que “llegaron” puede engañarte
  • Documentar tu API de Express con TypeScript usando OpenAPI (Swagger)
  • Data Lake y Data Warehouse: diferencias, usos y cómo se complementan en la era del dato

Publicado en: Ciencia de datos

Interacciones con los lectores

Deja una respuesta Cancelar la respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

I accept the Terms and Conditions and the Privacy Policy

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.

Barra lateral principal

Suscríbete a nuestro boletín

Suscríbete al boletín semanal para estar al día de todas las publicaciones.

Política de Privacidad

Analytics Lane en redes sociales

  • Amazon
  • Bluesky
  • Facebook
  • GitHub
  • Instagram
  • Mastodon
  • Pinterest
  • RSS
  • Telegram
  • Tumblr
  • Twitter
  • YouTube

Publicidad

Entradas recientes

¿Media, mediana o moda en variables ordinales? Guía práctica para el análisis de datos

octubre 28, 2025 Por Daniel Rodríguez

Data Lake y Data Warehouse: diferencias, usos y cómo se complementan en la era del dato

octubre 23, 2025 Por Daniel Rodríguez

Documentar tu API de Express con TypeScript usando OpenAPI (Swagger)

octubre 21, 2025 Por Daniel Rodríguez

Publicidad

Es tendencia

  • Gráficos de barras en Matplotlib publicado el julio 5, 2022 | en Python
  • Función de interpolación lineal en Excel sin VBA publicado el noviembre 3, 2021 | en Herramientas
  • Copiar y pegar Activar copiar y pegar en VirtualBox publicado el mayo 1, 2019 | en Herramientas
  • Creación de gráficos de barras y gráficos de columnas con Seaborn publicado el julio 18, 2023 | en Python
  • Obtención de valores únicos de una columna con Pandas publicado el mayo 8, 2019 | en Python

Publicidad

Lo mejor valorado

4.9 (24)

Seleccionar filas y columnas en Pandas con iloc y loc

4.6 (16)

Archivos JSON con Python: lectura y escritura

4.4 (14)

Ordenación de diccionarios en Python mediante clave o valor

4.7 (13)

Operaciones de filtrado de DataFrame con Pandas en base a los valores de las columnas

4.5 (10)

Diferencias entre var y let en JavaScript

Publicidad

Comentarios recientes

  • Daniel Rodríguez en Probabilidad básica: cómo entender el azar en nuestra vida diaria
  • Pepe en Probabilidad básica: cómo entender el azar en nuestra vida diaria
  • CARLOS ARETURO BELLO CACERES en Justicio: La herramienta gratuita de IA para consultas legales
  • Piera en Ecuaciones multilínea en Markdown
  • Daniel Rodríguez en Tutorial de Mypy para Principiantes

Publicidad


Footer

Analytics Lane

  • Acerca de Analytics Lane
  • Boletín de noticias
  • Contacto
  • Libros
  • Lo más popular
  • Noticias
  • Tienda
  • Tiendas afiliadas

Secciones

  • Ciencia de datos
  • Criptografía
  • Herramientas
  • Machine Learning
  • Opinión
  • Productividad
  • Programación
  • Reseñas

Sobre de Analytics Lane

En Analytics Lane tratamos de explicar los principales conceptos de la ciencia e ingeniería de datos con un enfoque práctico. Los principales temas tratados son ciencia de datos, ingeniería de datos, inteligencia artificial, machine learning, deep learning y criptografía. Además, también se habla de los principales lenguajes de programación y herramientas utilizadas por los científicos e ingenieros de datos.

Copyright © 2018-2025 Analytics Lane ·Términos y condiciones ·Política de Cookies ·Política de Privacidad ·Herramientas de privacidad ·Contacto