Cuando comenzamos un análisis de datos, uno de los primeros pasos suele ser resumir las variables mediante medidas de tendencia central: la media, la mediana y la moda. Estas estadísticas nos ayudan a identificar el valor “típico” o más representativo de un conjunto de datos. Sin embargo, no todas las variables son iguales, y la elección de la medida más adecuada depende de la naturaleza de cada una. En particular, las variables ordinales representan un desafío especial por su combinación única de orden y limitaciones cuantitativas.
En esta entrada abordaremos una pregunta fundamental sobre los análisis que se pueden o deben realizar sobre este tipo de variables:
¿Tiene sentido calcular la media de una variable ordinal? ¿O es más adecuado usar la mediana o la moda?
Para lo que explicaremos qué representa cada medida en el contexto de las variables ordinales, cuándo es justificable utilizar una u otra y te mostraremos ejemplos prácticos que puedes aplicar fácilmente en tus análisis. Al finalizar, contarás con una base sólida para decidir cómo tratar las variables ordinales en tus encuestas, estudios o informes.
Tabla de contenidos
Las variables ordinales son un tipo de variable categórica cuyas categorías poseen un orden lógico o jerárquico, pero sin una escala numérica que permita medir con precisión la distancia entre ellas. Esto las diferencia claramente de los otros dos tipos de variables:
A continuación, se muestran algunos ejemplos comunes de variables ordinales:
| Variable | Categorías (ordenadas) |
|---|---|
| Nivel educativo | Primaria < Secundaria < Universidad < Posgrado |
| Satisfacción | Muy insatisfecho < Insatisfecho < Neutral < Satisfecho < Muy satisfecho |
| Frecuencia de uso | Nunca < A veces < Frecuentemente < Siempre |
| Calificación | Muy malo < Malo < Regular < Bueno < Excelente |
Aunque estas categorías a menudo se codifican con números (por ejemplo, del 1 al 5), estos números solo representan el orden, no una magnitud real. Es decir, un “4” no es necesariamente el doble de un “2”, ni la diferencia entre “3” y “4” implica lo mismo que entre “4” y “5”.
La ausencia de intervalos constantes entre categorías implica que operaciones como sumar o promediar —fundamentales para calcular la media— pueden carecer de sentido teórico en este tipo de variables. Por eso, es crucial evaluar cuidadosamente qué medida de tendencia central utilizar cuando trabajamos con variables ordinales.
Probablemente la medida más conocida en estadística, pero… ¿tiene sentido usarla en variables ordinales?
La media aritmética se obtiene sumando todos los valores y dividiendo entre el número total de observaciones. Este cálculo asume que los valores representan cantidades reales con intervalos constantes, una suposición que no se cumple necesariamente en las variables ordinales.
Supongamos una encuesta de satisfacción con una escala de 1 a 5:
Con los siguientes datos: [3, 4, 4, 5, 2, 3, 4, 4, 5, 3]
La media sería: \frac{3 + 4 + 4 + 5 + 2 + 3 + 4 + 4 + 5 + 3}{10} = 3,7
Aquí surge el problema: 3,7 no es una categoría real. ¿Qué significa estar “en un punto intermedio” entre Neutral (3) y Satisfecho (4)? La interpretación es ambigua porque estamos asumiendo que las diferencias entre niveles son constantes, algo que no siempre se puede justificar.
Aunque teóricamente discutible, en la práctica la media puede ser útil en ciertos contextos, como:
Por ejemplo:
Esto sugiere mayor satisfacción entre los jóvenes. Aunque no podamos afirmar cuánto más satisfechos están, sí nos da una idea clara de la tendencia general. Lo mismo ocurre al comparar productos o servicios: si un artículo tiene una media de 4,6 y otro de 3,8, podemos inferir que el primero genera más satisfacción, aunque no podamos cuantificar esa diferencia con precisión.
Aplicar la media a variables ordinales conlleva ciertos riesgos que conviene tener en cuenta al interpretar los resultados:
Si decides usar la media, hazlo con cautela y ten en cuenta los siguientes puntos:
En resumen, la media puede ofrecer información útil, pero su validez depende del contexto y de cómo se interprete.
En comparación con la media, la mediana es una alternativa más robusta, especialmente útil cuando hay valores extremos o distribuciones asimétricas. Pero, ¿tiene sentido usarla en variables ordinales? La respuesta es sí, y con buena razón.
La mediana es el valor central de un conjunto de datos ordenados: divide la distribución en dos mitades, dejando el 50 % de los valores por debajo y el 50 % por encima.
A diferencia de la media, no necesita asumir que los intervalos entre categorías son iguales, solo requiere que las observaciones están ordenadas. Esto la convierte en una medida ideal para variables ordinales.
Si volvemos sobre el ejemplo de datos del ejemplo usado en la media se tiene los datos originales: [3, 4, 4, 5, 2, 3, 4, 4, 5, 3]
Para obtener la mediana es necesario ordenarlos: [2, 3, 3, 3, 4, 4, 4, 4, 5, 5]
En este caso, como el número de electos es par, la mediana se calcula tomando el promedio del 5º y 6º valor: \text{Mediana} = \frac{4 + 4}{2} = 4
$$
Resultado: 4 → Satisfecho
En el caso de que las opciones fueran impares, el resultado sería simplemente el valor en el medio de los ordenados.
A diferencia de la media (que daba 3,7), la mediana ofrece las siguientes ventajas a la hora de interpretar el resultado:
Estas características hacen que la mediana sea más fiel al tipo de datos ordinales.
Es común que en escalas ordinales haya muchas respuestas repetidas, especialmente en encuestas con opciones como “Neutral” o “Satisfecho”.
En estos casos, la mediana sigue siendo válida y útil. Sin embargo, puede resultar informativo complementar con la moda, especialmente si se quiere entender cuál fue la respuesta más frecuente.
Posiblemente el estadístico más sencillo de entender. Pero, ¿es una buena opción para variables ordinales?
La moda es simplemente la categoría que más se repite. No necesita orden ni intervalos: solo cuenta ocurrencias.
Volviendo sobre el ejemplo visto en las secciones anteriores, los datos que se tienen son: [3, 4, 4, 5, 2, 3, 4, 4, 5, 3]
De los que se pueden obtener las frecuencias de cada uno:
Moda: 4 → Satisfecho
Las principales ventajas de la moda son:
A pesar de sus ventajas, la moda no está exenta de problemas:
En la siguiente tabla se muestra una comparación entre los diferentes estadísticos en función de las características del conjunto de datos que se está estudiando:
| Característica | Media | Mediana | Moda |
|---|---|---|---|
| Requiere intervalos iguales | ✅ Sí | ❌ No | ❌ No |
| Necesita orden | ✅ Sí | ✅ Sí | ❌ No |
| Valor real en la escala | ❌ No | ✅ Sí | ✅ Sí |
| Robusta ante extremos | ❌ No | ✅ Sí | ✅ Sí |
| Recomendado para ordinales | ⚠️ Con reservas | ✅ Sí | ✅ Como complemento |
En resumen, usa cada estadístico en función de lo que quieras analizar en tus datos:
Las variables ordinales tienen orden, pero no distancias iguales entre categorías. Esto limita el uso de algunas medidas estadísticas.
Recomendación final: usa la mediana como medida principal, acompáñala con la moda para enriquecer el análisis y evita depender exclusivamente de la media.
Nota: La imagen de este artículo fue generada utilizando un modelo de inteligencia artificial.
En la era del dato, las organizaciones se enfrentan al reto de gestionar volúmenes masivos…
En la serie Creación de una API REST con Express y TypeScript construimos una API…
Durante la Segunda Guerra Mundial, la Fuerza Aérea de Estados Unidos quería reforzar sus aviones…
En muchas situaciones —ya sea para grabar un tutorial, tomar capturas de pantalla profesionales, probar…
Imagínate en una sala con un grupo de personas, por ejemplo, en una oficina, un…
En el trabajo diario con ordenadores, es común encontrarse con tareas repetitivas: realizar copias de…
This website uses cookies.