• Saltar al contenido principal
  • Skip to secondary menu
  • Saltar a la barra lateral principal
  • Saltar al pie de página
  • Inicio
  • Secciones
    • Ciencia de datos
    • Criptografía
    • Herramientas
    • Machine Learning
    • Noticias
    • Opinión
    • Productividad
    • Programación
      • JavaScript
      • Julia
      • Matlab
      • Python
      • R
  • Programación
    • JavaScript
    • Julia
    • Matlab
    • Python
    • R
  • Laboratorio
    • Estadística
      • Calculadora del Tamaño Muestral en Encuestas
      • Calculadora de estadísticos descriptivos
      • Test de normalidad
      • Calculadora de contrastes de hipotesis
      • Calculadora de tamano del efecto
      • Simulador de Regresión Lineal con Ruido
      • Visualizador de PCA
      • Visualizador de Series Temporales
      • Simulador de Regresión Logística
      • Simulador de K-Means
      • Simulador de DBSCAN
      • Detector de la Ley de Benford
    • Probabilidad
      • Calculadora de Probabilidad de Distribuciones
      • Calculadora de Probabilidades de Lotería
      • Simulador del Problema de Monty Hall
      • Simulador de la Estrategia Martingala
    • Finanzas
      • Calculadora de Préstamos e Hipotecas
      • Conversor TIN ↔ TAE
      • Calculadora DCA con ajuste por inflación
      • Calculadora XIRR con Flujos Irregulares
      • Simulador FIRE (Financial Independence, Retire Early)
    • Negocios
      • CLV
      • Scoring
    • Herramientas
      • Formateador / Minificador de JSON
      • Conversor CSV ↔ JSON
      • Comparador y Formateador de Texto y JSON
      • Formateador y Tester de Expresiones Regulares
      • Inspector de JWT
      • Generador y verificador de hashes
      • Codificador / Decodificador Base64 y URL
      • Conversor de bases numericas
      • Conversor de Timestamp Unix
      • Conversor de colores
      • Generador de UUIDs
    • Juegos
      • Tres en Raya
      • Nim con Q-Learning
    • Más
      • Método D’Hondt
      • Generador de Contraseñas Seguras
  • Noticias
  • Boletín
  • Contacto
  • Tienda
    • Libros
    • Equipamiento de oficina
    • Equipamiento en movilidad

Analytics Lane

Ciencia e ingeniería de datos aplicada

  • Ciencia de datos
  • Machine Learning
  • IA Generativa
  • Python
  • Pandas
  • NumPy
  • R
  • Excel

Preguntas en formularios: preguntar sobre la tendencia

octubre 8, 2018 Por Daniel Rodríguez Deja un comentario
Tiempo de lectura: 3 minutos

Formularios

Se dice que para obtener una buena respuesta es necesario realizar buenas preguntas. Una mala pregunta puede crear confusión en la mente de interlocutor, consiguiendo que su respuesta no sea la deseada. Obviamente, cuando se diseñan formularios para obtener datos estadísticos es necesario tener en cuenta la forma en la que se plantean las preguntas. La forma en la que se plateen estas pueden dar lugar a resultados completamente diferentes en el mismo grupo de personas. Esta entrada inicia una serie en las que se van a cómo puede afectar la forma de preguntar a las repuesta. En esta primera entrada se explican cómo preguntar sobre la tendencia.

Es necesario tener en cuenta que muchos modelos estadísticos se basan en las opiniones de los usuarios o expertos. Cuando no existen datos para la implementación de un modelo, porque los eventos son poco habituales o no se han producido nunca, solamente se dispone de las opiniones que han de ser recogidas y tratadas correctamente. Para ello se han de diseñar cuestionarios en los que se pregunte de forma estructurada.

¿Qué se entiende al preguntar sobre la tendencia?

En estadística existen tres conceptos básicos para medir la tendencia central de los conjuntos de datos o distribuciones, estos conceptos son la media, la mediana y la moda. La media es el promedio del conjunto de datos o distribución. La mediana es el valor de la variable de posición central de un conjunto de datos o distribución. Es decir, es el valor por encima del cual se sitúa la mitad de la muestra de datos y por debajo la otra mitad. Finalmente, la moda es el valor con una mayor frecuencia en la muestra de datos o distribución, pudiendo ser cualquier valor dentro del intervalo.

1200 publicaciones en Analytics Lane
En Analytics Lane
1200 publicaciones en Analytics Lane

En una distribución normal estos tres estadísticos tienen el mismo valor, pero en el resto de las familias de distribuciones no es así. Pudiendo llegar a ser muy diferentes los valores observados en cada una de las medidas. El hecho de existir esta equivalencia en la distribución normal, la más utilizada en múltiples áreas, puede llevar a que la personas sin una formación estadística pueda confundir estos conceptos. De modo que utilizan los tres de forma indistinta. A causa de esto es aconsejable aclarar el concepto por el que se está preguntando (media, mediana o moda) cuando se espera una respuesta concreta.

Interpretación de las preguntas

A pesar de las posibles aclaraciones, e incluso para personas con bastante formación en estadísticas, es complicado estimar el valor concreto de una media, mediana o moda de forma intuitiva a partir de la experiencia. El primer efecto a tener en cuenta es lo mal que los humanos estimamos el promedio de los patrones cuando las series de datos presentan valores externos. Generalmente ignoramos estos valores para centrarnos únicamente en los valores centrales de la muestra. Así cuando se pregunta por la media a una persona es habitual que responda con un valor más cercano a la moda, ya que este valor es el que observa de forma habitual.

Adicionalmente existen otros sesgos cognitivos que, especialmente cuando los datos consultados están basados en la experiencia, juegan en contra de las evaluaciones que se podrían considerar “objetivas”. Por ejemplo, el sesgo por el cual se le da más peso a los eventos recientes que a los pasados desviando el centro de atención hacia el último evento observado. Este sesgo es difícil de controlar y provocando cambios en las respuestas que solamente se pueden gestionar estadísticamente.

Publicidad


Conclusiones

En esta primera entrada se ha visto uno de los problemas habituales a la hora de preguntar en formularios. La confusión que se produce entre la media, la mediana y la desviación estándar. Al preguntar se ha de tener en cuenta estos efectos para saber que se responde en cada caso para adaptar los modelos utilizados. Ignorar los efectos no puede hacer otra cosa que llevar a una interpretación errónea de los datos.

En la próxima entrada de la serie se abordará el problema de la precisión y el entorno en las respuestas.

Imágenes: Pixabay (rawpixel)

¿Te ha parecido de utilidad el contenido?

¡Puntúalo entre una y cinco estrellas!

Puntuación promedio 0 / 5. Votos emitidos: 0

Ya que has encontrado útil este contenido...

¡Síguenos en redes sociales!

¡Siento que este contenido no te haya sido útil!

¡Déjame mejorar este contenido!

Dime, ¿cómo puedo mejorar este contenido?

Publicaciones relacionadas

  • 1200 publicaciones en Analytics Lane
  • Analytics Lane lanza su Conversor TIN ↔ TAE: la herramienta definitiva para entender el coste real de depósitos, préstamos e hipotecas
  • Analytics Lane lanza su Conversor de Bases Numéricas: entiende cómo trabajan los ordenadores a nivel de bits
  • Analytics Lane lanza su Visualizador de Series Temporales: entiende tendencia, estacionalidad y ruido de forma visual e interactiva
  • Analytics Lane lanza un nuevo Formateador y Tester de Expresiones Regulares para desarrolladores
  • Analytics Lane lanza un Conversor CSV ↔ JSON para transformar datos en tiempo real
  • Analytics Lane lanza la versión 1.1 del laboratorio con nuevas suites de CLV y Scoring
  • Analytics Lane lanza una Calculadora de Rentabilidad con Flujos Irregulares basada en TIR (XIRR)
  • ¡Analytics Lane cumple ocho años!

Publicado en: Ciencia de datos Etiquetado como: Small Data

Interacciones con los lectores

Deja una respuesta Cancelar la respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

I accept the Terms and Conditions and the Privacy Policy

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.

Barra lateral principal

Suscríbete a nuestro boletín

Suscríbete al boletín semanal para estar al día de todas las publicaciones.

Política de Privacidad

Analytics Lane en redes sociales

  • Amazon
  • Bluesky
  • Facebook
  • GitHub
  • Instagram
  • Mastodon
  • Pinterest
  • RSS
  • Telegram
  • Tumblr
  • Twitter
  • YouTube

Publicidad

Entradas recientes

Ley de Benford: cómo detectar datos manipulados con ejemplos reales

mayo 28, 2026 Por Daniel Rodríguez

Subplots en Matplotlib: cómo organizar múltiples gráficos en una sola figura

mayo 26, 2026 Por Daniel Rodríguez

Síndrome del objeto brillante en ciencia de datos: el error simétrico a los costes hundidos

mayo 21, 2026 Por Daniel Rodríguez

Publicidad

Es tendencia

  • pandas Pandas: Contar los valores nulos en DataFrame publicado el agosto 12, 2021 | en Python
  • Error: No se puede cargar el archivo porque la ejecución de scripts está deshabilitada en este sistema Solución a los problemas de ejecución de scripts en Windows 11 cuando se da el mensaje: “No se puede cargar el archivo porque la ejecución de scripts está deshabilitada en este sistema” publicado el febrero 14, 2024 | en Herramientas
  • Mejorando la calidad de las imágenes en Jupyter Notebook: Un enfoque completo publicado el marzo 6, 2024 | en Herramientas, Python
  • ¿Cómo eliminar columnas y filas en un dataframe pandas? publicado el marzo 25, 2019 | en Python
  • Truco Python: eliminar los valores duplicados de una lista en Python publicado el junio 29, 2020 | en Python

Publicidad

Lo mejor valorado

4.9 (24)

Seleccionar filas y columnas en Pandas con iloc y loc

4.6 (16)

Archivos JSON con Python: lectura y escritura

4.4 (14)

Ordenación de diccionarios en Python mediante clave o valor

4.7 (13)

Operaciones de filtrado de DataFrame con Pandas en base a los valores de las columnas

4.1 (11)

Aplicar el método D’Hondt en Excel

Comentarios recientes

  • bif en JSON en bases de datos: cuándo es buena idea y cuándo no
  • bif en Cómo desinstalar Oracle Database 19c en Windows
  • M. Pilar en Cómo eliminar las noticias en Windows 11 y recuperar tu concentración
  • Daniel Rodríguez en Probabilidad básica: cómo entender el azar en nuestra vida diaria
  • Pepe en Probabilidad básica: cómo entender el azar en nuestra vida diaria

Publicidad


Footer

Analytics Lane

  • Acerca de Analytics Lane
  • Boletín de noticias
  • Contacto
  • Libros
  • Lo más popular
  • Noticias
  • Tienda
  • Tiendas afiliadas

Secciones

  • Ciencia de datos
  • Criptografía
  • Herramientas
  • Machine Learning
  • Opinión
  • Productividad
  • Programación
  • Reseñas

Sobre de Analytics Lane

En Analytics Lane tratamos de explicar los principales conceptos de la ciencia e ingeniería de datos con un enfoque práctico. Los principales temas tratados son ciencia de datos, ingeniería de datos, inteligencia artificial, machine learning, deep learning y criptografía. Además, también se habla de los principales lenguajes de programación y herramientas utilizadas por los científicos e ingenieros de datos.

Copyright © 2018-2026 Analytics Lane ·Términos y condiciones ·Política de Cookies ·Política de Privacidad ·Herramientas de privacidad ·Contacto