• Saltar al contenido principal
  • Skip to secondary menu
  • Saltar a la barra lateral principal
  • Saltar al pie de página
  • Inicio
  • Secciones
    • Ciencia de datos
    • Criptografía
    • Herramientas
    • Machine Learning
    • Noticias
    • Opinión
    • Productividad
    • Programación
      • JavaScript
      • Julia
      • Matlab
      • Python
      • R
  • Programación
    • JavaScript
    • Julia
    • Matlab
    • Python
    • R
  • Laboratorio
    • Estadística
      • Calculadora del Tamaño Muestral en Encuestas
      • Calculadora de estadísticos descriptivos
      • Test de normalidad
      • Calculadora de contrastes de hipotesis
      • Calculadora de tamano del efecto
      • Simulador de Regresión Lineal con Ruido
      • Visualizador de PCA
      • Visualizador de Series Temporales
      • Simulador de Regresión Logística
      • Simulador de K-Means
      • Simulador de DBSCAN
      • Detector de la Ley de Benford
    • Probabilidad
      • Calculadora de Probabilidad de Distribuciones
      • Calculadora de Probabilidades de Lotería
      • Simulador del Problema de Monty Hall
      • Simulador de la Estrategia Martingala
    • Finanzas
      • Calculadora de Préstamos e Hipotecas
      • Conversor TIN ↔ TAE
      • Calculadora DCA con ajuste por inflación
      • Calculadora XIRR con Flujos Irregulares
      • Simulador FIRE (Financial Independence, Retire Early)
    • Negocios
      • CLV
      • Scoring
    • Herramientas
      • Formateador / Minificador de JSON
      • Conversor CSV ↔ JSON
      • Comparador y Formateador de Texto y JSON
      • Formateador y Tester de Expresiones Regulares
      • Inspector de JWT
      • Generador y verificador de hashes
      • Codificador / Decodificador Base64 y URL
      • Conversor de bases numericas
      • Conversor de Timestamp Unix
      • Conversor de colores
      • Generador de UUIDs
    • Juegos
      • Tres en Raya
      • Nim con Q-Learning
    • Más
      • Método D’Hondt
      • Generador de Contraseñas Seguras
  • Noticias
  • Boletín
  • Contacto
  • Tienda
    • Libros
    • Equipamiento de oficina
    • Equipamiento en movilidad

Analytics Lane

Ciencia e ingeniería de datos aplicada

  • Ciencia de datos
  • Machine Learning
  • IA Generativa
  • Python
  • Pandas
  • NumPy
  • R
  • Excel

Manipulación de dimensiones en Numpy: Uso de np.reshape() y np.flatten()

diciembre 2, 2024 Por Daniel Rodríguez Deja un comentario
Tiempo de lectura: 4 minutos

NumPy

Al trabajar con conjuntos de datos reales, es poco común que estos lleguen en el formato ideal para su uso directo. Por lo general, es necesario reorganizar, transformar o modificar su estructura para adaptarlos a los requisitos específicos de diferentes algoritmos o modelos. Numpy, una de las bibliotecas más populares de Python para operaciones matemáticas y manipulación de datos, ofrece herramientas altamente eficientes para la manipulación de dimensiones, entre las que destacan dos funciones clave: np.reshape() y np.flatten().

En esta entrada, explicaremos cómo las funciones np.reshape() y np.flatten() permiten modificar la forma y estructura de los arrays de manera eficiente. Estas herramientas son fundamentales para abordar problemas comunes en ciencia de datos y machine learning, como la preparación de datos para entrenar modelos, la transformación de imágenes y la consolidación de datos multidimensionales en formatos adecuados para su análisis o procesamiento.

Tabla de contenidos

  • 1 La necesidad de la manipulación de dimensiones
  • 2 Las funciones np.reshape() y np.flatten()
    • 2.1 np.reshape()
    • 2.2 np.flatten()
  • 3 Ejemplos prácticos
    • 3.1 Transformacionales de una matriz con np.reshape()
    • 3.2 Aplanar un array con np.flatten()
    • 3.3 Trabajar con arrays 3D: Preparación de datos de imágenes
    • 3.4 Calcular automáticamente las dimensiones: Uso de -1 en reshape()
  • 4 Conclusiónes

La necesidad de la manipulación de dimensiones

Los datos rara vez están organizados de manera óptima para realizar un análisis o entrenar un modelo. Por ejemplo, un conjunto de datos que representa las ventas mensuales de una tienda en varias regiones. Una forma común de estructurarlos es mediante una matriz 2D, donde las filas representan los meses y las columnas las regiones. Sin embargo, para ciertos análisis podría ser más útil reorganizarlos en un formato diferente, como una lista unidimensional o un tensor 3D.

La caverna del consumo, o cómo Greenspan miraba calzoncillos para hacer política monetaria – El bestiario de los indicadores económicos absurdos (parte 1)
En Analytics Lane
La caverna del consumo, o cómo Greenspan miraba calzoncillos para hacer política monetaria – El bestiario de los indicadores económicos absurdos (parte 1)

Para abordar este tipo de transformaciones, Numpy ofrece las funciones reshape() y flatten(), que permiten modificar la estructura de los datos de forma sencilla, eficiente y fiable, facilitando su adaptación a diversas necesidades analíticas o computacionales.

Las funciones np.reshape() y np.flatten()

En primer lugar, veamos para qué están pensadas las funciones np.reshape() y np.flatten() de NumPy

Publicidad


np.reshape()

La función reshape() permite cambiar la forma de un array sin alterar sus datos. Permite especificar las nuevas dimensiones que se deseen, siempre que el número total de elementos permanezca constante. Esto hace que sea ideal para reorganizar datos en diferentes estructuras. Su sintaxis básica es la que se muestra a continuación:

np.reshape(array, new_shape)

np.flatten()

La función flatten() convierte un array multidimensional en un array unidimensional. Es útil cuando se necesita consolidar los datos en una lista para el análisis, la visualización o el procesamiento en algoritmos que requieren datos planos. Su sintaxis básica es la que se muestra a continuación:

array.flatten()

Ejemplos prácticos

Una vez visto para qué son las funciones np.reshape() y np.flatten() de NumPy se pueden usar en algunos casos prácticos.

Publicidad


Transformacionales de una matriz con np.reshape()

Supongamos que se tienen los datos en una matriz 2×6 y se desea reorganizar estos en una matriz 3×4. Para ello se le pasa como primer parámetro a np.reshape() la matriz original y como segundo la dimensiones de la nueva matriz. Esto es lo que se muestra en el siguiente ejemplo:

import numpy as np

# Datos originales: matriz 2x6
ventas = np.array([[100, 200, 300, 400, 500, 600],
                   [700, 800, 900, 1000, 1100, 1200]])

# Reorganizar en una matriz 3x4
ventas_reshape = np.reshape(ventas, (3, 4))
print(ventas_reshape)
[[ 100  200  300  400]
[ 500 600 700 800]
[ 900 1000 1100 1200]]

En este ejemplo, se ha cambiado de una matriz de 2×6 a otra de 3×4 sin alterar el contenido de los datos.

Aplanar un array con np.flatten()

Si lo que se necesita es disponer de los datos en un array unidimensional se debe recurrir al método flatten(). En este caso, simplemente se debe llamar al método del objeto para obtener un vector, como se muestra a continuación:

# Aplanar la matriz original
ventas_flat = ventas.flatten()
print(ventas_flat)
[ 100  200  300  400  500  600  700  800  900 1000 1100 1200]

Esta operación es útil para algoritmos que requieren vectores de entrada o para exportar los datos a otros formatos.

Trabajar con arrays 3D: Preparación de datos de imágenes

En procesamiento de imágenes, a menudo es necesario convertir imágenes 2D (ancho x alto) en tensores 3D (canales x ancho x alto). Con reshape(), es posible transformar una imagen 2D en el tensor adecuado.

# Crear una imagen simulada de 6x6
imagen = np.arange(36).reshape(6, 6)

# Convertirla en un tensor 3D con 3 canales
imagen_tensor = np.reshape(imagen, (3, 2, 6))
print(imagen_tensor)
[[[ 0  1  2  3  4  5]
[ 6 7 8 9 10 11]]

[[12 13 14 15 16 17]
[18 19 20 21 22 23]]

[[24 25 26 27 28 29]
[30 31 32 33 34 35]]]

Esta operación de manipulación de dimensiones es esencial para poder alimentar imágenes a redes neuronales que procesan datos en formato tensorial.

Publicidad


Calcular automáticamente las dimensiones: Uso de -1 en reshape()

Un truco bastante útil en reshape() es usar -1 como una de las dimensiones. Esto le dice a Numpy que calcule automáticamente esa dimensión en función del número total de elementos y las otras dimensiones especificadas. Evitando así la necesidad de realizar este cálculo antes de llamar a la función. Esto se puede ver en el siguiente ejemplo

# Reorganizar la matriz original a 3 filas con forma automática de columnas
ventas_auto = np.reshape(ventas, (3, -1))
print(ventas_auto)
[[ 100  200  300  400]
[ 500 600 700 800]
[ 900 1000 1100 1200]]

Al compararlo con el primer ejemplo, se puede ver que ahora no ha sido necesario saber antes de llamar a la función cuál era el número de columnas, ya que lo ha calculado la función en base al número de elementos de la matriz original.

Conclusiónes

Dominar la manipulación de dimensiones con np.reshape() y np.flatten() es una habilidad fundamental para cualquier persona que utilice Numpy y Python en el manejo de datos. Estas herramientas no sólo simplifican tareas como el preprocesamiento y la transformación de datos, sino que también optimizan el rendimiento al eliminar la necesidad de operaciones manuales e ineficientes.

Entender cómo y cuándo emplear estas funciones permite resolver problemas complejos de manipulación de datos de manera efectiva, además de facilitar la escritura de código más limpio, legible y eficiente.

¿Te ha parecido de utilidad el contenido?

¡Puntúalo entre una y cinco estrellas!

Puntuación promedio 5 / 5. Votos emitidos: 1

Ya que has encontrado útil este contenido...

¡Síguenos en redes sociales!

¡Siento que este contenido no te haya sido útil!

¡Déjame mejorar este contenido!

Dime, ¿cómo puedo mejorar este contenido?

Publicaciones relacionadas

  • La caverna del consumo, o cómo Greenspan miraba calzoncillos para hacer política monetaria – El bestiario de los indicadores económicos absurdos (parte 1)
  • Analytics Lane lanza la versión 1.1 del laboratorio con nuevas suites de CLV y Scoring
  • Subplots en Matplotlib: cómo organizar múltiples gráficos en una sola figura
  • Cómo comparar datos con barras en Matplotlib: agrupadas, apiladas y porcentuales
  • Ley de Benford: cómo detectar datos manipulados con ejemplos reales
  • Costes hundidos en ciencia de datos: cuándo mantener un modelo y cuándo migrar
  • Síndrome del objeto brillante en ciencia de datos: el error simétrico a los costes hundidos
  • WOE e IV: La Base Matemática del Credit Scoring
  • De la Regresión Logística al Scorecard: La Transformación Matemática

Publicado en: Python Etiquetado como: NumPy

Interacciones con los lectores

Deja una respuesta Cancelar la respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

I accept the Terms and Conditions and the Privacy Policy

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.

Barra lateral principal

Suscríbete a nuestro boletín

Suscríbete al boletín semanal para estar al día de todas las publicaciones.

Política de Privacidad

Analytics Lane en redes sociales

  • Amazon
  • Bluesky
  • Facebook
  • GitHub
  • Instagram
  • Mastodon
  • Pinterest
  • RSS
  • Telegram
  • Tumblr
  • Twitter
  • YouTube

Publicidad

Entradas recientes

La caverna del consumo, o cómo Greenspan miraba calzoncillos para hacer política monetaria – El bestiario de los indicadores económicos absurdos (parte 1)

junio 4, 2026 Por Daniel Rodríguez

Calibración vs Discriminación en Credit Scoring: diferencias clave y cómo evaluarlas

junio 2, 2026 Por Daniel Rodríguez

Ley de Benford: cómo detectar datos manipulados con ejemplos reales

mayo 28, 2026 Por Daniel Rodríguez

Publicidad

Es tendencia

  • Codificación JSON Archivos JSON con Python: lectura y escritura publicado el julio 16, 2018 | en Python
  • Buscar en Excel con dos o más criterios publicado el septiembre 7, 2022 | en Herramientas
  • Introducción al Análisis de Componentes Principales (PCA) publicado el mayo 3, 2024 | en Ciencia de datos
  • pandas Eliminar las filas con valores nulos en Pandas publicado el abril 24, 2023 | en Python
  • La pantalla del sistema operativo anfitrión no se adapta al de la pantalla en VirtualBox Configuración del tamaño de pantalla en VirtualBox publicado el noviembre 11, 2022 | en Herramientas

Publicidad

Lo mejor valorado

4.9 (24)

Seleccionar filas y columnas en Pandas con iloc y loc

4.6 (16)

Archivos JSON con Python: lectura y escritura

4.4 (14)

Ordenación de diccionarios en Python mediante clave o valor

4.7 (13)

Operaciones de filtrado de DataFrame con Pandas en base a los valores de las columnas

4.1 (11)

Aplicar el método D’Hondt en Excel

Comentarios recientes

  • bif en JSON en bases de datos: cuándo es buena idea y cuándo no
  • bif en Cómo desinstalar Oracle Database 19c en Windows
  • M. Pilar en Cómo eliminar las noticias en Windows 11 y recuperar tu concentración
  • Daniel Rodríguez en Probabilidad básica: cómo entender el azar en nuestra vida diaria
  • Pepe en Probabilidad básica: cómo entender el azar en nuestra vida diaria

Publicidad


Footer

Analytics Lane

  • Acerca de Analytics Lane
  • Boletín de noticias
  • Contacto
  • Libros
  • Lo más popular
  • Noticias
  • Tienda
  • Tiendas afiliadas

Secciones

  • Ciencia de datos
  • Criptografía
  • Herramientas
  • Machine Learning
  • Opinión
  • Productividad
  • Programación
  • Reseñas

Sobre de Analytics Lane

En Analytics Lane tratamos de explicar los principales conceptos de la ciencia e ingeniería de datos con un enfoque práctico. Los principales temas tratados son ciencia de datos, ingeniería de datos, inteligencia artificial, machine learning, deep learning y criptografía. Además, también se habla de los principales lenguajes de programación y herramientas utilizadas por los científicos e ingenieros de datos.

Copyright © 2018-2026 Analytics Lane ·Términos y condiciones ·Política de Cookies ·Política de Privacidad ·Herramientas de privacidad ·Contacto