Apache Spark es una solución de código abierto desarrollado para analizar y procesar datos a gran escala. Para utilizar esta herramienta en Python es necesario utilizar el API PySpark. En esta entrada se explicará cómo realizar la instalación de PySpark en Anaconda y cómo utilizar este desde un Notebook.¿Qué es Apache Spark y PySpark?Apache Spark es un motor de código … [Leer más...] acerca de Instalación de PySpark en Anaconda y primeros pasos