Explorar precios de acciones con Spark SQL

提供方
Coursera Project Network
在此指導項目中,您將:

Cree una aplicación que se ejecute en un clúster de Spark

Obtenga conocimiento de los datos utilizando Spark RDD y DataFrames

Almacenar resultados en tablas de parquet

Clock2 horas
Intermediate中級
Cloud無需下載
Video分屏視頻
Comment Dots西班牙語(Spanish)
Laptop僅限桌面

En este proyecto guiado de 1 hora, aprenderemos cómo interactuar con un clúster de Spark usando el entorno Jupyter y cómo crear una aplicación Spark. Aprenderemos a utilizar Spark Resisilent Distributed Datasets y Spark Data Frames para explorar colecciones de datos. Cargaremos un conjunto de datos en nuestro programa Spark y realizaremos análisis de datos utilizando acciones, transformaciones, Spark DataFrame API y Spark SQL. Aprenderemos como elegir las mejores herramientas para utilizar en cada escenario. Finalmente, aprenderemos a guardar resultados en tablas de Parquet.

您要培養的技能

  • Spark SQL
  • Apache Parquet
  • Big Data
  • Apache Spark
  • Exploratory Data Analysis

分步進行學習

在與您的工作區一起在分屏中播放的視頻中,您的授課教師將指導您完成每個步驟:

  1. Al final de la Tarea 1, se familiarizará con el entorno de desarrollo Jupyter.

  2. Al final de la Tarea 2, podrá crear una aplicación Spark

  3. Al final de la Tarea 3, podrá crear conjuntos de datos distribuidos resistentes (RDD) en Spark

  4. Al final de la Tarea 4, podrá crear Spark Data Frames

  5. Al final de la Tarea 5, podrá explorar conjuntos de datos con Spark SQL

  6. Al final de la Tarea 6, podrá escribir consultas estadísticas y comparaciones de datos con Spark DataFrames

  7. Al final de la Tarea 7, podrá almacenar DataFrames en tablas Parquet

指導項目工作原理

您的工作空間就是瀏覽器中的雲桌面,無需下載

在分屏視頻中,您的授課教師會為您提供分步指導

常見問題

常見問題

還有其他問題嗎?請訪問 學生幫助中心