課程信息

65,312 次近期查看
可分享的證書
完成後獲得證書
100% 在線
立即開始,按照自己的計劃學習。
可靈活調整截止日期
根據您的日程表重置截止日期。
中級
完成時間大約為12 小時
英語(English)

您將獲得的技能

Data ScienceApache SparkSQL
可分享的證書
完成後獲得證書
100% 在線
立即開始,按照自己的計劃學習。
可靈活調整截止日期
根據您的日程表重置截止日期。
中級
完成時間大約為12 小時
英語(English)

提供方

Placeholder

加州大学戴维斯分校

教學大綱 - 您將從這門課程中學到什麼

1

1

完成時間為 3 小時

Introduction to Spark

完成時間為 3 小時
6 個視頻 (總計 32 分鐘), 3 個閱讀材料, 2 個測驗
6 個視頻
Why Distributed Computing?7分鐘
Spark DataFrames6分鐘
The Databricks Environment8分鐘
SQL in Notebooks3分鐘
Import Data2分鐘
3 個閱讀材料
A Note From UC Davis10分鐘
Readings and Resources40分鐘
Assignment #1 - Queries in Spark SQL30分鐘
2 個練習
Assignment #1 Quiz - Queries in Spark SQL30分鐘
Module 1 Quiz30分鐘
2

2

完成時間為 2 小時

Spark Core Concepts

完成時間為 2 小時
6 個視頻 (總計 25 分鐘), 2 個閱讀材料, 2 個測驗
6 個視頻
Spark Terminology3分鐘
Caching5分鐘
Shuffle Partitions7分鐘
Spark UI3分鐘
Broadcast Joins3分鐘
2 個閱讀材料
Readings30分鐘
Assignment #2 - Spark Internals30分鐘
2 個練習
Assignment #2 Quiz - Spark Internals30分鐘
Module 2 Quiz30分鐘
3

3

完成時間為 3 小時

Engineering Data Pipelines

完成時間為 3 小時
7 個視頻 (總計 43 分鐘), 2 個閱讀材料, 2 個測驗
7 個視頻
Spark as a Connector6分鐘
Accessing Data10分鐘
File Formats8分鐘
Schemas and Types4分鐘
Writing Data6分鐘
Managed and Unmanaged Tables4分鐘
2 個閱讀材料
Readings1小時
Assignment #3 - Engineering Data Pipelines30分鐘
2 個練習
Assignment #3 Quiz - Engineering Data Pipelines30分鐘
Module 3 Quiz30分鐘
4

4

完成時間為 4 小時

Machine Learning Applications of Spark

完成時間為 4 小時
7 個視頻 (總計 35 分鐘), 2 個閱讀材料, 3 個測驗
7 個視頻
Applications of Machine Learning4分鐘
Machine Learning Fundamentals6分鐘
Linear Regression6分鐘
Training Linear Regression Model8分鐘
Applying Machine Learning with UDFs4分鐘
Course Summary3分鐘
2 個閱讀材料
Readings1小時
Assignment #4 - Logistic Regression Classifier10分鐘
2 個練習
Assignment #4 Quiz - Logistic Regression Classifier30分鐘
Module 4 Quiz30分鐘

審閱

來自DISTRIBUTED COMPUTING WITH SPARK SQL的熱門評論

查看所有評論

關於 Learn SQL Basics for Data Science 專項課程

Learn SQL Basics for Data Science

常見問題

還有其他問題嗎?請訪問 學生幫助中心