課程信息
4.8
1,471 個評分
215 個審閱
專項課程
100% 在線

100% 在線

立即開始,按照自己的計劃學習。
可靈活調整截止日期

可靈活調整截止日期

根據您的日程表重置截止日期。
中級

中級

完成時間(小時)

完成時間大約為44 小時

建議:8 hours/week...
可選語言

俄語(Russian)

字幕:俄語(Russian)...

您將獲得的技能

Random ForestPython ProgrammingMachine LearningSupervised Learning
專項課程
100% 在線

100% 在線

立即開始,按照自己的計劃學習。
可靈活調整截止日期

可靈活調整截止日期

根據您的日程表重置截止日期。
中級

中級

完成時間(小時)

完成時間大約為44 小時

建議:8 hours/week...
可選語言

俄語(Russian)

字幕:俄語(Russian)...

教學大綱 - 您將從這門課程中學到什麼

1
完成時間(小時)
完成時間為 9 小時

Машинное обучение и линейные модели

Добро пожаловать на курс "Обучение на размеченных данных"! В этом модуле вы узнаете, что такое машинное обучение, какие в нём бывают постановки задачи, и что особенного в обучении на размеченных данных. Затем вы изучите один из основных способов решения задач обучения на размеченных данных — предсказание с помощью линейных моделей. Мы обсудим, как их настраивать и применять в задачах регрессии и классификации. В практических заданиях вы поработаете с настоящими данными и узнаете, какие проблемы в них можно обнаружить, а также попробуете делать прогнозы при помощи линейных моделей....
Reading
13 個視頻(共 82 分鐘), 8 個閱讀材料, 8 個測驗
Video13 個視頻
Как устроена специализация, и зачем ее проходить3分鐘
МФТИ1分鐘
Знакомство с машинным обучением11分鐘
Обучение на размеченных данных5分鐘
Обучение без учителя5分鐘
Признаки в машинном обучении8分鐘
Линейные модели в задачах регрессии9分鐘
Обучение линейной регрессии6分鐘
Градиентный спуск для линейной регрессии7分鐘
Стохастический градиентный спуск4分鐘
Линейная классификация6分鐘
Функции потерь в задачах классификации6分鐘
Reading8 個閱讀材料
Формат специализации и получение сертификата10分鐘
Немного о Yandex10分鐘
МФТИ10分鐘
Forum&Chat10分鐘
Слайды к лекциям10分鐘
Конспект10分鐘
Слайды к лекциям10分鐘
Конспект10分鐘
Quiz6 個練習
Основные термины в машинном обучении6分鐘
Типы задач в машинном обучении6分鐘
Машинное обучение: задачи и признаки12分鐘
Линейная регрессия4分鐘
Градиентный спуск4分鐘
Линейные модели8分鐘
2
完成時間(小時)
完成時間為 9 小時

Борьба с переобучением и оценивание качества

Вторая неделя нашего курса будет посвящена общим вопросам, с которыми приходится столкнуться в любой задаче анализа данных. Вы узнаете, что такое проблема переобучения, из-за чего она возникает, как её можно обнаружить и как с ней бороться — в частности, вы познакомитесь с кросс-валидацией, с помощью которой можно оценить способность алгоритма давать хорошие предсказания на новых данных. Далее речь пойдёт о метриках качества — без них невозможно понять, подходит ли алгоритм для решения той или иной задачи. Наконец, вы познакомитесь с библиотекой scikit-learn, которая является одним из основных инструментов современных специалистов по анализу данных....
Reading
14 個視頻(共 126 分鐘), 9 個閱讀材料, 8 個測驗
Video14 個視頻
Регуляризация7分鐘
Оценивание качества алгоритмов7分鐘
Сравнение алгоритмов и выбор гиперпараметров4分鐘
Метрики качества в задачах регрессии10分鐘
Метрики качества классификации4分鐘
Точность и полнота8分鐘
Объединение точности и полноты5分鐘
Качество оценок принадлежности классу12分鐘
Встроенные датасеты. Sklearn.datasets15分鐘
Кросс-валидация. Sklearn.cross_validation9分鐘
Линейные модели. Sklearn.linear_model. Классификация10分鐘
Линейные модели. Sklearn.linear_model. Регрессия7分鐘
Метрики качества. Sklearn.metrics13分鐘
Reading9 個閱讀材料
Слайды к лекциям10分鐘
Конспект10分鐘
Слайды к лекциям10分鐘
Конспект10分鐘
Встроенные датасеты. Sklearn.datasets (ipython notebook)10分鐘
Кросс-валидация. Sklearn.cross_validation (ipython notebook)10分鐘
Линейные модели. Sklearn.linear_model. Классификация (ipython notebook)10分鐘
Линейные модели. Sklearn.linear_model. Регрессия (ipython notebook)10分鐘
Метрики качества. Sklearn.metrics (ipython notebook)10分鐘
Quiz6 個練習
Проблема переобучения6分鐘
Проблема переобучения и борьба с ней10分鐘
Как измерить качество алгоритма?6分鐘
Метрики качества10分鐘
Встроенные датасеты и кросс-валидация8分鐘
Введение в scikit-learn10分鐘
3
完成時間(小時)
完成時間為 7 小時

Линейные модели: классификация и практические аспекты

Добро пожаловать на третью неделю курса! Вы уже поработали с линейными моделями, научились измерять их качество и устранять переобучение с помощью регуляризации. Пришло время разобраться, почему регуляризация действительно помогает уменьшить сложность модели или произвести отбор признаков — об этом пойдёт речь в первом уроке. Там же вы познакомитесь с логистической регрессией, которая является одним из наиболее популярных методов для решения задач классификации. Далее вы узнаете о некоторых важных нюансах работы с линейными моделями: масштабировании признаков, переходе в новые признаковые пространства и т.д. Мы не только расскажем обо всём этом, но и покажем, как оно работает в Python и библиотеке scikit-learn....
Reading
14 個視頻(共 97 分鐘), 8 個閱讀材料, 7 個測驗
Video14 個視頻
Метод максимального правдоподобия4分鐘
Регрессия как максимизация правдоподобия2分鐘
Регрессия как оценка среднего4分鐘
Регуляризация8分鐘
Задача оценивания вероятностей и логистическая регрессия8分鐘
Масштабирование признаков6分鐘
Спрямляющие пространства5分鐘
Работа с категориальными признаками4分鐘
Несбалансированные данные5分鐘
Многоклассовая классификация4分鐘
Подбор параметров по сетке. Sklearn.grid_search9分鐘
Задача: bike sharing demand15分鐘
Задача: bike sharing demand. Продолжение13分鐘
Reading8 個閱讀材料
Слайды к лекциям10分鐘
Конспект10分鐘
Слайды к лекциям10分鐘
Конспект10分鐘
Подбор параметров по сетке. Sklearn.grid_search (ipython notebook)10分鐘
Задача Bike Sharing Demand (ipython notebook)10分鐘
Задача Bike Sharing Demand. Продолжение (ipython notebook)10分鐘
Практика Machine Learning10分鐘
Quiz6 個練習
Метод максимального правдоподобия6分鐘
Линейные модели: статистический взгляд14分鐘
Линейные модели: подготовка признаков6分鐘
Линейные модели: практические аспекты6分鐘
Подбор параметров по сетке6分鐘
Анализ данных в scikit-learn12分鐘
4
完成時間(小時)
完成時間為 10 小時

Решающие деревья и композиции алгоритмов

Линейные модели — очень важный и полезный, но слишком простой класс алгоритмов в машинном обучении; не во всех задачах они позволяют добиться желаемого качества. В этом модуле вы познакомитесь с новым семейством алгоритмов — решающими деревьями. Они во многом являются полной противоположностью линейных моделей. В частности, сами по себе они очень сложны и подвержены переобучению. При этом оказывается, что если объединить много деревьев в одну сложную модель, то можно получить очень качественное решение. Об этом крайне важном подходе — построении композиций решающих деревьев — мы в основном и будем говорить на этой неделе....
Reading
17 個視頻(共 114 分鐘), 10 個閱讀材料, 8 個測驗
Video17 個視頻
Обучение решающих деревьев6分鐘
Критерии информативности7分鐘
Критерии останова и стрижка деревьев4分鐘
Решающие деревья и категориальные признаки8分鐘
Решающие деревья в sklearn10分鐘
Композиции деревьев6分鐘
Смещение и разброс9分鐘
Случайные леса6分鐘
Трюки со случайными лесами4分鐘
Случайные леса в sklearn7分鐘
Композиции простых алгоритмов5分鐘
Градиентный бустинг7分鐘
Борьба с переобучением в градиентном бустинге6分鐘
Градиентный бустинг для регрессии и классификации4分鐘
Градиентный бустинг над решающими деревьями5分鐘
Градиентный бустинг в XGBoost5分鐘
Reading10 個閱讀材料
Решающие деревья в sklearn (ipython notebook)10分鐘
Слайды к лекциям10分鐘
Конспект10分鐘
Случайные леса в sklearn (ipython notebook)10分鐘
Слайды к лекциям10分鐘
Конспект10分鐘
XGBoost10分鐘
Градиентный бустинг в XGBoost (ipython notebook)10分鐘
Слайды к лекциям10分鐘
Конспект10分鐘
Quiz6 個練習
Построение решающих деревьев8分鐘
Решающие деревья14分鐘
Бэггинг6分鐘
Композиции и случайные леса8分鐘
Обучение композиций и градиентный бустинг4分鐘
Градиентный бустинг: обучение и практические аспекты8分鐘
4.8
職業方向

71%

完成這些課程後已開始新的職業生涯
工作福利

83%

通過此課程獲得實實在在的工作福利
職業晉升

33%

加薪或升職

熱門審閱

創建者 ADApr 29th 2018

Хороший курс, много времени уделено объяснению теории. На мой взгляд - лучше параллельно читать с "The elements of statistical learning", там некоторые моменты подробнее объясняются.

創建者 STJul 23rd 2017

Relatively good course with diversity of material, almost all easy to understand(except into bayes theory for those who haven't got some theory at uni), best regards to tutors.

講師

Avatar

Константин Воронцов

доктор физико-математических наук, профессор
Кафедра интеллектуальных систем

關於 Moscow Institute of Physics and Technology

Московский физико-технический институт (неофициально известный как МФТИ или Физтех) является одним из самых престижных в мире учебных и научно-исследовательских институтов. Он готовит высококвалифицированных специалистов в области теоретической и прикладной физики, прикладной математики, информатики, биотехнологии и смежных дисциплин. Физтех был основан в 1951 году Нобелевской премии лауреатами Петром Капицей, Николаем Семеновым, Львом Ландау и Сергеем Христиановичем. Основой образования в МФТИ является уникальная «система Физтеха»: кропотливое воспитание и отбор самых талантливых абитуриентов, фундаментальное образование высшего класса и раннее вовлечение студентов в реальную научно-исследовательскую работу. Среди выпускников МФТИ есть Нобелевские лауреаты, основатели всемирно известных компаний, известные космонавты, изобретатели, инженеры....

關於 Yandex

Yandex is a technology company that builds intelligent products and services powered by machine learning. Our goal is to help consumers and businesses better navigate the online and offline world....

關於 Машинное обучение и анализ данных 專項課程

Мы покажем, как проходит полный цикл анализа, от сбора данных до выбора оптимального решения и оценки его качества. Вы научитесь пользоваться современными аналитическими инструментами и адаптировать их под особенности конкретных задач. В рамках специализации вы освоите основные темы, необходимые в работе с большим массивом данных, в т.ч. современные методы классификации и регрессии, поиск структуры в данных, проведение экспериментов, построение выводов, базовая фундаментальная математика, основы программирования на Python. Мы разберём, как построить рекомендательную систему, оценить эмоциональную окраску текста, спрогнозировать спрос на товар, оценить вероятность клика по рекламе и т.д. В финале вам потребуется выполнить проект собственной системы, решающей любую актуальную для бизнеса задачу. Результатом будет наглядная работающая модель, которую вы сможете использовать в вашей повседневной работе или продемонстрировать на собеседовании. Все, прошедшие специализацию, могут принять участие в Программе трудоустройства. Если вы заинтересованы в новых проектах, новых перспективах и возможностях - пройдите обучение по Специализации и подайте заявку....
Машинное обучение и анализ данных

常見問題

  • 注册以便获得证书后,您将有权访问所有视频、测验和编程作业(如果适用)。只有在您的班次开课之后,才可以提交和审阅同学互评作业。如果您选择在不购买的情况下浏览课程,可能无法访问某些作业。

  • 您注册课程后,将有权访问专项课程中的所有课程,并且会在完成课程后获得证书。您的电子课程证书将添加到您的成就页中,您可以通过该页打印您的课程证书或将其添加到您的领英档案中。如果您只想阅读和查看课程内容,可以免费旁听课程。

還有其他問題嗎?請訪問 學生幫助中心