課程信息
4.8
1,514 個評分
220 個審閱
100% 在線

100% 在線

立即開始,按照自己的計劃學習。
可靈活調整截止日期

可靈活調整截止日期

根據您的日程表重置截止日期。
中級

中級

完成時間(小時)

完成時間大約為44 小時

建議:8 hours/week...
可選語言

俄語(Russian)

字幕:俄語(Russian)

您將獲得的技能

Random ForestPython ProgrammingMachine LearningSupervised Learning
100% 在線

100% 在線

立即開始,按照自己的計劃學習。
可靈活調整截止日期

可靈活調整截止日期

根據您的日程表重置截止日期。
中級

中級

完成時間(小時)

完成時間大約為44 小時

建議:8 hours/week...
可選語言

俄語(Russian)

字幕:俄語(Russian)

教學大綱 - 您將從這門課程中學到什麼

1
完成時間(小時)
完成時間為 9 小時

Машинное обучение и линейные модели

Добро пожаловать на курс "Обучение на размеченных данных"! В этом модуле вы узнаете, что такое машинное обучение, какие в нём бывают постановки задачи, и что особенного в обучении на размеченных данных. Затем вы изучите один из основных способов решения задач обучения на размеченных данных — предсказание с помощью линейных моделей. Мы обсудим, как их настраивать и применять в задачах регрессии и классификации. В практических заданиях вы поработаете с настоящими данными и узнаете, какие проблемы в них можно обнаружить, а также попробуете делать прогнозы при помощи линейных моделей....
Reading
13 個視頻 (總計 82 分鐘), 8 個閱讀材料, 8 個測驗
Video13 個視頻
Как устроена специализация, и зачем ее проходить3分鐘
МФТИ1分鐘
Знакомство с машинным обучением11分鐘
Обучение на размеченных данных5分鐘
Обучение без учителя5分鐘
Признаки в машинном обучении8分鐘
Линейные модели в задачах регрессии9分鐘
Обучение линейной регрессии6分鐘
Градиентный спуск для линейной регрессии7分鐘
Стохастический градиентный спуск4分鐘
Линейная классификация6分鐘
Функции потерь в задачах классификации6分鐘
Reading8 個閱讀材料
Формат специализации и получение сертификата10分鐘
Немного о Yandex10分鐘
МФТИ10分鐘
Forum&Chat10分鐘
Слайды к лекциям10分鐘
Конспект10分鐘
Слайды к лекциям10分鐘
Конспект10分鐘
Quiz6 個練習
Основные термины в машинном обучении6分鐘
Типы задач в машинном обучении6分鐘
Машинное обучение: задачи и признаки12分鐘
Линейная регрессия4分鐘
Градиентный спуск4分鐘
Линейные модели8分鐘
2
完成時間(小時)
完成時間為 9 小時

Борьба с переобучением и оценивание качества

Вторая неделя нашего курса будет посвящена общим вопросам, с которыми приходится столкнуться в любой задаче анализа данных. Вы узнаете, что такое проблема переобучения, из-за чего она возникает, как её можно обнаружить и как с ней бороться — в частности, вы познакомитесь с кросс-валидацией, с помощью которой можно оценить способность алгоритма давать хорошие предсказания на новых данных. Далее речь пойдёт о метриках качества — без них невозможно понять, подходит ли алгоритм для решения той или иной задачи. Наконец, вы познакомитесь с библиотекой scikit-learn, которая является одним из основных инструментов современных специалистов по анализу данных....
Reading
14 個視頻 (總計 126 分鐘), 9 個閱讀材料, 8 個測驗
Video14 個視頻
Регуляризация7分鐘
Оценивание качества алгоритмов7分鐘
Сравнение алгоритмов и выбор гиперпараметров4分鐘
Метрики качества в задачах регрессии10分鐘
Метрики качества классификации4分鐘
Точность и полнота8分鐘
Объединение точности и полноты5分鐘
Качество оценок принадлежности классу12分鐘
Встроенные датасеты. Sklearn.datasets15分鐘
Кросс-валидация. Sklearn.cross_validation9分鐘
Линейные модели. Sklearn.linear_model. Классификация10分鐘
Линейные модели. Sklearn.linear_model. Регрессия7分鐘
Метрики качества. Sklearn.metrics13分鐘
Reading9 個閱讀材料
Слайды к лекциям10分鐘
Конспект10分鐘
Слайды к лекциям10分鐘
Конспект10分鐘
Встроенные датасеты. Sklearn.datasets (ipython notebook)10分鐘
Кросс-валидация. Sklearn.cross_validation (ipython notebook)10分鐘
Линейные модели. Sklearn.linear_model. Классификация (ipython notebook)10分鐘
Линейные модели. Sklearn.linear_model. Регрессия (ipython notebook)10分鐘
Метрики качества. Sklearn.metrics (ipython notebook)10分鐘
Quiz6 個練習
Проблема переобучения6分鐘
Проблема переобучения и борьба с ней10分鐘
Как измерить качество алгоритма?6分鐘
Метрики качества10分鐘
Встроенные датасеты и кросс-валидация8分鐘
Введение в scikit-learn10分鐘
3
完成時間(小時)
完成時間為 7 小時

Линейные модели: классификация и практические аспекты

Добро пожаловать на третью неделю курса! Вы уже поработали с линейными моделями, научились измерять их качество и устранять переобучение с помощью регуляризации. Пришло время разобраться, почему регуляризация действительно помогает уменьшить сложность модели или произвести отбор признаков — об этом пойдёт речь в первом уроке. Там же вы познакомитесь с логистической регрессией, которая является одним из наиболее популярных методов для решения задач классификации. Далее вы узнаете о некоторых важных нюансах работы с линейными моделями: масштабировании признаков, переходе в новые признаковые пространства и т.д. Мы не только расскажем обо всём этом, но и покажем, как оно работает в Python и библиотеке scikit-learn....
Reading
14 個視頻 (總計 97 分鐘), 8 個閱讀材料, 7 個測驗
Video14 個視頻
Метод максимального правдоподобия4分鐘
Регрессия как максимизация правдоподобия2分鐘
Регрессия как оценка среднего4分鐘
Регуляризация8分鐘
Задача оценивания вероятностей и логистическая регрессия8分鐘
Масштабирование признаков6分鐘
Спрямляющие пространства5分鐘
Работа с категориальными признаками4分鐘
Несбалансированные данные5分鐘
Многоклассовая классификация4分鐘
Подбор параметров по сетке. Sklearn.grid_search9分鐘
Задача: bike sharing demand15分鐘
Задача: bike sharing demand. Продолжение13分鐘
Reading8 個閱讀材料
Слайды к лекциям10分鐘
Конспект10分鐘
Слайды к лекциям10分鐘
Конспект10分鐘
Подбор параметров по сетке. Sklearn.grid_search (ipython notebook)10分鐘
Задача Bike Sharing Demand (ipython notebook)10分鐘
Задача Bike Sharing Demand. Продолжение (ipython notebook)10分鐘
Практика Machine Learning10分鐘
Quiz6 個練習
Метод максимального правдоподобия6分鐘
Линейные модели: статистический взгляд14分鐘
Линейные модели: подготовка признаков6分鐘
Линейные модели: практические аспекты6分鐘
Подбор параметров по сетке6分鐘
Анализ данных в scikit-learn12分鐘
4
完成時間(小時)
完成時間為 10 小時

Решающие деревья и композиции алгоритмов

Линейные модели — очень важный и полезный, но слишком простой класс алгоритмов в машинном обучении; не во всех задачах они позволяют добиться желаемого качества. В этом модуле вы познакомитесь с новым семейством алгоритмов — решающими деревьями. Они во многом являются полной противоположностью линейных моделей. В частности, сами по себе они очень сложны и подвержены переобучению. При этом оказывается, что если объединить много деревьев в одну сложную модель, то можно получить очень качественное решение. Об этом крайне важном подходе — построении композиций решающих деревьев — мы в основном и будем говорить на этой неделе....
Reading
17 個視頻 (總計 114 分鐘), 10 個閱讀材料, 8 個測驗
Video17 個視頻
Обучение решающих деревьев6分鐘
Критерии информативности7分鐘
Критерии останова и стрижка деревьев4分鐘
Решающие деревья и категориальные признаки8分鐘
Решающие деревья в sklearn10分鐘
Композиции деревьев6分鐘
Смещение и разброс9分鐘
Случайные леса6分鐘
Трюки со случайными лесами4分鐘
Случайные леса в sklearn7分鐘
Композиции простых алгоритмов5分鐘
Градиентный бустинг7分鐘
Борьба с переобучением в градиентном бустинге6分鐘
Градиентный бустинг для регрессии и классификации4分鐘
Градиентный бустинг над решающими деревьями5分鐘
Градиентный бустинг в XGBoost5分鐘
Reading10 個閱讀材料
Решающие деревья в sklearn (ipython notebook)10分鐘
Слайды к лекциям10分鐘
Конспект10分鐘
Случайные леса в sklearn (ipython notebook)10分鐘
Слайды к лекциям10分鐘
Конспект10分鐘
XGBoost10分鐘
Градиентный бустинг в XGBoost (ipython notebook)10分鐘
Слайды к лекциям10分鐘
Конспект10分鐘
Quiz6 個練習
Построение решающих деревьев8分鐘
Решающие деревья14分鐘
Бэггинг6分鐘
Композиции и случайные леса8分鐘
Обучение композиций и градиентный бустинг4分鐘
Градиентный бустинг: обучение и практические аспекты8分鐘
4.8
220 個審閱Chevron Right
職業方向

71%

完成這些課程後已開始新的職業生涯
工作福利

83%

通過此課程獲得實實在在的工作福利
職業晉升

33%

加薪或升職

熱門審閱

創建者 ADDec 2nd 2018

Курс очень живой и интересный, очень доволен. Продолжу проходить специализацию.\n\n5-ая неделя этого курса, как известно, не очень удачная, так что, просто примите ее такой, какая она есть :)

創建者 ZAJul 21st 2017

Курс просто фантастика. Отличное преподавание, много нового. Столько что еще переваривать и переваривать. Немного сжата последняя неделя и на нейронные сети нужно больше времени. Спасибо.

講師

Avatar

Константин Воронцов

доктор физико-математических наук, профессор
Кафедра интеллектуальных систем

關於 Moscow Institute of Physics and Technology

Московский физико-технический институт (неофициально известный как МФТИ или Физтех) является одним из самых престижных в мире учебных и научно-исследовательских институтов. Он готовит высококвалифицированных специалистов в области теоретической и прикладной физики, прикладной математики, информатики, биотехнологии и смежных дисциплин. Физтех был основан в 1951 году Нобелевской премии лауреатами Петром Капицей, Николаем Семеновым, Львом Ландау и Сергеем Христиановичем. Основой образования в МФТИ является уникальная «система Физтеха»: кропотливое воспитание и отбор самых талантливых абитуриентов, фундаментальное образование высшего класса и раннее вовлечение студентов в реальную научно-исследовательскую работу. Среди выпускников МФТИ есть Нобелевские лауреаты, основатели всемирно известных компаний, известные космонавты, изобретатели, инженеры....

關於 Yandex

Yandex is a technology company that builds intelligent products and services powered by machine learning. Our goal is to help consumers and businesses better navigate the online and offline world....

關於 Машинное обучение и анализ данных 專項課程

Мы покажем, как проходит полный цикл анализа, от сбора данных до выбора оптимального решения и оценки его качества. Вы научитесь пользоваться современными аналитическими инструментами и адаптировать их под особенности конкретных задач. В рамках специализации вы освоите основные темы, необходимые в работе с большим массивом данных, в т.ч. современные методы классификации и регрессии, поиск структуры в данных, проведение экспериментов, построение выводов, базовая фундаментальная математика, основы программирования на Python. Мы разберём, как построить рекомендательную систему, оценить эмоциональную окраску текста, спрогнозировать спрос на товар, оценить вероятность клика по рекламе и т.д. В финале вам потребуется выполнить проект собственной системы, решающей любую актуальную для бизнеса задачу. Результатом будет наглядная работающая модель, которую вы сможете использовать в вашей повседневной работе или продемонстрировать на собеседовании. Все, прошедшие специализацию, могут принять участие в Программе трудоустройства. Если вы заинтересованы в новых проектах, новых перспективах и возможностях - пройдите обучение по Специализации и подайте заявку....
Машинное обучение и анализ данных

常見問題

  • 注册以便获得证书后,您将有权访问所有视频、测验和编程作业(如果适用)。只有在您的班次开课之后,才可以提交和审阅同学互评作业。如果您选择在不购买的情况下浏览课程,可能无法访问某些作业。

  • 您注册课程后,将有权访问专项课程中的所有课程,并且会在完成课程后获得证书。您的电子课程证书将添加到您的成就页中,您可以通过该页打印您的课程证书或将其添加到您的领英档案中。如果您只想阅读和查看课程内容,可以免费旁听课程。

還有其他問題嗎?請訪問 學生幫助中心