課程信息
4.8
1,751 個評分
243 個審閱

第 2 門課程(共 6 門)

100% 在線

立即開始,按照自己的計劃學習。

可靈活調整截止日期

根據您的日程表重置截止日期。

中級

完成時間大約為43 小時

建議:8 hours/week...

俄語(Russian)

字幕:俄語(Russian)

您將獲得的技能

Random ForestPython ProgrammingMachine LearningSupervised Learning

第 2 門課程(共 6 門)

100% 在線

立即開始,按照自己的計劃學習。

可靈活調整截止日期

根據您的日程表重置截止日期。

中級

完成時間大約為43 小時

建議:8 hours/week...

俄語(Russian)

字幕:俄語(Russian)

教學大綱 - 您將從這門課程中學到什麼

1
完成時間為 9 小時

Машинное обучение и линейные модели

Добро пожаловать на курс "Обучение на размеченных данных"! В этом модуле вы узнаете, что такое машинное обучение, какие в нём бывают постановки задачи, и что особенного в обучении на размеченных данных. Затем вы изучите один из основных способов решения задач обучения на размеченных данных — предсказание с помощью линейных моделей. Мы обсудим, как их настраивать и применять в задачах регрессии и классификации. В практических заданиях вы поработаете с настоящими данными и узнаете, какие проблемы в них можно обнаружить, а также попробуете делать прогнозы при помощи линейных моделей....
13 個視頻 (總計 82 分鐘), 8 個閱讀材料, 8 個測驗
13 個視頻
Как устроена специализация, и зачем ее проходить3分鐘
МФТИ1分鐘
Знакомство с машинным обучением11分鐘
Обучение на размеченных данных5分鐘
Обучение без учителя5分鐘
Признаки в машинном обучении8分鐘
Линейные модели в задачах регрессии9分鐘
Обучение линейной регрессии6分鐘
Градиентный спуск для линейной регрессии7分鐘
Стохастический градиентный спуск4分鐘
Линейная классификация6分鐘
Функции потерь в задачах классификации6分鐘
8 個閱讀材料
Формат специализации и получение сертификата10分鐘
Немного о Yandex10分鐘
МФТИ10分鐘
Forum&Chat10分鐘
Слайды к лекциям10分鐘
Конспект10分鐘
Слайды к лекциям10分鐘
Конспект10分鐘
6 個練習
Основные термины в машинном обучении6分鐘
Типы задач в машинном обучении6分鐘
Машинное обучение: задачи и признаки12分鐘
Линейная регрессия4分鐘
Градиентный спуск4分鐘
Линейные модели8分鐘
2
完成時間為 9 小時

Борьба с переобучением и оценивание качества

Вторая неделя нашего курса будет посвящена общим вопросам, с которыми приходится столкнуться в любой задаче анализа данных. Вы узнаете, что такое проблема переобучения, из-за чего она возникает, как её можно обнаружить и как с ней бороться — в частности, вы познакомитесь с кросс-валидацией, с помощью которой можно оценить способность алгоритма давать хорошие предсказания на новых данных. Далее речь пойдёт о метриках качества — без них невозможно понять, подходит ли алгоритм для решения той или иной задачи. Наконец, вы познакомитесь с библиотекой scikit-learn, которая является одним из основных инструментов современных специалистов по анализу данных....
14 個視頻 (總計 126 分鐘), 9 個閱讀材料, 8 個測驗
14 個視頻
Регуляризация7分鐘
Оценивание качества алгоритмов7分鐘
Сравнение алгоритмов и выбор гиперпараметров4分鐘
Метрики качества в задачах регрессии10分鐘
Метрики качества классификации4分鐘
Точность и полнота8分鐘
Объединение точности и полноты5分鐘
Качество оценок принадлежности классу12分鐘
Встроенные датасеты. Sklearn.datasets15分鐘
Кросс-валидация. Sklearn.cross_validation9分鐘
Линейные модели. Sklearn.linear_model. Классификация10分鐘
Линейные модели. Sklearn.linear_model. Регрессия7分鐘
Метрики качества. Sklearn.metrics13分鐘
9 個閱讀材料
Слайды к лекциям10分鐘
Конспект10分鐘
Слайды к лекциям10分鐘
Конспект10分鐘
Встроенные датасеты. Sklearn.datasets (ipython notebook)10分鐘
Кросс-валидация. Sklearn.cross_validation (ipython notebook)10分鐘
Линейные модели. Sklearn.linear_model. Классификация (ipython notebook)10分鐘
Линейные модели. Sklearn.linear_model. Регрессия (ipython notebook)10分鐘
Метрики качества. Sklearn.metrics (ipython notebook)10分鐘
6 個練習
Проблема переобучения6分鐘
Проблема переобучения и борьба с ней10分鐘
Как измерить качество алгоритма?6分鐘
Метрики качества10分鐘
Встроенные датасеты и кросс-валидация8分鐘
Введение в scikit-learn10分鐘
3
完成時間為 7 小時

Линейные модели: классификация и практические аспекты

Добро пожаловать на третью неделю курса! Вы уже поработали с линейными моделями, научились измерять их качество и устранять переобучение с помощью регуляризации. Пришло время разобраться, почему регуляризация действительно помогает уменьшить сложность модели или произвести отбор признаков — об этом пойдёт речь в первом уроке. Там же вы познакомитесь с логистической регрессией, которая является одним из наиболее популярных методов для решения задач классификации. Далее вы узнаете о некоторых важных нюансах работы с линейными моделями: масштабировании признаков, переходе в новые признаковые пространства и т.д. Мы не только расскажем обо всём этом, но и покажем, как оно работает в Python и библиотеке scikit-learn....
14 個視頻 (總計 97 分鐘), 7 個閱讀材料, 7 個測驗
14 個視頻
Метод максимального правдоподобия4分鐘
Регрессия как максимизация правдоподобия2分鐘
Регрессия как оценка среднего4分鐘
Регуляризация8分鐘
Задача оценивания вероятностей и логистическая регрессия8分鐘
Масштабирование признаков6分鐘
Спрямляющие пространства5分鐘
Работа с категориальными признаками4分鐘
Несбалансированные данные5分鐘
Многоклассовая классификация4分鐘
Подбор параметров по сетке. Sklearn.grid_search9分鐘
Задача: bike sharing demand15分鐘
Задача: bike sharing demand. Продолжение13分鐘
7 個閱讀材料
Слайды к лекциям10分鐘
Конспект10分鐘
Слайды к лекциям10分鐘
Конспект10分鐘
Подбор параметров по сетке. Sklearn.grid_search (ipython notebook)10分鐘
Задача Bike Sharing Demand (ipython notebook)10分鐘
Задача Bike Sharing Demand. Продолжение (ipython notebook)10分鐘
6 個練習
Метод максимального правдоподобия6分鐘
Линейные модели: статистический взгляд14分鐘
Линейные модели: подготовка признаков6分鐘
Линейные модели: практические аспекты6分鐘
Подбор параметров по сетке6分鐘
Анализ данных в scikit-learn12分鐘
4
完成時間為 10 小時

Решающие деревья и композиции алгоритмов

Линейные модели — очень важный и полезный, но слишком простой класс алгоритмов в машинном обучении; не во всех задачах они позволяют добиться желаемого качества. В этом модуле вы познакомитесь с новым семейством алгоритмов — решающими деревьями. Они во многом являются полной противоположностью линейных моделей. В частности, сами по себе они очень сложны и подвержены переобучению. При этом оказывается, что если объединить много деревьев в одну сложную модель, то можно получить очень качественное решение. Об этом крайне важном подходе — построении композиций решающих деревьев — мы в основном и будем говорить на этой неделе....
17 個視頻 (總計 114 分鐘), 10 個閱讀材料, 8 個測驗
17 個視頻
Обучение решающих деревьев6分鐘
Критерии информативности7分鐘
Критерии останова и стрижка деревьев4分鐘
Решающие деревья и категориальные признаки8分鐘
Решающие деревья в sklearn10分鐘
Композиции деревьев6分鐘
Смещение и разброс9分鐘
Случайные леса6分鐘
Трюки со случайными лесами4分鐘
Случайные леса в sklearn7分鐘
Композиции простых алгоритмов5分鐘
Градиентный бустинг7分鐘
Борьба с переобучением в градиентном бустинге6分鐘
Градиентный бустинг для регрессии и классификации4分鐘
Градиентный бустинг над решающими деревьями5分鐘
Градиентный бустинг в XGBoost5分鐘
10 個閱讀材料
Решающие деревья в sklearn (ipython notebook)10分鐘
Слайды к лекциям10分鐘
Конспект10分鐘
Случайные леса в sklearn (ipython notebook)10分鐘
Слайды к лекциям10分鐘
Конспект10分鐘
XGBoost10分鐘
Градиентный бустинг в XGBoost (ipython notebook)10分鐘
Слайды к лекциям10分鐘
Конспект10分鐘
6 個練習
Построение решающих деревьев8分鐘
Решающие деревья14分鐘
Бэггинг6分鐘
Композиции и случайные леса8分鐘
Обучение композиций и градиентный бустинг4分鐘
Градиентный бустинг: обучение и практические аспекты8分鐘
4.8
243 個審閱Chevron Right

50%

完成這些課程後已開始新的職業生涯

58%

通過此課程獲得實實在在的工作福利

33%

加薪或升職

熱門審閱

創建者 RNJan 21st 2017

Один из лучших курсов по обучению на размеченных данных. Немного расстраивали несбалансированность сложности домашних заданий и промежуточных проверок правильности подготовки данных в заданиях.

創建者 YDAug 8th 2018

Отличный курс. Меньше чем за месяц появилось базовое понимание обучения на размеченных данных и принципов ML.\n\nМного практики, грамотные преподаватели и качественные pdf сделали своё дело.

講師

Avatar

Константин Воронцов

доктор физико-математических наук, профессор
Кафедра интеллектуальных систем

關於 莫斯科物理科学与技术学院

Московский физико-технический институт (неофициально известный как МФТИ или Физтех) является одним из самых престижных в мире учебных и научно-исследовательских институтов. Он готовит высококвалифицированных специалистов в области теоретической и прикладной физики, прикладной математики, информатики, биотехнологии и смежных дисциплин. Физтех был основан в 1951 году Нобелевской премии лауреатами Петром Капицей, Николаем Семеновым, Львом Ландау и Сергеем Христиановичем. Основой образования в МФТИ является уникальная «система Физтеха»: кропотливое воспитание и отбор самых талантливых абитуриентов, фундаментальное образование высшего класса и раннее вовлечение студентов в реальную научно-исследовательскую работу. Среди выпускников МФТИ есть Нобелевские лауреаты, основатели всемирно известных компаний, известные космонавты, изобретатели, инженеры....

關於 Yandex

Yandex is a technology company that builds intelligent products and services powered by machine learning. Our goal is to help consumers and businesses better navigate the online and offline world....

關於 机器学习和数据分析 專項課程

Мы покажем, как проходит полный цикл анализа, от сбора данных до выбора оптимального решения и оценки его качества. Вы научитесь пользоваться современными аналитическими инструментами и адаптировать их под особенности конкретных задач. В рамках специализации вы освоите основные темы, необходимые в работе с большим массивом данных, в т.ч. современные методы классификации и регрессии, поиск структуры в данных, проведение экспериментов, построение выводов, базовая фундаментальная математика, основы программирования на Python. Мы разберём, как построить рекомендательную систему, оценить эмоциональную окраску текста, спрогнозировать спрос на товар, оценить вероятность клика по рекламе и т.д. В финале вам потребуется выполнить проект собственной системы, решающей любую актуальную для бизнеса задачу. Результатом будет наглядная работающая модель, которую вы сможете использовать в вашей повседневной работе или продемонстрировать на собеседовании. Все, прошедшие специализацию, могут принять участие в Программе трудоустройства. Если вы заинтересованы в новых проектах, новых перспективах и возможностях - пройдите обучение по Специализации и подайте заявку....
机器学习和数据分析

常見問題

  • 注册以便获得证书后,您将有权访问所有视频、测验和编程作业(如果适用)。只有在您的班次开课之后,才可以提交和审阅同学互评作业。如果您选择在不购买的情况下浏览课程,可能无法访问某些作业。

  • 您注册课程后,将有权访问专项课程中的所有课程,并且会在完成课程后获得证书。您的电子课程证书将添加到您的成就页中,您可以通过该页打印您的课程证书或将其添加到您的领英档案中。如果您只想阅读和查看课程内容,可以免费旁听课程。

還有其他問題嗎?請訪問 學生幫助中心