課程信息
4.7
920 個評分
101 個審閱
專項課程

第 3 門課程(共 6 門)

100% 在線

100% 在線

立即開始,按照自己的計劃學習。
可靈活調整截止日期

可靈活調整截止日期

根據您的日程表重置截止日期。
中級

中級

完成時間(小時)

完成時間大約為25 小時

建議:4 недели обучения, через 3-5 часа / неделю...
可選語言

俄語(Russian)

字幕:俄語(Russian)

您將獲得的技能

Topic ModelData Clustering AlgorithmsMachine LearningData Visualization (DataViz)
專項課程

第 3 門課程(共 6 門)

100% 在線

100% 在線

立即開始,按照自己的計劃學習。
可靈活調整截止日期

可靈活調整截止日期

根據您的日程表重置截止日期。
中級

中級

完成時間(小時)

完成時間大約為25 小時

建議:4 недели обучения, через 3-5 часа / неделю...
可選語言

俄語(Russian)

字幕:俄語(Russian)

教學大綱 - 您將從這門課程中學到什麼

1
完成時間(小時)
完成時間為 7 小時

Кластеризация

Добро пожаловать на курс "Поиск структуры в данных"! В этом курсе вы узнаете про задачи машинного обучения, в которых требуется не предсказать целевую переменную, а найти некоторые внутренние закономерности в данных — например, сгруппировать объекты по схожести, или определить наиболее важные признаки. В первом модуле мы изучим задачу кластеризации, направленную на поиск групп близких объектов. Вы узнаете про основные подходы к её решению, а также узнаете, как можно выбрать хороший алгоритм кластеризации, не имея правильных ответов....
Reading
15 個視頻 (總計 109 分鐘), 8 個閱讀材料, 5 個測驗
Video15 個視頻
Как устроена специализация, и зачем ее проходить3分鐘
Структура уроков1分鐘
Задача кластеризации4分鐘
Примеры задач кластеризации5分鐘
Знакомство с методами кластеризации9分鐘
Пример: кластеризация текстов по теме13分鐘
Выбор метода кластеризации7分鐘
МФТИ1分鐘
Метод K средних (K-Means)10分鐘
Expectation Maximization (EM-алгоритм)9分鐘
Агломеративная иерархическая кластеризация12分鐘
Графовые методы кластеризации4分鐘
Методы, основанные на плотности6分鐘
Оценка качества и рекомендации по решению задачи кластеризации13分鐘
Reading8 個閱讀材料
Блокнот из примера кластеризации текстов20分鐘
Слайды к лекциям10分鐘
Конспект10分鐘
Немного о Yandex10分鐘
МФТИ10分鐘
Forum&Chat10分鐘
Слайды к лекциям10分鐘
Конспект10分鐘
Quiz4 個練習
Знакомство с кластеризацией6分鐘
Введение в кластеризацию8分鐘
Некоторые методы кластеризации8分鐘
Подробнее о методах кластеризации12分鐘
2
完成時間(小時)
完成時間為 6 小時

Понижение размерности и матричные разложения

В предыдущем модуле мы обсуждали, как кластеризовать объекты, а в этом модуле займёмся признаками. Нередко возникают ситуации, в которых далеко не все признаки нужны для решения задачи — или же нужны все, но при этом их слишком много. В этом случае нужно перейти в новое признаковое пространство меньшей размерности. Для этого можно либо отбирать наиболее важные признаки, либо порождать новые на основе исходных — мы обсудим оба подхода. В частности, мы разберёмся с методом главных компонент, который используется в самых разных задачах машинного обучения. Затем мы перейдём к матричным разложениям — мы изучим несколько методов, позволяющих получить приближение исходной матрицы в виде произведения нескольких матриц меньшей размерности. Такая аппроксимация часто используется в задачах машинного обучения, например, для понижения размерности данных, восстановления пропущенных значений в матрицах и построения рекомендательных систем....
Reading
15 個視頻 (總計 108 分鐘), 4 個閱讀材料, 5 個測驗
Video15 個視頻
Одномерный отбор признаков8分鐘
Жадные методы отбора признаков6分鐘
Отбор признаков на основе моделей6分鐘
Понижение размерности4分鐘
Метод главных компонент: постановка задачи7分鐘
Метод главных компонент: решение6分鐘
Матричные разложения13分鐘
SGD и ALS5分鐘
Прогнозирование неизвестных значений в матрице6分鐘
Проблема отсутствия негативных примеров и implicit методы6分鐘
Вероятностный взгляд на матричные разложения5分鐘
Неотрицательные матричные разложения: постановка и решение10分鐘
Неотрицательные матричные разложения: функционалы и инициализация5分鐘
Обработка пропусков8分鐘
Reading4 個閱讀材料
Слайды к лекциям10分鐘
Конспект10分鐘
Слайды к лекциям10分鐘
Конспект10分鐘
Quiz4 個練習
Отбор признаков6分鐘
Понижение размерности и отбор признаков14分鐘
Матричные разложения8分鐘
Неотрицательные матричные разложения10分鐘
3
完成時間(小時)
完成時間為 4 小時

Визуализация и поиск аномалий

Добро пожаловать на третью неделю курса! В ней мы обсудим две задачи: обнаружение аномалий и визуализация данных. Обнаружение аномалий направлено на поиск объектов, которые являются особенными в некотором смысле. Например, это могут объекты с такими значениями признаков, которые далеки от имеющихся в обучающей выборке — вполне ожидаемо, что на таких объектах модель выдаст очень плохие прогнозы. Вы узнаете, как можно формально дать определение аномалий и с помощью каких методов можно решать задачу их поиска. Вторая задача, о которой мы поговорим — это визуализация, то есть отображение многомерной выборки в пространство размерности два или три. В теории визуализация близка к понижению размерности — но за счёт того, что нам нужно найти всего два или три признака, можно использовать очень сложные нелинейные методы....
Reading
8 個視頻 (總計 57 分鐘), 5 個閱讀材料, 5 個測驗
Video8 個視頻
Параметрическое восстановление плотности9分鐘
Непараметрическое восстановление плотности8分鐘
Одноклассовый SVM5分鐘
Задача визуализации5分鐘
Многомерное шкалирование4分鐘
Метод t-SNE6分鐘
Визуализация данных в sklearn12分鐘
Reading5 個閱讀材料
Слайды к лекциям10分鐘
Конспект10分鐘
Визуализация данных в sklearn10分鐘
Слайды к лекциям10分鐘
Конспект10分鐘
Quiz4 個練習
Восстановление плотности6分鐘
Поиск аномалий4分鐘
Методы SNE и t-SNE6分鐘
Визуализация14分鐘
4
完成時間(小時)
完成時間為 10 小時

Тематическое моделирование

Люди уже много веков сохраняют свои знания в виде книг, а крупнейшая на сегодняшний день коллекция информации — Интернет — состоит из огромного количества текстов. Тексты, по сути, являются наиболее популярным видом данных, и поэтому очень важно уметь искать в них закономерности. Тематическое моделирование — это способ семантического анализа коллекции текстовых документов. Тематическая модель позволяет для каждого документа найти темы, которые его описывают, и кроме того показывает, какие слова характеризуют ту или иную тему. Другими словами, мы находим более компактное представление большого набора текстов в виде нескольких тем. С математической точки зрения тематическая модель — это еще один вид матричного разложения, где в качестве исходной матрицы выступает матрица частот слов в документах. На четвертой неделе мы поговорим о том, где применяют тематические модели, какие они бывают, как их строить и как оценивать. ...
Reading
14 個視頻 (總計 151 分鐘), 8 個閱讀材料, 6 個測驗
Video14 個視頻
Постановка задачи тематического моделирования12分鐘
Базовые тематические модели и EM-алгоритм14分鐘
Регуляризация тематических моделей10分鐘
Мультимодальные тематические модели9分鐘
Внутренние критерии качества тематических моделей9分鐘
Внешние критерии качества тематических моделей16分鐘
Визуализация тематических моделей10分鐘
Тематические модели на практике11分鐘
Пример использования библиотеки gensim для построения тематической модели10分鐘
Установка BigARTM в Windows3分鐘
Установка BigARTM в Linux Mint2分鐘
Установка BigARTM в Mac OS-X3分鐘
Пример использования библиотеки BigARTM для построения тематической модели19分鐘
Reading8 個閱讀材料
Слайды к лекциям10分鐘
Конспект10分鐘
Ноутбук из демонстрации использования gensim10分鐘
Ноутбук из демонстрации использования BigARTM10分鐘
Слайды к лекциям10分鐘
Конспект10分鐘
Финальные титры10分鐘
Стань ментором специализации10分鐘
Quiz4 個練習
Постановка задачи и базовые понятия6分鐘
Тематическое моделирование-18分鐘
Критерии качества тематических моделей6分鐘
Тематическое моделирование-26分鐘
4.7
101 個審閱Chevron Right
職業方向

71%

完成這些課程後已開始新的職業生涯
工作福利

62%

通過此課程獲得實實在在的工作福利
職業晉升

33%

加薪或升職

熱門審閱

創建者 PKMay 4th 2018

Отличный вводный курс, как и вся специализация. Доступно и понятно изложены все базовые вещи, которые могут потребоваться в повседневной деятельности в качестве data scientist.

創建者 AAJan 9th 2017

Интересный курс, замечательные преподаватели. Есть моменты когда лекция довольно сложная, а тест простой, это оставляет тревожное ощущение недоученности :)

講師

Avatar

Константин Воронцов

доктор физико-математических наук, профессор
Кафедра интеллектуальных систем

關於 莫斯科物理科学与技术学院

Московский физико-технический институт (неофициально известный как МФТИ или Физтех) является одним из самых престижных в мире учебных и научно-исследовательских институтов. Он готовит высококвалифицированных специалистов в области теоретической и прикладной физики, прикладной математики, информатики, биотехнологии и смежных дисциплин. Физтех был основан в 1951 году Нобелевской премии лауреатами Петром Капицей, Николаем Семеновым, Львом Ландау и Сергеем Христиановичем. Основой образования в МФТИ является уникальная «система Физтеха»: кропотливое воспитание и отбор самых талантливых абитуриентов, фундаментальное образование высшего класса и раннее вовлечение студентов в реальную научно-исследовательскую работу. Среди выпускников МФТИ есть Нобелевские лауреаты, основатели всемирно известных компаний, известные космонавты, изобретатели, инженеры....

關於 Yandex

Yandex is a technology company that builds intelligent products and services powered by machine learning. Our goal is to help consumers and businesses better navigate the online and offline world....

關於 机器学习和数据分析 專項課程

Мы покажем, как проходит полный цикл анализа, от сбора данных до выбора оптимального решения и оценки его качества. Вы научитесь пользоваться современными аналитическими инструментами и адаптировать их под особенности конкретных задач. В рамках специализации вы освоите основные темы, необходимые в работе с большим массивом данных, в т.ч. современные методы классификации и регрессии, поиск структуры в данных, проведение экспериментов, построение выводов, базовая фундаментальная математика, основы программирования на Python. Мы разберём, как построить рекомендательную систему, оценить эмоциональную окраску текста, спрогнозировать спрос на товар, оценить вероятность клика по рекламе и т.д. В финале вам потребуется выполнить проект собственной системы, решающей любую актуальную для бизнеса задачу. Результатом будет наглядная работающая модель, которую вы сможете использовать в вашей повседневной работе или продемонстрировать на собеседовании. Все, прошедшие специализацию, могут принять участие в Программе трудоустройства. Если вы заинтересованы в новых проектах, новых перспективах и возможностях - пройдите обучение по Специализации и подайте заявку....
机器学习和数据分析

常見問題

  • 注册以便获得证书后,您将有权访问所有视频、测验和编程作业(如果适用)。只有在您的班次开课之后,才可以提交和审阅同学互评作业。如果您选择在不购买的情况下浏览课程,可能无法访问某些作业。

  • 您注册课程后,将有权访问专项课程中的所有课程,并且会在完成课程后获得证书。您的电子课程证书将添加到您的成就页中,您可以通过该页打印您的课程证书或将其添加到您的领英档案中。如果您只想阅读和查看课程内容,可以免费旁听课程。

還有其他問題嗎?請訪問 學生幫助中心