Chevron Left
返回到 Прикладные задачи анализа данных

Прикладные задачи анализа данных, 莫斯科物理科学与技术学院

4.4
517 個評分
82 個審閱

課程信息

Методы машинного обучения — будь то алгоритмы классификации или регрессии, методы кластеризации или алгоритмы понижения размерности — применяются к подготовленным данным с вычисленными признаками для решения уже сформулированной задачи. Однако специалисты по анализу данных редко оказываются в такой идеальной ситуации. Обычно перед ними ставят задачи, которые нуждаются в уточнении формулировки, выборе метрики качества и протокола тестирования итоговой модели. Данные, с которыми нужно работать, часто представлены в непригодном виде: они зашумлены, содержат ошибки и выбросы, хранятся в неудобном формате и т. д. В этом курсе мы разберем прикладные задачи из различных областей анализа данных: анализ текста и информационный поиск, коллаборативная фильтрация и рекомендательные системы, бизнес-аналитика, прогнозирование временных рядов. На их примере вы узнаете, как извлекать признаки из разнородных данных, какие при этом возникают проблемы и как их решать. Вы научитесь сводить задачу заказчика к формальной постановке задачи машинного обучения и поймёте, как проверять качество построенной модели на исторических данных и в онлайн-эксперименте. На каждой задаче мы изучим плюсы и минусы пройденных алгоритмов машинного обучения. Прослушав этот курс, вы познакомитесь с распространенными типами прикладных задач и будете понимать схемы их решения....

熱門審閱

創建者 PK

May 24, 2018

Отличный вводный курс, как и вся специализация. Доступно и понятно изложены все базовые вещи, которые могут потребоваться в повседневной деятельности в качестве data scientist.

創建者 IS

Jan 21, 2019

Замечательный курс, полный примеров из реальной жизни для получения опыта. Очень полезные и понятные лекции, конспекты. Очень рад, что смог пройти этот курс.

篩選依據:

80 個審閱

創建者 Sergey

Apr 11, 2019

The first week is totally outstanding. In fact, it has helped me a lot with my current project. In a nutshell, the course instructors have covered the field of the time series analysis, highlighting the important theory, and illustrating it with a nice programming example. That alone makes the course highly useful, and worth completing.

The second week - glossing over the entire field of image processing - was a good try. It is really nice that the course instructors have introduced TensorFlow - that's the way to go. Although, it has developed over the last two years, so it would make sense to rewrite the assignment using tf.keras. Perhaps, it would also make more sense to focus more on some of the image processing aspects - such as convolutional layers - instead of trying to cover everything at once.

The last two weeks definitely could've been improved. The amount and scope of theory is sensible, although in the multiple choice tests and the assignments, I literally had to psychoanalyze the instructors. There are two ways to deal with that: either to relax the 100% requirement in the multiple choice tests, or to better convey the questions. The same applies to the latest programming assignment.

創建者 Гаврилин Николай Павлович

Apr 01, 2019

Очень жаль, что материалы курса не позволяют самостоятельно работать ни с самими нейросетями, ни с инструментами их разработки

創建者 Шаланкин Максим Дмитриевич

Mar 14, 2019

Не рекомендую к прохождению, за такую цену есть много актуальных новых курсов, а на всей этой специализации (начиная с третьего курса и далее) кривые задания, отсутствие поддержки, минимум студентов, которые смогут проверить вашу работу. Мне больше курс от вышки понравился.

創建者 Domnin Vladimir

Mar 13, 2019

По моему мнению курс не дотягивает до уровня предыдущих серий специализации ни по информативности, ни по полезности. Исключение - неделя 1, про временные ряды очень увлекательно.

До конца не понял, зачем этот курс здесь.

創建者 Гридасов Илья Игоревич

Feb 05, 2019

Курс даёт широкий взгляд на то, какие бывают задачи в анализе данных, с подробными pipelin-ами решений. В целом курс не сложный, но крайне полезный.

創建者 Artem Drofa

Jan 21, 2019

Финальный проект очень понравился (делал "Идентификация интернет-пользователей")! Реальная практика применения моделей, а также сабмишна на Каггле.

Если ваши заания длительное время не проверяют, не переживайте, к концу сессии народ точно появится.

Еще раз: проект очень классный и инересный! Не без шероховатостей, но все решаемо, в т.ч. с помощью форума.

創建者 Ivan Smirnov

Jan 21, 2019

Замечательный курс, полный примеров из реальной жизни для получения опыта. Очень полезные и понятные лекции, конспекты. Очень рад, что смог пройти этот курс.

創建者 Alexander Prokofyev

Jan 20, 2019

It would be nice to have more practice with neuronets. Anyway it's very interesting course. Thanks!

創建者 YaMolekula

Jan 08, 2019

Совет по курсу: слушать со скоростью 2х

Мое мнение по курсу:

1) Первая неделя интересная, про временные ряды маловато. Хотелось услышать про (G)ARCH и другие методы анализа временных рядо

2) Вторая неделя - мрак, все испортила

創建者 Vadim Kirilchuk

Jan 04, 2019

Один из самых лёгких курсов программы. Понравилась обзорность курса, но вот полезность с точки зрения практики около нулевая. Первая неделя рассказала про прогнозирование временных рядов конкретными моделями, но не рассказано насколько эти модели приближены к реальности, даже с заработной платой оказалось, что прогноз далёк от реальности, не рассказано и про регрессию на основе каких-то базовых показателей типо ВВП, инфляции итд итп. Вторая неделя про компьютерная зрения раскрывает интересную тему, но задания оторваны от лекций, а сами лекции толком ничего не рассказывают, опять таки годится в качестве обзора, но не годится в качестве обучения. Третья неделя выделяется в положительную сторону. Четвертая неделя оставила двоякое впечатление, квиз на 3 задание которого все жалуются, и последнее задание, в котором из-за порядка данных решение не принимается. В последнем задании так же неясна практическая ценность. В общем, хотелось бы, чтобы над этим курсом ещё поработали, он выглядит очень сырым.