В 90-х годах компьютеры резко подешевели и начали появляться повсюду. Пользователи постепенно осознали их возможности. Компьютер может хранить ваши фотографии, упрощать бизнес-процессы, с его помощью можно пообщаться с людьми с другого континента или, наконец, просто поиграть в крутую игру. Всем стали нужны программисты. Без них компьютер — просто кусок железа. Сегодня сложно найти университет, в котором не готовят специалистов по программированию. Сложно найти компанию, в которой не работает хотя бы один программист. Сейчас то же самое происходит с данными. Потребность в анализе данных вышла далеко за пределы технологических и интернет-компаний. Методы машинного обучения всё активнее используются при оптимизации технологических процессов или маршрутов транспорта. С их помощью создаются новые лекарства или автомобили без водителя. Специалист в анализе данных, или data scientist — это одна из самых востребованных и актуальных профессий сегодняшнего дня. Спрос на таких специалистов огромный и он только растет. Это отмечают HR-аналитики по всему миру. К сожалению, на современном уровне, специалистов науки о данных, готовят в относительно небольшом количестве университетов. И качество программы, в появляющихся в большом количестве сейчас экспресс-курсов, тоже оставляет желать лучшего. Именно поэтому мы и создали эту специализацию. Машинное обучение — это не квантовая физика. Если вы знаете базовые основы математики и когда нибудь программировали на каком-нибудь языке, вы без труда освоите все необходимые техники. А мы, преподаватели МФТИ, и data scientist, и фабрики данных Яндекса расскажем вам не то, что легко рассказать, а то, что хорошо работает на практике. >> Наши специализации лишены проблемы, которые мы наиболее часто наблюдаем в подготовке специалистов по анализу данных. Мы сразу даем вам необходимы знания про язык Python и про использование библиотек для анализа данных, чтобы практика в дальнейшем не отрывалась от теории. Кроме того, мы напоминаем вам основные сведения из математики, которые потребуются в дальнейшем. Чтобы избежать профанаций вида: «Ой, вот это матрица. Ну не важно, что вы не знаете, что это такое, и как их умножать. Всё равно умножать будете на компьютере». Нет. Мы хотим, чтобы вы понимали те алгоритмы, которые мы вам расскажем. Кроме того, мы рассказываем только те методы и алгоритмы, которые часто используются на практике и хорошо зарекомендовали себя в прикладных задачах. >> Наша специализация состоит из шести курсов и длится полгода. В первом курсе мы разберем основы математики, которая нужна для понимания всего последующего материала, и научимся программировать на языке Python. Второй курс посвящен обучению на размеченных данных, или обучению с учителем. Мы узнаем, как по набору исторических примеров построить предсказательную модель и оценить ее качество. В третьем курсе мы будем заниматься выявлением структуры данных. Мы узнаем, как делать кластеризацию, визуализацию, понижение размерности и как искать в данных аномалии. Четвертый курс посвящен искусству превращения данных в выводы. Мы освоим основные методы статистического анализа и планирования экспериментов. В пятом курсе, одном из моих любимых, мы разберем несколько крупных типовых задач анализа данных, таких как анализ текстов или прогнозирование временных рядов. А в конце вас ждет финальный проект, в котором вам будет на выбор предложена одна из больших задач анализа данных, и мы поможем вам создать систему, которая ее решает. Эту систему вы сможете использовать в вашей повседневной работе или продемонстрировать на собеседовании. Мы научим вас хорошему, оставайтесь с нами. [ЗАСТАВКА]