В 90-х годах компьютеры резко подешевели и начали появляться повсюду.
Пользователи постепенно осознали их возможности.
Компьютер может хранить ваши фотографии, упрощать бизнес-процессы.
С его помощью можно пообщаться с людьми с другого континента или, наконец,
просто поиграть в крутую игру.
Всем стали нужны программисты, без них компьютер — просто кусок железа.
Сегодня сложно найти университет,
в котором не готовят специалиста по программированию.
Сложно найти компанию, в которой не работает хотя бы один программист.
Сейчас то же самое происходит с данными.
Потребность в анализе данных вышла далеко за пределы технологических и
интернет-компаний.
Методы машинного обучения все активнее используются при оптимизации
технологических процессов или маршрутов транспорта,
с их помощью создаются новые лекарства или автомобили без водителя.
Специалист в анализе данных или data scientist — это одна
из самых востребованных и актуальных профессий сегодняшнего дня.
Спрос на таких специалистов огромный и он только растет,
это отмечают HR-аналитики по всему миру.
К сожалению, на современном уровне специалистов науки о данных готовят в
относительно небольшом количестве университетов и качество программ,
появляющихся сейчас в большом количестве экспресс-курсов,
тоже оставляет желать лучшего.
Именно поэтому мы и создали эту специализацию,
Машинное обучение — это не квантовая физика.
Если вы знаете базовые основы математики и когда-нибудь программировали на
каком-нибудь языке, вы без труда освоите все необходимые техники, а мы,
преподаватели МФТИ и data scientists Фабрики данных Яндекса
расскажем вам не то, что легко рассказать, а то, что хорошо работает на практике.
>> В нашей специализации решены проблемы,
которые мы наиболее часто наблюдаем в подготовке специалистов по анализу данных.
Мы сразу даем вам необходимые знания про язык Python и про использование библиотек
для анализа данных, чтобы практика в дальнейшем не отрывалась от теории.
Кроме того, мы напоминаем вам основные сведения из математики,
которые потребуются в дальнейшем, чтобы избежать профанаций вида «ой,
вот это матрицы, но не важно, что вы не знаете, что это такое и как их умножать,
все равно умножать будете на компьютере».
Нет. Мы хотим, чтобы вы понимали те алгоритмы,
которые мы вам расскажем.
Кроме того, мы рассказываем только те методы и алгоритмы, которые
часто используются на практике и хорошо зарекомендовали себя в прикладных задачах.
>> Наша специализация состоит из шести курсов и длится полгода.
В первом курсе мы разберем основы математики, которая нужна для понимания
всего последующего материала и научимся программировать на языке Python.
Второй курс посвящен обучению на размеченных данных или обучению
с учителем.
Мы узнаем, как по набору исторических примеров построить предсказательную модель
и оценить ее качество.
В третьем курсе мы будем заниматься выявлением структуры данных.
Мы узнаем, как делать кластеризацию, визуализацию,
понижение размерности и как искать в данных аномалии.
Четвертый курс посвящен искусству превращения данных в выводы.
Мы освоим основные методы статистического анализа и планирования экспериментов.
В пятом курсе, одном из моих любимых, мы разберем несколько крупных типовых задач
анализа данных, таких, как анализ текстов или прогнозирование временных рядов.
А в конце вас ждет финальный проект,
в котором вам будет на выбор предложена одна из больших задач анализа данных,
и мы поможем вам создать систему, которая ее решает.
Эту систему вы сможете использовать в вашей повседневной работе или
продемонстрировать на собеседовании.
Мы научим вас хорошему.
Оставайтесь с нами.
[МУЗЫКА]