Математика и Machine Learning для Data Science

Чтобы быть специалистом в Machine Learning нужно быть универсальным специалистом и понимать, как именно это работает, и тут понадобится математика. 

Математика и Machine Learning для Data Science
Цена
58900
20 недель20 недель
СертификатСертификат
РусскийРусский
SkillFactory

Описание:

Каждый, кто начинает свой путь в Data Science, стремится когда-нибудь дорасти до уровня Senior. Но требования к специалистам такого уровня, особенно в крупных компаниях, очень высоки. Большинство соискателей не могут пройти собеседование. 

Чтобы уверенно решать не типовые задачи и создавать собственные архитектуры, мало владеть основными методами машинного обучения и нейронных сетей: важно понимать законы математики и статистики у них "под капотом". 

Мы объединили 2 важных курса: вы сможете изучить сначала математику, а затем научитесь строить модели машинного обучения, или проходить два курса параллельно и освоить новую профессию всего за 3 месяца.

Программа курса:

Программа курса по математике

Часть 1. Линейная алгебра

  • Изучаем вектора и виды матриц
  • Учимся проводить операции над матрицами
  • Определяем линейную зависимость с помощью матриц 
  • Изучаем обратные, вырожденные и невырожденные матрицы 
  • Изучаем системы линейных уравнений, собственные и комплексные числа 
  • Осваиваем матричное и сингулярное разложение
  • Решаем задачи линейной зависимости с помощью матриц
  • Оптимизируем с помощью метода главных компонент
  • Закрепляем математические основы линейной регрессии 

Часть 2. Основы матанализа

  • Изучаем функции одной и многих переменных и производные 
  • Осваиваем понятие градиента и градиентного спуска
  • Тренируемся в задачах оптимизации 
  • Изучаем метод множителей Лагранжа, метод Ньютона и имитацию отжига 
  • Решаем задачи предсказания и поиска выигрышной стратегии с помощью производных и численных методов оптимизации 
  • Закрепляем математические основы градиентного спуска и имитации отжига 

Часть 3. Основы теории вероятности и статистики

  • Изучаем общие понятия описательной и математической статистики
  • Осваиваем комбинаторику 
  • Изучаем основные типы распределений и корреляции
  • Разбираемся в теореме Байеса
  • Изучаем наивный байесовский классификатор
  • Решаем задачи комбинаторики, валидности и прогнозирования методами статистики и теорвера
  • Закрепляем математические основы классификации и логистической регрессии

Часть 4. Временные ряды и прочие математические методы

  • Знакомимся с анализом временных рядов
  • Осваиваем более сложные типы регрессий
  • Прогнозируем бюджет с помощью временных рядов 
  • Закрепляем математические основы классических моделей машинного обучения

Краткая программа курса по Machine Learning

Модуль 1. Введение в машинное обучение

  • Знакомимся с основными задачами и методами machine learning , изучаем практические кейсы и применяем базовый алгоритм работы над ml-проектом. Решаем 50+ задач на закрепление темы

Модуль 2. Методы предобработки данных

  • Изучаем типы данных, учимся очищать и обогащать данные, используем визуализацию для предобработки и осваиваем feature engineering. Решаем 60+ задач на закрепление темы

Модуль 3. Регрессия

  • Осваиваем линейную и логистическую регрессию, изучаем границы применимости, аналитический вывод и регуляризацию. Обучаем модели регрессии. Решаем 40+ задач на закрепление темы

Модуль 4. Кластеризация

  • Осваиваем обучение без учителя, практикуемся в его различных методах, работаем с текстами средствами ML. Решаем 50+ задач на закрепление темы

Модуль 5. Tree-based алгоритмы: введение в деревья

  • Знакомимся с решающими деревьями и их свойствами, осваиваем деревья из библиотеки sklearn и используем деревья для решения задачи регрессии . Решаем 40+ задач на закрепление темы

Модуль 6. Tree-based алгоритмы: ансамбли

  • Изучаем особенности ансамблей деревьев, практикуемся в бустинге, используем ансамбль для построения логистической регрессии. Решаем 40+ задач на закрепление темы. Участвуем в соревновании на kaggle по обучению tree-based модели 

Модуль 7. Оценка качества алгоритмов

  • Изучаем принципы разбиения выборки, недо- и переобучение, оцениваем модели по различным метрикам качества, учимся визуализировать процесс обучения. Оцениваем качество нескольких моделей ML. Решаем 40+ задач на закрепление темы

Модуль 8. Временные ряды в машинном обучении

  • Знакомимся с анализом временных рядов в ML, осваиваем линейные модели и XGBoost, изучаем принципы кросс-валидации и подбора параметров. Решаем 50+ задач на закрепление темы

Модуль 9. Рекомендательные системы

  • Изучаем методы построения рекомендательных систем, осваиваем SVD-алгоритм, оцениваем качество рекомендаций обученной модели. Решаем 50+ задач на закрепление темы

Модуль 10. Финальный хакатон. 

  • Применяем все изученные методы для получения максимальной точности предсказаний модели на kaggle