Факультет Аналитики Big Data

Задача аналитика больших данных — изучать и выявлять взаимосвязи в огромных массивах информации: поведении и предпочтениях клиентов, результатах исследований, рыночных тенденциях. 

Факультет Аналитики Big Data
Цена
225000
Кэшбэк до 6,5%
18 месяцев18 месяцев
СертификатСертификат
РусскийРусский
Geekbrains
Купить с кэшбэком

Описание:

Через полтора года практического обучения вы освоите современные технологии аналитики больших данных, приобретете компетенции, необходимые для работы в крупной IT-компании

  • Навыки программирования на Python
  • Знание алгоритмов и структур данных
  • Умение работать в Linux и операционных системах
  • Умение писать «чистый» код
  • Опыт построения ETL-процессов
  • Опыт построения скоринговых моделей
  • Опыт построения рекомендательных систем
  • Опыт построения моделей прогнозирования цен и спроса
  • Опыт сегментации, кластеризации и классификации клиентской базы
  • Опыт формирования отчетов анализа данных
  • Опыт работы с BI-системами
  • Знание методов машинного обучения
  • Знание библиотек для машинного обучения (Scikit-learn, XGBoost, Vowpal Wabbit, Apache MLlib)
  • Владение методами прикладной статистики, теории вероятностей
  • Умение работать с технологиями для обработки больших данных
  • Знание алгоритмов для работы с большими данными (Hadoop, Hive, Spark, Hue, HBase, Kafka, Spark Streaming)
  • Умение работать с SQL и NoSQL СУБД
  • Опыт выступлений в соревнованиях по Data Mining (Kaggle)
  • Опыт разработки дашбордов в QlikView

Мы учим на практике и разрабатываем программы совместно со специалистами из компаний-лидеров рынка. Вы решите 6 проектных задач по работе с данными и примените полученные навыки на практике. Полтора года обучения в GeekUniversity = полтора года реального опыта работы с большими данными для вашего резюме. 

Программа курса:

  • Введение в анализ данных

В первой четверти студенты научатся главному инструменту аналитика — языку SQL. Также изучат основы языка Python и базовые библиотеки Python для анализа данных (NumPy, Pandas, Matplotlib, Scikit-learn). Итогом четверти станет модель по предсказанию непрерывной переменной. 

  • Сбор, предобработка и хранение данных

Во второй четверти студенты научатся собирать данные из различных источников. Также проработают процессы предобработки неструктурированных данных и их хранения в различных базах данных для дальнейшего анализа. На заключительном этапе познакомятся с популярным инструментом по работе с большими данными — Hadoop.

  • Алгоритмы обработки и анализа данных. Совместно с компанией X5 Retail Group

В третьей четверти студенты начнут изучение теории вероятностей и математической статистики. Узнают, как работают базовые алгоритмы машинного обучения для решения задач анализа данных и научатся реализовать их с помощью Python. В совместном курсе с компанией X5 Retail Group студенты углубятся в методологии А/Б-тестирования и рассмотрят реализацию полного пайплайна для проверки гипотез в офлайн-ритейле. В курсовом проекте студентам будет необходимо на основе предоставленных данных провести А/Б-тестирование изученными методами.

  • Машинное обучение. Рекомендательные системы

В четвертой четверти студенты погрузятся в прикладное машинное обучение: решат несколько бизнес-кейсов с применением ML, а также подробно изучат популярный фреймворк для работы с BigData — Apache Spark. Курсовой проект будет включать разработку рекомендательной системы.

  • Аналитика Big Data для бизнеса

В пятой четверти студенты научатся решать задачи ML с отзывами клиентов, геоданными и соцсетями. Также освоят несколько задач бизнес-аналитика в современных BI-системах: построение витрин данных, прогнозирование, управление знаниями и отчетность.

  • Выпускной проект

В финальной четверти студенты познакомятся с real-time системой обработки и анализа больших данных на основе Kafka и Apache Streaming. Также 2 месяца будут посвящены работе над выпускным проектом.