Дата-инженер с нуля до PRO

Научим автоматизировать работу с данными, настраивать мониторинги, создавать конвейеры обработки и схемы хранения данных

Дата-инженер с нуля до PRO
Цена
160000
Кэшбэк до 7,5%
12 месяцев12 месяцев
Сертификат гос. образцаСертификат гос. образца
РусскийРусский
Нетология
Купить с кэшбэком

Описание:

Обучение на курсе поможет вам

  • Перейти в профессию с высоким окладом на низкоконкурентном рынке. Окажетесь одним из первых в профессии, пока все учатся на data scientists
  • Освоить ключевые технологии и опередить запрос рынка. Станете востребованным специалистом сразу после обучения и не растеряете накопленные знания и навыки
  • Прожить опыт 2-3 лет самостоятельного изучения инжиниринга данных. Получите знания в концентрированном формате и с обратной связью от экспертов

Инженер данных оптимизирует пайплайны и схемы хранения данных, настраивает всевозможные мониторинги, отлавливает и исправляет неоптимальные запросы и помогает команде аналитики делать свою работу продуктивно.

Изучать современные подходы стоит для того, чтобы находить оптимальное решение задач бизнеса: не просто нажать пару кнопок и добавить несколько узлов в облачном кластере — а с оглядкой на эффективность использования ресурсов и стоимость решения задачи.

Чему вы научитесь

  • Объяснять архитектуру и структуру базы данных. Проектировать схемы хранилищ и выбирать DWH под задачу и бюджет бизнеса среди популярных решений: Snowflake, BigQuery, Azure SQL DW, Redshift
  • Создавать процессы обработки данных. Настраивать и конфигурировать ETL / ELT-процессы в нескольких дата-инструментах
  • Работать с основными инструментами обработки больших данных. Lambda architecture, kappa architecture, а также hdfs, yarn, hive и другими обязательными частями инфраструктуры
  • Обрабатывать события в режиме реального времени. Построите свой конвейер обработки даннных, сборщик событий, RTDM-систему с выводом в массовые enterprise BI-решения
  • Разовьёте навык data literacy. Сможете понимать, пояснять и обогащать данные отчётов, дашбордов и других источников информации
  • Строить работающий пайплайн в облачной среде. И включать в него модели машинного обучения, нейронные сети, сервисы оркестрирования контейнеров и проверку версионности

Программа курса:

Часть 1. Хороший аналитик (I’m too young to die)

Программа построена от простого к сложному. В первом модуле вы научитесь пользоваться запросами SQL и работать с классическим хранилищем данных. Узнаете, как спроектировать аналитическую базу данных для ваших нужд, создадите свой первый OLAP-куб и научитесь выбирать и подключать Business Intelligence решения (BIC).

Часть 2. Data Engineer (Hurt me plenty)

Получите базовые навыки по работе с Python. Установите и запустите свой первый hadoop. Создадите витрины данных. Освоите продвинутые методы работы с данными. Выполните обработку данных при помощи Spark. Построите конвейер обработки данных. Научитесь работать с базами данных для хранения и обработки потоковых данных. Создадите облачную базу данных и запустите Pipeline в облаке.

Часть 3. ML-engineer (Ultra-Violence)

В этом модуле вы познакомитесь с моделями машинного обучения, построите свой первый классификатор и регрессию и обучите нейронную сеть. Узнаете, что такое CI/CD, запустите свой первый сервис в кластере и изучите подходы к масштабируемости ML-модели.