Профессия специалист по Data Science

Вы освоите навыки специалиста по Data Science и соберете портфолио решенных задач

Профессия специалист по Data Science
Цена
90000
8 месяцев8 месяцев
Бесплатное ознакомлениеБесплатное ознакомление
Сертификат гос. образцаСертификат гос. образца
РусскийРусский
Яндекс Практикум

Описание:

Специалист по Data Science структурирует и анализирует большие объёмы данных, применяет машинное обучение для предсказания событий и обнаружения неочевидных закономерностей. Помогает создавать и улучшать продукты в бизнесе, промышленности и науке. Мы хотим научить вас основным инструментам этой профессии: Python и его библиотекам, в том числе Scikit-Learn и XGBoost, Jupyter Notebook, SQL.

За 8 месяцев обучения по 10 часов в неделю вы освоите востребованные навыки и соберёте портфолио. Вот какие проекты в него войдут:

  • Прогнозирование оттока клиентов банка. Спрогнозируйте вероятность ухода клиента из банка.
  • Анализ прибыли и убытков нефтедобывающей компании. Обучите модель для предсказания добычи нефти с наименьшим риском убытков.
  • Оптимизация работы предприятия золотодобывающей отрасли. Обучите модель, прогнозирующую коэффициент восстановления золота из руды.

Погружение в IT-профессию подразумевает постоянный контакт с изучаемыми технологиями, выполнение практических заданий и общение с наставником. Для этого мы создали собственную среду обучения.

  • Онлайн-симулятор. С первого дня вы учитесь на практике. Мы даём реальные кейсы, которые закрепляют теоретические основы. Вы сможете обучаться в своём темпе.
  • Самостоятельная работа. Симулятор — это только часть обучения. Основные навыки вы приобретете по мере решения задач инструментами профессиональных тестировщиков. Наставники помогут и дадут обратную связь.
  • Поддержка. Команда наставников проверяет и комментирует ваши работы, помогает разобраться в сложностях и обучает собственным профессиональным приёмам. Поддержка в чате доступна 24/7.

Программа курса:

Основы Python и анализа данных: бесплатный вводный курс

  • Познакомитесь с языком программирования Python, библиотекой Pandas, а также средой программирования Jupyter. Узнаете основные концепции анализа данных и поймёте, чем занимаются аналитики и специалисты по Data Science.

Предобработка данных

  • Научитесь очищать данные от выбросов, пропусков и дубликатов, а также преобразовывать разные форматы данных.

Исследовательский анализ данных

  • Изучите основы теории вероятностей и статистики. Примените их для исследования основных свойств данных, поиска закономерностей, распределений и аномалий. Познакомитесь с библиотеками SciPy и Matplotlib. Отрисуете диаграммы, поупражняетесь в анализе графиков.

Статистический анализ данных

  • Научитесь анализировать взаимосвязи в данных методами статистики. Узнаете, что такое статистическая значимость, гипотезы и доверительные интервалы.

Введение в машинное обучение

  • Освоите основные концепции машинного обучения. Познакомитесь с библиотекой Scikit-Learn и примените её для создания первого проекта с машинным обучением.

Обучение с учителем (классификация и регрессия)

  • Углубитесь в самую востребованную область машинного обучения — обучение с учителем. Узнаете, как обращаться с несбалансированными данными.

Машинное обучение в бизнесе

  • Примените свои знания о машинном обучении к задачам бизнеса. Узнаете, что такое бизнес-метрики, KPI и A/B-тестирование.

Линейная алгебра

  • Заглянете внутрь нескольких изученных ранее алгоритмов и лучше поймёте, как их применять. На практике освоите с нуля главные концепции линейной алгебры: линейные пространства, линейные операторы, евклидовы пространства.

Численные методы и алгоритмы

  • Разберёте ряд алгоритмов и приспособите их к решению практических задач с использованием численных методов. Приближённые вычисления, оценка сложности алгоритма, градиентный спуск.

Тексты, временные ряды и feature engineering

  • Узнаете, что такое feature engineering в целом. Примените его к текстам и временным рядам. Научитесь векторизировать тексты инструментами word2vec, GloVe, FastText.

Извлечение данных

  • Познакомитесь с основными системами хранения данных — реляционными базами и распределёнными хранилищами. Научитесь извлекать эти данные запросами на языке SQL и методами библиотеки PySpark.

Компьютерное зрение

  • Научитесь решать простые задачи компьютерного зрения с привлечением готовых нейронных сетей и библиотеки Keras. Одним глазком заглянете в Deep learning.

Рекомендации и обучение без учителя

  • Узнаете, что такое рекомендательные системы, и построите свою. Познакомитесь с рядом задач обучения без учителя.