Каталог курсов
Такого курса сейчас нет
К сожалению, сейчас невозможно записаться на курс. Вы можете посмотреть похожие программы обучения.
Перейти в каталог курсов
К сожалению, курс сейчас недоступен
Избранное

Специализация

Партнёр курса

DataOps-инженер

Перейдите на новый уровень в сфере дата-инжиниринга

Научитесь выстраивать архитектуру и автоматизировать пайплайны для областей аналитики с высокой нагрузкой

Примените навыки на практике — выполните более 40 практических задач и дипломный проект

Когда
20 апреля 2023 — 15 марта 2024
Набор вот-вот закончится
Курс стартовал, но еще можно попасть в этот набор

Длительность

11 месяцев

Формат

Видеолекции, домашние работы, итоговые проекты, вебинары с практикой

Документ

Диплом о профессиональной переподготовке

Это курс о методах и инструментах для доставки данных, готовых к аналитике и эксплуатации моделей data science

DataOps-инженер может развернуть и конфигурировать все эти инструменты там, где остро встаёт вопрос масштабирования и гибкости. Специалисты по дата-инжинирингу востребованы в разных сферах, в том числе — банковской, ритейле и телекоме.

Курс предназначен для тех, кто уже знает, как строятся базы данных и работает ETL-процесс, кто уже прошёл путь первичных построений и нуждается в расширенных методах обработки потоковых данных и хранения огромных массивов

Кому подойдёт курс

ETL-разработчикам

____________________________________

Сделаете следующий шаг в карьере и сможете помочь бизнесу в процессах масштабирования

Аналитикам и Data Scientists

____________________________________

Сможете перейти из анализа и построения моделей в инжиниринг, стать специалистом редкого профиля и зарабатывать больше

Разработчикам Scala, Python, Java

____________________________________

Сможете сменить разработку на работу с данными, при этом глубокие знания языков позволят это сделать безболезненно и продуктивно

Для успешного обучения вам потребуются

Знания по теории баз данных

Навыки по организации DWH

Знание SQL

Основы ETL/ELT-процессов, BI-cистем, CLI

Чему вы научитесь

Предобрабатывать данные с помощью Python

Освоите синтаксис и библиотеки универсального инструмента аналитики, заложите фундамент для ML-изысканий

Выстраивать инфраструктуру для больших данных

Сможете подбирать решения в зависимости от задач и особенностей бизнеса

Писать приложения на Kafka Streams DSL

Настроите приложение, в котором алерт-сообщения будут отправляться при заданных условиях

Использовать в работе Spark SQL

Получите практические навыки работы с DataFrame API

Работать с данными в облаке

Научитесь строить пайплайн, оптимизировать расходы и обеспечивать безопасность в облачной среде

Внедрять принципы гибкого подхода MLOps

Узнаете о философии CI\CD, пройдёте путь тестирования, продакшена и автоматического обучения ML-моделей

Курс ориентирован на практику

Настройка окружения и обучение модели

Установите необходимые конфигурации и проведёте обучение для заданной модели

Мы регулярно проводим внутренние митапы

Это неформальные встречи выпускников и студентов Нетологии с экспертами и потенциальными работодателями

Каждый участник может задать экспертам вопросы, получить ответы или поделиться собственной историей.

Митапы проходят раз в две недели по вечерам.

Лучшие выпускники получат приглашение на стажировку или собеседование в компанию Leroy Merlin

Технологическая компания Leroy Merlin — № 1 на рынке DIY в Европе и России

Одна из особенностей внутренней политики компании — полная автономность продуктовых команд. Это помогает увеличивать продуктивность сотрудников и поддерживать необходимый уровень качества.

Направление Нетологии «Аналитика и Data Science» — обладатель «Премии Рунета» в номинации «Образование и кадры» в 2019 году

Программа курса — 11 месяцев

Вас ждут 146 часов теории и 189 часов практики.

Занятия проходят 2 раза в неделю в будни с 19:00 до 20:30 МСК.  

Python для анализа данных

Вы научитесь пользоваться базовыми инструментами и подходами в Python, чтобы начать работать с данными. Научитесь получать и очищать данные, находить связи и проверять гипотезы. Сможете работать с главными аналитическими библиотеками.

50 часов теории

39 часов практики

Управляющие конструкции и коллекции

Работа с файловой системой и модули

Исключения и обработка ошибок

Регулярные выражения и основы синтаксического разбора

Библиотека NumPy

Библиотека Pandas

Data Lake & Hadoop

Познакомитесь с основным инструментом обработки больших данных. Разберётесь в возможностях управления ресурсами кластера.

14 часов теории

15 часов практики

Основы Hadoop: архитектура

Data Lake vs Data Warehouse

HDFS: логика работы, Namenode и Datanode

MapReduce: алгоритм и решение задач

Yarn, Pig & Hive

Pig & Hive

HBase & Cassandra: возможности и основные характеристики

Управление и администрирование кластера

Обзор Apache Ambari, Apache Ranger, Apache Atlas

Продвинутые методы работы с данными

Изучите способы обработки разных видов данных. Узнаете, что такое оркестратор и какие задачи он решает. Поймёте, как эффективно преобразовывать данные в хранилищах.

13 часов теории

9 часов практики

Apache Spark: основные команды и RDD

Spark SQL: DataFrame API и Dataset API

Архитектура Spark: компоненты и идеи

Apache Airflow: основные сущности для построения задач и взаимодействие сущностей

Работа с Airflow: запуск DAG и механизм XCom

Data Build Tool как инструмент ETL

Работа с потоковыми данными

Поймёте особенности работы с потоковыми данными. Разберётесь в логике работы брокеров сообщений.

12 часов теории

9 часов практики

Устройство Clickhouse и загрузка данных в корпоративное хранилище

Устройство Kafka и работа с кластером

Конфигурация Kafka Streams

Kafka Streams Interactive Queries, Kafka Streams Processor API, Kafka Connect

Spark Streaming: характеристики и особенности использования

Создание простого приложения на Spark Structure Streaming + Kafka

Работа с данными в облаке

Итоговая работа — построение пайплайна в облачной среде

Познакомитесь с основными облачными провайдерами. Поймёте преимущества использования облачного хранилища. Выполните практические упражнения в облачной среде Yandex Cloud.

11 часов теории

19 часов практики

Построение пайплайна в облачной среде

Работа с виртуальными машинами

Хранение и анализ данных в облаке

Прогнозирование затрат и оптимизация расходов

Обеспечение безопасности в облаке

DevOps и автоматизация в облаке

Введение в DS & ML

Познакомитесь с основными задачами машинного обучения. Научитесь работать с очисткой данных. Поймёте, как при помощи обученных моделей решать задачи. 

38 часов теории

33 часа практики

Регрессионный анализ. Линейная, полиномиальная и логарифмическая регрессия

Классификация: логистическая регрессия и SVM

Оценка точности модели, переобучение, регуляризация

Работа с качеством данных

Деревья решений

Поиск выбросов и генерация новых признаков        

Feature Selection

Ансамблирование

MLOps

Итоговая работа — настройка окружения и обучение модели

Узнаете, зачем нужен DevOps. Разберётесь в пайплайне разработки ML-моделей. 

8 часов теории

25 часов практики

Что такое DevOps/MLOps

Docker и микросервисная архитектура

Технологии контейнеризации, k8s

Оркестраторы

CI/CD

Мониторинг

Инструменты DevOps для обучения ML-моделей

Deploy ML-моделей

Английский для специалистов по работе с данными

Бонусный модуль

Научитесь разбираться в аналитических терминах и читать иностранную техническую документацию. Сможете презентовать результаты анализа с помощью графиков и диаграмм на английском языке. Узнаете, как эффективно готовиться к собеседованиям в зарубежные компании. Научитесь составлять убедительное резюме и писать сопроводительное письмо.

7 часов теории

7 часов практики

Словарь терминов аналитика с примерами употребления и типичными словосочетаниями

Важная лексика для работы с датасетами
Презентация результатов анализа 
Чтение технической документации
Самопрезентация. Elevator Pitch
Прохождение собеседований
Резюме и сопроводительное письмо (CV & сover letter) 
Email-переписка
Общение в технических чатах
Как вести звонки и встречи
Как учить лексику
Как учить грамматику

Дипломный проект

В дипломной работе вы самостоятельно с поддержкой ментора обработаете данные, сформируете нормализованную схему данных, опишите ETL-процессы для заливки данных и создания витрин. Сформируйте набор метрик и дашбордов на их основе.

40 часов практики

Название занятия

Карьерное планирование

Научитесь составлять резюме для новой профессии, писать сопроводительные письма и уверенно проходить собеседования.

Создание резюме: как поменять сферу, используя опыт предыдущих компаний
Отработка навыков написания резюме
Карьерное консультирование

Преподают практикующие эксперты

Дмитрий Турченков

IT Cluster Lead, Сбер

Эксперт программы. Преподаёт «Продвинутые методы работы с данными»

Алексей Кузьмин 

Технический директор и Data Scientist, «Домклик»

Преподаёт «SQL для получения данных»

Андрей Серебрянский

Big Data Engineer, Vivid Money

Эксперт программы. Преподаёт «Продвинутые методы работы с данными»

Александр Крылов

Lead DevOps, Росгосстрах

Эксперт программы. Преподаёт MLOps

Как проходит обучение

Теория

Мы подготовили гибкие форматы обучения: смотрите видеолекции и участвуйте в вебинарах. 

Видеозаписи каждого занятия будут доступны в личном кабинете

Практика

После занятий вы выполняете домашнее задание и получаете развёрнутую обратную связь от экспертов курса

Сопровождение

Вас будет сопровождать команда экспертов и координаторов. 

Сможете задать любой вопрос и получить помощь с обучением

Дипломная работа

Создадите итоговую работу с поддержкой дипломного руководителя и получите обратную связь от эксперта

Ваше резюме после обучения

DataOps-инженер

    Ключевые навыки

  • Предобработка данных с помощью Python

  • Создание инфраструктуры для больших данных

  • Обработка данных при помощи Spark и Airflow

  • Обработка real-time данных

  • Построение работающего пайплайна в облачной среде

  • Внедрение принципов гибкого подхода MLOps

Освоенные инструменты

Yandex Cloud

Yandex Cloud

Универсальная облачная платформа.

Python

Python

Высокоуровневый язык программирования общего назначения, ориентированный на повышение производительности разработчика и читаемости кода

Apache Spark

Apache Spark

Фреймворк с открытым исходным кодом для реализации распределённой обработки неструктурированных и слабоструктурированных данных, входящий в экосистему проектов Hadoop

Apache Airflow

Apache Airflow

Продвинутый workflow-менеджер и незаменимый инструмент в арсенале современного дата инженера

Apache Kafka

Apache Kafka

Распределённый программный брокер сообщений, проект с открытым исходным кодом, разрабатываемый в рамках фонда Apache

Clickhouse

Clickhouse

Колоночная аналитическая СУБД с открытым кодом, позволяющая выполнять аналитические запросы в режиме реального времени на структурированных больших данных, разрабатываемая компанией Яндекс

Jenkins

Jenkins

Система с открытым исходным кодом на Java, предназначенная для обеспечения процесса непрерывной интеграции программного обеспечения

Docker

Docker

Программное обеспечение для автоматизации развёртывания и управления приложениями в средах с поддержкой контейнеризации

Kubernetes

Kubernetes

Открытое программное обеспечение для автоматизации развёртывания, масштабирования контейнеризированных приложений и управления ими

Вашу квалификацию подтвердят официальные документы

Мы обучаем по государственной лицензии и выдаём документы установленного образца.

После обучения вы можете получить свидетельство Нетологии и диплом о профессиональной переподготовке.

Поможем найти
ту самую работу
Центр развития карьеры
помогает трудоустроиться студентам Нетологии
1
Научим составлять резюме и проходить интервью
Разберём ваш предыдущий опыт, определим сильные стороны и поможем составить успешное резюме. Научим презентовать себя и проведём тест-драйв интервью.
2
Поможем наработать практику и оформить портфолио
Приобретёте практический опыт и наполните портфолио ещё во время обучения. Разберёте тестовые задания от работодателей и сможете принять участие в их проектах.
3
Предложим стажировки и проекты от партнёров
Предоставим доступ к карьерной странице со стажировками и вакансиями от партнёров Нетологии. Будем делиться подборками с новыми интересными вакансиями.
header
Воркшопы и много практики
Вы сможете сформировать портфолио, выполняя задания компаний-партнёров Нетологии или проходя у них стажировки. Сфокусируетесь на практике, откликах и результате. Поработаете над реальными заданиями, защитите свои решения и получите развивающую обратную связь.
84%
студентов нашли работу с помощью Центра развития карьеры
4 075
компаний-партнёров в базе Нетологии для отработки практики
skyeng

Вернём деньги, если обучение не подойдёт

Деньги можно вернуть в любой момент. В течение первых трёх занятий вернём вам полную сумму, а начиная с четвёртого — рассчитаем сумму возврата или поможем выбрать другой курс взамен.

Подробные условия

Остались вопросы?

  • Как проходит обучение?

    Обучение проходит на образовательной платформе Нетологии. У вас будет личный кабинет с доступом к вебинарам, видеолекциям, дополнительным материалам, домашним заданиям и чату.

  • Я смогу учиться на курсе, если живу не в московском часовом поясе?

    Вы можете учиться в удобное время. Если не успеваете на вебинары и воркшопы, сможете посмотреть запись занятия — она будет доступна в личном кабинете.

  • Кто будет проверять мои домашние задания?

    Практические задания проверяют преподаватели с экспертизой в области аналитики. Вы получите развёрнутую обратную связь и индивидуальные рекомендации по улучшению работы.