Инфографики

Карта навыков Data Sceince

Интерактивная Карта Навыков Data Science

Data Science

Карта навыков: от фундамента до MLOps

ФУНДАМЕНТ

Ключевые стеки компетенций

Аналитический стек

Теоретическая база для понимания данных, построения гипотез и корректной интерпретации.

Математика

  • Линейная алгебра
  • Математический анализ
  • Теория вероятностей

Статистика

  • Описательная и индуктивная
  • Дизайн экспериментов (A/B)
  • Тестирование гипотез

Программный стек

Ключевые языки и среды для анализа данных, моделирования и проведения исследований.

Языки

Среды разработки

ЖИЗНЕННЫЙ ЦИКЛ

Этапы работы над проектом

1

Сбор данных

Поиск и получение данных из различных источников, как внутренних, так и внешних.

Веб-скрапинг:

Работа с API:

2

Хранение и обработка

Поиск и получение данных из различных источников, как внутренних, так и внешних.

Реляционные БД (SQL):

Нереляционные БД (NoSQL):

Платформы для Big Data:

3

Подготовка данных и EDA

Очистка, исследование, обогащение данных и конструирование признаков (feature engineering).

Ключевые процессы:

Обработка пропусков Работа с выбросами Описательная статистика Анализ распределений Корреляционный анализ Конструирование признаков

Инструменты:

4

Подходы к моделированию

Выбор семейства алгоритмов в зависимости от типа задачи и структуры данных.

Классические алгоритмы

Основа для стандартных задач и интерпретации результатов.

Ансамблевые методы

Комбинация моделей для максимальной точности на табличных данных.

Глубокое обучение (Deep Learning)

Нейронные сети для задач с неструктурированными данными (текст, звук, изображения).

5

Визуализация и BI

Создание дашбордов для презентации результатов бизнесу и мониторинга ключевых метрик.

6

Развертывание и MLOps

Внедрение, автоматизация и мониторинг производительности модели в production-среде.