ФУНДАМЕНТ
Ключевые стеки компетенций
Аналитический стек
Теоретическая база для понимания данных, построения гипотез и корректной интерпретации.
Математика
- Линейная алгебра
- Математический анализ
- Теория вероятностей
Статистика
- Описательная и индуктивная
- Дизайн экспериментов (A/B)
- Тестирование гипотез
Программный стек
Ключевые языки и среды для анализа данных, моделирования и проведения исследований.
Среды разработки
Инженерный стек
Bash / Shell Scripting
Работа в командной строке для автоматизации рутинных задач и управления средой.
ЖИЗНЕННЫЙ ЦИКЛ
Этапы работы над проектом
Сбор данных
Поиск и получение данных из различных источников, как внутренних, так и внешних.
Веб-скрапинг:
Работа с API и БД:
Хранение и обработка
Работа с различными типами хранилищ и инструментами для обработки больших данных.
Реляционные БД (SQL):
Нереляционные БД (NoSQL):
Платформы для Big Data:
Подготовка данных и EDA
Очистка, исследование, обогащение данных и конструирование признаков (feature engineering).
Подходы к моделированию
Выбор семейства алгоритмов в зависимости от типа задачи и структуры данных.
Глубокое обучение
Нейронные сети для задач с неструктурированными данными (текст, звук, изображения).
Визуализация и BI
Создание дашбордов для презентации результатов бизнесу и мониторинга ключевых метрик.
Развертывание и MLOps
Внедрение, автоматизация и мониторинг производительности модели в production-среде.