Буткемп — интенсивный краткосрочный курс обучения с полным погружением в практику, ориентированный на быстрое освоение конкретного навыка (чаще всего в IT)
Деплой — разговорная форма от Deploy; процесс переноса кода приложения в рабочую среду
Грейд — разговорная форма от Grade; уровень специалиста в компании по компетенциям и опыту
Грейдирование — разговорная форма от Grading; процесс присвоения сотруднику определённого грейда
Джун — разговорная форма от Junior; начинающий специалист
Инсайт — неочевидный, ценный вывод из данных, который меняет понимание проблемы или открывает новую возможность
Миддл — разговорная форма от Middle; специалист среднего уровня
Продакт-менеджер — сокращение от Product Manager; специалист, отвечающий за стратегию, развитие и жизненный цикл продукта
Стек — набор технологий, языков, фреймворков и инструментов, используемых для разработки проекта (например, стек frontend + backend + база данных)
Технологии кэширования — решения для временного хранения часто
используемых данных в быстрой памяти (например, Redis, Memcached) для ускорения работы приложений
Ad-hoc — лат. «для этого случая»; решение, разработанное специально для одной задачи, без расчёта на повторное использование
Airflow — платформа для оркестрации и автоматизации рабочих процессов (пайплайнов), особенно ETL-задач
Apache Iceberg — формат таблиц для хранения больших данных в озёрах данных (data lakes), поддерживающий транзакции и эволюцию схемы
Bash — командная оболочка и язык скриптов в Unix-системах для автоматизации задач и управления системой
BI — Business Intelligence; набор инструментов и практик для сбора, анализа и визуализации данных с целью поддержки управленческих решений
CI/CD — Continuous Integration / Continuous Delivery (Deployment); автоматизированные процессы для интеграции, тестирования и доставки кода в продакшен
CI/CD-пайплайны — автоматизированные цепочки процессов для непрерывной интеграции (Continuous Integration) и непрерывной доставки/развертывания (Continuous Delivery/Deployment) кода
ClickHouse — высокопроизводительная колоночная СУБД для аналитики и обработки больших объёмов данных в реальном времени
Data Science — наука о данных; междисциплинарная область, объединяющая программирование, статистику, математику и машинное обучение для извлечения знаний из данных
Data Scientist — специалист по анализу и интерпретации сложных данных для решения бизнес-задач
DevOps-инструменты — набор программ и практик для автоматизации разработки, тестирования, развертывания и поддержки ПО (например, Git, Docker, Kubernetes, Jenkins)
Difference-in-Differences — метод эконометрического анализа для оценки эффекта вмешательства путём сравнения изменений во времени между контрольной и экспериментальной группами
Docker — платформа для контейнеризации приложений, позволяющая упаковывать код и зависимости в изолированные контейнеры
DVC — Data Version Control; система контроля версий данных и моделей машинного обучения
ETL-пайплайны — процессы Extract (извлечение), Transform (преобразование), Load (загрузка); последовательность шагов для переноса данных из источников в хранилище
Frontend — фронтенд: часть приложения или сайт, с которой взаимодействует пользователь (интерфейс, визуальная логика)
Git — система контроля версий для отслеживания изменений в коде и совместной разработки
Go — язык программирования от Google, ориентированный на производительность, простоту и работу с многопоточностью
Helicopter view — общее понимание ситуации; стратегический обзор; целостное видение без погружения в детали
Helm — инструмент для управления Kubernetes-приложениями через чарты (шаблоны развертывания)
Hugging Face — платформа для моделей искусственного интеллекта, особенно в области NLP (обработка естественного языка)
Java (Spring) — язык программирования Java с фреймворком Spring для создания корпоративных веб-приложений и микросервисов
Kafka — распределённая система обмена сообщениями для обработки потоковых данных в реальном времени
Kaggle AutoML Grand Prix — международный конкурс по автоматизированному машинному обучению на платформе Kaggle
Kotlin — современный язык программирования для JVM, часто используемый для разработки под Android и бэкенда
Kubernetes — система оркестрации контейнеров для автоматического развертывания, масштабирования и управления контейнеризированными приложениями
LightAutoML — библиотека для автоматизированного машинного обучения (AutoML)
ML — Machine Learning; методы, позволяющие моделям обучаться на данных и делать прогнозы
ML Researcher — исследователь в области машинного обучения, занимающийся разработкой и анализом новых моделей и алгоритмов
ML-пайплайны — последовательность шагов для преобразования сырых данных в готовую модель машинного обучения
MLOps — Machine Learning Operations; практики по автоматизации и управлению жизненным циклом моделей ML в продакшене
MLflow — платформа для управления жизненным циклом моделей машинного обучения (эксперименты, модели, развертывание)
Middle Research Scientist — исследователь среднего уровня, способный вести проекты и анализ с частичным руководством
MVP — Minimum Viable Product; минимально жизнеспособный продукт: первая версия продукта с базовым функционалом, достаточным для проверки гипотез на рынке
NoSQL — тип баз данных без жёсткой табличной структуры, с гибкой схемой (например, MongoDB, Cassandra)
NumPy — библиотека Python для работы с многомерными массивами и математическими операциями
OpenCV — библиотека компьютерного зрения для обработки изображений и видео
Pandas — библиотека Python для обработки и анализа табличных данных
PhD — Doctor of Philosophy; высшая научная степень, подтверждающая способность к независимым исследованиям
Postgres — сокращение от PostgreSQL; мощная открытая реляционная СУБД с поддержкой сложных запросов, транзакций и расширений
Production ML — использование моделей машинного обучения в рабочей среде (продакшене), с обеспечением стабильности и масштабируемости
Propensity Score Matching — статистический метод оценки эффекта вмешательства путём сопоставления объектов с похожей вероятностью попадания в экспериментальную группу
Python — универсальный язык программирования, популярный в Data Science, веб-разработке, автоматизации и скриптах
QA-инженер — специалист по обеспечению качества (Quality Assurance), тестирующий ПО на ошибки и соответствие требованиям
R&D — Research and Development; научно-исследовательские и опытно-конструкторские работы (НИОКР) для создания инноваций
Regression Discontinuity Design — квазиэкспериментальный метод анализа, использующий пороговое значение для оценки причинно-следственного эффекта
Research Scientist — специалист, занимающийся фундаментальными или прикладными исследованиями, часто в научных или технологических компаниях
S3 — объектное хранилище (например, Amazon S3), используемое для надёжного и масштабируемого хранения больших объёмов данных
Soft skills — гибкие навыки: коммуникация, эмоциональный интеллект, работа в команде, управление временем и другие
Spark — фреймворк для распределённой обработки больших данных, поддерживает пакетную и потоковую аналитику
SQL — язык структурированных запросов для работы с реляционными базами данных (выборка, обновление, удаление данных)
Synthetic Control — метод оценки эффекта вмешательства путём построения «синтетической» контрольной группы как взвешенной комбинации похожих объектов
Test and Learn — подход, при котором решения проверяются на практике через эксперименты, после чего принимаются на основе полученных данных
Transformers — архитектура нейронных сетей, применяемая в NLP и других задачах; также — одноимённая библиотека от Hugging Face
PyTorch — библиотека для глубокого обучения, разработанная Facebook AI, популярна в исследованиях и разработке моделей