Этот репозиторий представляет портфолио аналитика данных.
В проектах демонстрируются ключевые навыки работы с SQL, Python, Yandex DataLens.
Проекты охватывают разные аналитические задачи:
- расчёт и визуализация ключевых бизнес-метрик;
- дизайн, мониторинг и анализ A/B-тестов;
- исследовательский анализ данных (EDA);
- выполнение ad-hoc-запросов и аналитических выборок;
- комплексная аналитика пользовательского поведения и продаж;
- построение дашбордов и подготовка бизнес-рекомендаций.
Папки названы таким образом, чтобы сразу было понятно, вокруг какой аналитической задачи построен проект. Например, в папке ab_test — дизайн, мониторинг и анализ результатов A/B-теста, а в папке metrics — расчёт и визуализация метрик продукта.
- Перейдите в интересующий проект.
- Ознакомьтесь с файлом
README.mdвнутри папки — там указаны описание проекта, цели и основные результаты. - Все
.ipynb-файлы содержат выполненные ячейки с кодом и визуализациями.
- Языки и библиотеки: Python (
pandas,matplotlib,seaborn,scipy,statsmodels,phik), SQL - Инструменты визуализации: Yandex DataLens: чарты в Wizard и QL-чарты
- Форматы отчётности: Jupyter Notebook, Markdown
Название проекта: Разработка A/B-тестирования и анализ результатов
Описание: Проект посвящён расчёту параметров, мониторингу и анализу результатов A/B-теста для нового алгоритма рекомендаций в развлекательном приложении.
Основные технологии: pandas, matplotlib, seaborn, scipy.stats, statsmodels.stats
Структура папки:
ab_test.ipynb— дизайн, мониторинг и анализ результатов A/B-теста;README.md— подробное описание проекта и выводы.
Название проекта: Анализ данных для агентства недвижимости
Описание: Аналитическая поддержка выхода агентства недвижимости на рынок Санкт-Петербурга и Ленинградской области. В проекте решены ad-hoc-задачи с использованием SQL-запросов средней сложности (CTE).
Основные технологии: SQL
Структура папки:
01_explore_data.sql— знакомство с данными;02_ad_hoc.sql— решение аналитических задач;03_ad_hoc_analysis_note.md— аналитическая записка с выводами и рекомендациями;README.md— подробное описание проекта и результаты.
Название проекта: Исследование заведений общественного питания Москвы
Описание: Исследовательский анализ рынка общепита Москвы по данным Яндекс Карт и Яндекс Бизнес (лето 2022 г.). Определение перспективных форматов и локаций для открытия нового заведения.
Основные технологии: pandas, matplotlib, seaborn, phik
Структура папки:
eda.ipynb— исследовательский анализ и визуализация данных;README.md— подробное описание проекта и результаты.
Название проекта: Анализ продаж и пользовательской активности сервиса продажи билетов на мероприятия
Описание: Комплексный анализ данных сервиса продажи билетов на мероприятия за лето–осень 2024 года. Определение факторов, влияющих на продажи билетов, исследование поведения пользователей, подготовка рекомендаций для продуктовой команды.
Основные технологии: SQL, Python (pandas, matplotlib, seaborn, scipy.stats), DataLens
Структура папки:
01_explore_data.sql— знакомство с данными;02_key_metrics.sql— расчёт ключевых метрик;04_extract_for_python.sql— подготовка данных для анализа в Python.
03_yandex_afisha_dashboard.md— описание и ссылка на дашборд с визуализацией ключевых бизнес-показателей.
-
05_yandex_afisha_eda.ipynb— исследовательский анализ данных и проверка гипотез. -
README.md— подробное описание проекта и выводы.
Название проекта: Расчёт и визуализация ключевых бизнес-метрик сервиса доставки еды
Описание: Разработка SQL-запросов и дашборда для анализа клиентской базы сервиса доставки еды в городе Саранске. Проект фокусируется на расчёте и визуализации бизнес-метрик.
Основные технологии: SQL, DataLens
Структура папки:
01_metrics_calculation.sql— подготовка QL-запросов с расчётом метрик;02_metrics_dashboard— визуализация ключевых бизнес-показателей;README.md— подробное описание проекта и результаты.