Портфолио включает в себя проекты в различных областях анализа и управления данными, а также проекты создания web-сервисов и приложений. Репозитории большинства проектов портфолио находятся на hub.mos.ru/microsegment/portfolio.
Содержание портфолио:
Data Science
Здесь представлены некоторые проекты в области расширенного анализа данных и машинного обучения. Проекты выполнены в Jupyter Notebook на Python в том числе с применением технологий Pipeline и GridSearch.
№ | Проект | Краткое описание | Стек |
---|---|---|---|
1 | Прогнозирование оттока клиентов оператора связи «ТелеДом» | Проект классификации клиентов, на расторгающих и продлевающих договор с оператором связи «ТелеДом». Это учебный проект Яндекс.Практикума. Область применения проекта: ML, маркетинг, телеком | Python, Pandas, Sklearn, Pipeline, GridSerach, CatBoost |
2 | Определение возраста покупателей супермаркета «Хлеб-соль» на основе их изображений | Регрессионный анализ возраста покупателей супермаркета «Хлеб—соль» на основе их изображений, построенный с использованием глубокого обучения сверточной трехслойной нейронной сети с использованием предобученного слоя ResNet50, аугментации данных и алгоритма Adam. Это учебный проект Яндекс.Практикума. Область применения проекта: сверточные нейронные сети (CNN), глубокое обучение, компьютерное зрение | Python, TensorFlow, Keras, ResNet50 |
3 | Анализ заказов такси с помощью PySpark | Анализ данных о заказах такси у терминала №5 Нью—Йоркского аэропорта с помощью библиотеки PySpark и данных, загруженных из файла CSV в базу данных PostgreSQL. Это учебный проект Яндекс.Практикума. Область применения проекта: анализ данных на SQL. | Python, PySpark, Pandas, Numpy, CSV |
4 | Анализ данных об инвестициях с помощью PostgreSQL | Анализ данных об инвестиционных фондах и стартапах, в которые они инвестировали с 2010 по 2013 годы в разных странах. Анализ произведен с помощью PostgreSQL. Это учебный проект Яндекс.Практикума. Область применения проекта: банки, стартапы, инвестиции, анализ данных на SQL. | PostgreSQL, Jupyter Notebook, Markdown |
5 | Классификация текстов с использованием BERT для «Викишоп» | Классификация текстов твитов на позитивные и негативные с использованием технологии BERT для «Викишоп». Это учебный проект Яндекс.Практикума. Область применения проекта: NLP, ML. | Python, Pandas, Sklearn, Pipeline, GridSerach, BERT, CatBoost |
6 | Классификация текстов с использованием TF-IDF для «Викишоп» | Классификация текстов твитов на позитивные и негативные с использованием технологии TF-IDF для «Викишоп». Это учебный проект Яндекс.Практикума. Область применения проекта: NLP, ML. | Python, Pandas, Sklearn, Pipeline, GridSerach, NLTK, TF-IDF, CatBoost |
7 | Регрессионный анализ временных рядов для прогнозирования заказов такси | Прогнозирование количества заказов такси на основе регрессионного анализа временных рядов. Это учебный проект Яндекс.Практикума. Область применения проекта: ML, сервисы такси | Python, Pandas, Sklearn, Pipeline, GridSerach, CatBoost, Statsmodels |
8 | Регрессионный анализ на градиентном бустинге для прогнозирования стоимости автомобиля | Прогнозирование стоимости автомобиля по его характеристикам с помощью регрессионного анализа на градиентоном бустинге. Это учебный проект Яндекс.Практикума. Область применения проекта: ML, продажа автомобилей | Python, Pandas, Sklearn, Pipeline, GridSerach, LightGBM, CatBoost |
9 | Линейная регрессия и шифрование обратной матрицей для защиты персональных данных | Защита персональных данных клиентов с помощью обратной матрицы при передаче данных в предсказательные сервисы, построенные на основе линейной регрессии. Это учебный проект Яндекс.Практикума. Область применения проекта: ML, банки, инвестиции, телеком | Python, Pandas, Sklearn, Numpy, Markdown |
10 | Регрессионный анализ и бутстреп для выбора района нефтедобычи | Выбор локации нефтедобывающей скважины с учетом доходности и рисков, расчитанных с помощью бутстрепа и регрессионного анализа. Это учебный проект Яндекс.Практикума. Область применения проекта: ML, BI, микро—экономический анализ, A/B тестирование, инвестиции, нефтедобыча | Python, Pandas, Sklearn, Bootstrap, микро-экономика, A/B тест |
11 | Ручной подбор гиперпараметров модели классификации для прогноза оттока клиентов из банка | Прогнозирование оттока клиентов банка с ручным подбором гиперпараметров модели классификации. Это учебный проект Яндекс.Практикума. Область применения проекта: ML, маркетинг, банки, инвестиции, кредитование | Python, Pandas, Sklearn |
12 | Комплексный маркетинговый анализ игровой индустрии | Комплексный маркетинговый анализ игровой индустрии. Выявление закономерностей развития рынка. Проверка статистических гипотез. Это учебный проект Яндекс.Практикума. Область применения проекта: BI, статистика, маркетинговый анализ, продуктовый анализ, игровая индустрия | Python, Pandas, Numpy, Scipy, Math, Matplotlib |
13 | Рекомендация тарифов клиентам «Мегалайн» на основе их классификации | Предсказание оптимального тарифа для клиентов телекоммуникационной компании оператора сотовой связи «Мегалайн», использующих устаревшие тарифы. Для предсказания тарифов использованы модели логистической регрессии, решающих деревьев и случайного леса. Это учебный проект Яндекс.Практикума. Область применения проекта: ML, маркетинговый анализ, продуктовый анализ, телекоммуникации | Python, Pandas, Sklearn |
14 | Статистический анализ данных сервиса аренды самокатов GoFast | Статистический анализ данных сервиса аренды индивидуальных средств мобильности (самокаты). Это учебный проект Яндекс.Практикума. Область применения проекта: BI, статистика, маркетинговый анализ, продуктовый анализ, сервисы аренды индивидуальных средств мобильности | Python, Pandas, Numpy, Scipy, Math, Matplotlib |
Продуктовый анализ
В этом разделе представлены проекты проекты продуктового анализа.
№ | Проект | Краткое описание | Стек |
---|---|---|---|
1 | A/B тест выделения игровых ноутбуков в отдельную категорию маркетплейса «Всё.техника» | Проект A/B теста выделения игровых ноутбуков в отдельную категорию «Всё.техника» с использованием сторитейлинга на дашбордах в Tableau и получение данных из PostgreSQL. Это учебный проект Яндекс.Практикума. Область применения проекта: маркетплейсы, A/B тестирование, продуктовый анализ | A/B тестирование, продуктовый анализ, PostgreSQL, Tableau |
2 | Исследование точек роста сервиса «Всё.из.кафе» | Проект исследования точек роста сервиса Всё.из.кафе с использованием данных из PostgreSQL и дашбордов в Tableau. Это учебный проект Яндекс.Практикума. Область применения проекта: онлайн-сервисы заказа еды, когортный анализ, продуктовый анализ | Продуктовый анализ, когортный анализ, PostgreSQL, Tableau |
3 | Анализ юнит-экономики сервиса «Всё.из.кафе» | Проект юнит-экономики сервиса Всё.из.кафе с использованием продуктовых метрик и дашборда в Tableau. Это учебный проект Яндекс.Практикума. Область применения проекта: онлайн-сервисы заказа еды, юнит-экономика, продуктовый анализ | Продуктовый анализ, юнит-экономика, Tableau |
4 | Анализ активности пользователей онлайн-кинотеатра «Всё.Кино» | Проект анализа активности пользователей онлайн-кинотеатра с расчетом продуктовых метрик в PostgreSQL и их визуализацией в дашборде в Tableau. Это учебный проект Яндекс.Практикума. Область применения проекта: онлайн кинотеатры, продуктовый анализ | Продуктовый анализ, PostgreSQL, Tableau |
Data Engineering
В этом разделе представлены проекты в области управления и инженерии данных.
№ | Проект | Краткое описание | Стек |
---|---|---|---|
1 | ETL и автоматизация подготовки данных | Проект изменения процессов в пайплайне для соответствия их новым задачам бизнеса маркетплейса. Это учебный проект Яндекс.Практикума. Область применения проекта: хранилища данных, витрины данных, ETL, реляционные базы данных, маркетплейсы | PostgreSQL, DWH, GitHub.com, Apache Airflow, Docker, DBeaver |
2 | Подключение источников и создание витрины данных в DWH маркетплейса товаров ручной работы | Проект подключения разных реляционных баз данных PostgreSQL к DWH маректплейса товаров ручной работы инкрементальным способом, а также создание на основе этих данных витрины. Это учебный проект Яндекс.Практикума. Область применения проекта: хранилища данных, витрины данных, реляционные базы данных, маркетплейсы | PostgreSQL, DWH, GitHub.com, Docker, DBeaver |
Web-сервисы и программы
В этом разделе представлены проекты различных веб-сервисов и программ.
№ | Проект | Краткое описание | Стек |
---|---|---|---|
1 | ARTPROGRAM | В рамках проекта 12345Design.ru создаются сервисы для художественного творчества под общим брендом ARTPROGRAM. Уже созданы сервисы для зарисовок SCETCH и раскраска PAINT. Сервисы обладают функцией мгновенного взаимодействия с помощью рисунков (это лучше самому увидеть, чем сто раз об этом от кого-то услышать). Область применения проекта: изобразительное искусство, дизайн, образование, веб-сервисы, SaaS | HTML, JavaScript, Canvas, SVG |
2 | Навык Алисы «Как научиться рисовать» | Навык Алисы «Как научиться рисовать» помогает освоить азы рисунка, живописи и композиции, а также узнать как рисовать интерьер, человека и пейзаж. Область применения проекта: изобразительное искусство, дизайн, образование, веб-сервисы, SaaS | Chat-bot, Алиса, Aimylogic, Google Sheets |
3 | Калькулятор «mysimplecalculator» | Калькулятор вдохновленный книгой Бьярне Страуструпа по принципам программирования на C++. Калькулятор выполнен в формате файла exe для командной строки Windows (CMD). Способен производить расчеты разной степени сложности. Область применения проекта: математика, CMD | C++, CMD, Windows |