Data Science
Здесь представлены некоторые проекты в области расширенного анализа данных и машинного обучения. Проекты выполнены в Jupyter Notebook на Python в том числе с применением технологий Pipeline и GridSearch.
№ | Название проекта | Описание | Сфера | Стек | Ссылки |
---|---|---|---|---|---|
1 | Классификация текстов с использованием BERT | Классификация текстов твитов на позитивные и негативные с использованием технологии BERT. Учебный проект Яндекс.Практикума. | NLP, ML | Python, Pandas, Sklearn, Pipeline, GridSerach, BERT, CatBoost | HTML ipynd |
2 | Классификация текстов с использованием TF-IDF | Классификация текстов твитов на позитивные и негативные с использованием технологии TF-IDF. Учебный проект Яндекс.Практикума. | NLP, ML | Python, Pandas, Sklearn, Pipeline, GridSerach, NLTK, TF-IDF, CatBoost | HTML ipynd |
3 | Регрессионный анализ временных рядов | Прогнозирование количества заказов такси. Учебный проект Яндекс.Практикума. | ML, такси | Python, Pandas, Sklearn, Pipeline, GridSerach, CatBoost, Statsmodels | HTML ipynd |
4 | Регрессионный анализ на градиентном бустинге | Прогнозирование стоимости автомобиля по его характеристикам. Учебный проект Яндекс.Практикума. | ML, продажа автомобилей | Python, Pandas, Sklearn, Pipeline, GridSerach, LightGBM, CatBoost | HTML ipynd |
5 | Линейная регрессия с данными, зашифрованными обратной матрицей | Защита персональных данных клиентов с помощью обратной матрицы при передаче данных в предсказательные сервисы, построенные на основе линейной регрессии. Учебный проект Яндекс.Практикума. | ML, банки, инвестиции, телеком | Python, Pandas, Sklearn, Numpy, Markdown | HTML ipynd |
Проект «Восстановление золота из руды» (https://microsegment.ru/jupyter_notebook_portfolio/c5108c80-06b4-42ce-864f-45cd626e9e0d-final.ipynb)