Содержание
- 2. Задача Разработать классификатор для автоматического определения категории запроса по тексту сообщения, оставленному на сайте Администрации Курской
- 3. Цель Сократить время ответа на обращения жителей
- 4. Pipeline Обращения Препроцессинг и feature engineering Модель Результат
- 5. Pipeline Обращения представлены в виде текста с дополнительной информацией об ответственном лице, тематике и лейблом категории
- 6. Pipeline Препроцессинг Очистка корпуса от html тегов попавших в текст при сборе данных Очистка текста от
- 7. Pipeline Feature engineering Создание словаря весов TF/IDF для всего корпуса (train+test) Upsampling обучающей выборки разделением текстов
- 8. Pipeline Модель Объединение текста с предсказанной тематикой на основе кластеризации Bert finetuning на классификацию текстов В
- 9. Pipeline Результат Multi AUC-ROC на публичном лидерборде 0.998829
- 11. Скачать презентацию