Модели прогнозирования банкротства российских компаний с учетом их размера и отраслевой принадлежности

Содержание

Слайд 2

АКТУАЛЬНОСТЬ ИССЛЕДОВАНИЯ

Кредитные учреждения нуждаются в скоринговых моделях, обладающих высокой точностью применительно к

АКТУАЛЬНОСТЬ ИССЛЕДОВАНИЯ Кредитные учреждения нуждаются в скоринговых моделях, обладающих высокой точностью применительно
задаче прогнозирования вероятности наступления кризисной ситуации у компании, во избежание значительных потерь при предоставлении кредита компаниям
В нестабильной рыночной среде развивающийся экономики России оценка состояния своей компании или компании-конкурента исходя из финансовых данных важно для людей, принимающих менеджерские решения для обеспечения эффективного управления компанией
Развитие малого бизнеса влияет на экономический рост, научно-технический прогресс и расширяет число рабочих мест, а компании среднего и крупного бизнеса создают прочную основу экономического потенциала каждой страны и отличаются высокой инновационной активностью, поэтому различные государственные органы могут быть заинтересованы в прогнозировании будущей динамики финансового состояния компаний, например, с целью разработки своевременных мер поддержки бизнеса

Слайд 3

АНАЛИЗ ПРЕДМЕТНОЙ ОБЛАСТИ

АНАЛИЗ ПРЕДМЕТНОЙ ОБЛАСТИ

Слайд 4

АНАЛИЗ ПРЕДМЕТНОЙ ОБЛАСТИ

АНАЛИЗ ПРЕДМЕТНОЙ ОБЛАСТИ

Слайд 5

ЦЕЛИ И ЗАДАЧИ ИССЛЕДОВАНИЯ

ЦЕЛЬ ИССЛЕДОВАНИЯ:
Разработка высокоточного классификатора с целью прогнозирования дефолта

ЦЕЛИ И ЗАДАЧИ ИССЛЕДОВАНИЯ ЦЕЛЬ ИССЛЕДОВАНИЯ: Разработка высокоточного классификатора с целью прогнозирования
российских компаний с учётом их размера и отраслевой принадлежности с помощью различных методов эконометрики и машинного обучения, используя финансовые показатели из бухгалтерской отчетности компании, а также некоторые её нефинансовые характеристики.

ЗАДАЧИ ИССЛЕДОВАНИЯ:
Осуществить сбор и первичную обработку данных из базы данных РУСЛАНА
Имплементировать программный код на языке Python
Проанализировать полученные результаты и сделать основные выводы о практической значимости исследования

Слайд 6

Сбор данных

В выборке содержатся компании, которые обанкротились в 2018 и в 2019

Сбор данных В выборке содержатся компании, которые обанкротились в 2018 и в
годах. Финансовая отчетность для объясняющих переменных берется за год до банкротства.

Объясняющих переменных получилось более 50:
Финансовые переменные взяты из классических зарубежных и отечественных моделей и из обзора литературы.
Нефинансовые переменные: возраст компании, число работников, дамми на размер, дамми на отрасль, дамми на импортную и экспортную деятельность.

*Zhou, L. (2013). Performance of corporate bankruptcy prediction models on imbalanced dataset: The effect of sampling methods. Knowledge-Based Systems, 41, 16-25.

Слайд 7

Распределение компаний в выборке в зависимости от размера и отрасли

Распределение компаний в выборке в зависимости от размера и отрасли

Слайд 8

Отобранные для разработки классификатора модели

Помимо этого, были отобраны несколько методов машинного обучения

Отобранные для разработки классификатора модели Помимо этого, были отобраны несколько методов машинного
и эконометрики, а именно, логистическая регрессия с L1-регуляризацией (Logit-Lasso), дерево решений (Decision Tree), случайный лес (Random Forest), градиентный бустинг (Gradient Boosting) и ставший популярным недавно разработанный компанией Яндекс усовершенствованный метод градиентного бустинга CatBoost.

Слайд 9

Описание эксперимента и сравнение моделей по качеству прогноза

Имелось 10 видов моделей (Альтмана-Собато,

Описание эксперимента и сравнение моделей по качеству прогноза Имелось 10 видов моделей
Фулмера, Лиса, Змиевского, Алексеевой, Logit-Lasso, Decision Tree, Random Forest, Gradient Boosting, CatBoost) и 4 вида выборок, когда для обучения этих моделей используется:
1) вся выборка целиком (10 моделей);
2) выборки с компаниями одного размера (4*10 = 40 моделей);
3) выборки с компаниями одной отрасли (7*10 = 70 моделей);
4) выборки с компаниями и одного размера, и одной отрасли (4*7*10 = 280 моделей).

Качество моделей при прогнозе и его изменение в зависимости от типа обучения (в 1-й строке представлен ROC AUC, в остальных строках – его процентное изменение по отношению к общей модели, полужирным выделено наилучшее улучшение, красным – случаи ухудшения качества прогноза)

Слайд 10

Предельные эффекты моделей Logit-Lasso для компаний разных типов размеров

Предельные эффекты моделей Logit-Lasso для компаний разных типов размеров

Слайд 11

Предельные эффекты моделей Logit-Lasso для компаний разных типов размеров

Предельные эффекты моделей Logit-Lasso для компаний разных типов размеров

Слайд 12

РЕЗУЛЬТАТ ИССЛЕДОВАНИЯ

РЕЗУЛЬТАТ:
Был разработан высокоточный классификатор с целью прогнозирования дефолта российских компаний с

РЕЗУЛЬТАТ ИССЛЕДОВАНИЯ РЕЗУЛЬТАТ: Был разработан высокоточный классификатор с целью прогнозирования дефолта российских
учётом их размера и отраслевой принадлежности, а также проведен эксперимент для выявления, помогает ли построение различных моделей для групп компаний по типу размера, отрасли, отрасли и размера одновременно получить более качественный результат.

ВЫВОДЫ:
При построении общих моделей методы машинного обучения, особенно CatBoost, показали качество более высокое, чем классические линейные модели;
Согласно проведенному эксперименту, для 8 из 10 моделей качество прогноза улучшилось, если для каждого отдельного типа предприятия по размеру (очень крупное, крупное, среднее, малое) строить отдельную модель, а не общую;
Разбивка обучающей выборки на предприятия по категориям показывает улучшение прогноза лишь в 3 и 5 случаев, что ставит под сомнение выгоду и пользу применения такого подхода, встречавшегося в более ранних отечественных работах;
В среднем, прирост качества от построения отдельных моделей выше для более слабых классических моделей, чем для более сильных моделей машинного обучения;
Прогноз, построенный методом Logistic Lasso возможно улучшить любым из трех предложенных подходов обучения;
При построении Logistic Lasso в зависимости от размера компании и отрасли в целом множество переменных часто выбирается схожим, однако предельные эффекты разняться и по абсолютному значению, и по знаку влияния.

Имя файла: Модели-прогнозирования-банкротства-российских-компаний-с-учетом-их-размера-и-отраслевой-принадлежности.pptx
Количество просмотров: 56
Количество скачиваний: 0