Фулмера, Лиса, Змиевского, Алексеевой, Logit-Lasso, Decision Tree, Random Forest, Gradient Boosting, CatBoost) и 4 вида выборок, когда для обучения этих моделей используется:
1) вся выборка целиком (10 моделей);
2) выборки с компаниями одного размера (4*10 = 40 моделей);
3) выборки с компаниями одной отрасли (7*10 = 70 моделей);
4) выборки с компаниями и одного размера, и одной отрасли (4*7*10 = 280 моделей).
Качество моделей при прогнозе и его изменение в зависимости от типа обучения (в 1-й строке представлен ROC AUC, в остальных строках – его процентное изменение по отношению к общей модели, полужирным выделено наилучшее улучшение, красным – случаи ухудшения качества прогноза)