NTR Scoring – конструктор для создания скоринговых систем

Содержание

Слайд 2

NTR Scoring

Система для кредитного скоринга (оценки кредитоспособности заемщика на основе демографических, исторических

NTR Scoring Система для кредитного скоринга (оценки кредитоспособности заемщика на основе демографических,
и ситуационных данных)
Автор – компания «Лаборатория НТР», Москва
Архитектура – клиент-серверный конструктор (решение)
Подробная информация – сайт www.ntrlab.ru

Слайд 3

История NTR Scoring

2000-2001 – заказная разработка системы кредитного скоринга для одного из

История NTR Scoring 2000-2001 – заказная разработка системы кредитного скоринга для одного
лидеров рынка потребительского кредитования
2004 – продукт NTR Scoring v.2

Слайд 4

NTR Lab: подход к кредитному скорингу

Кредитный скоринг: широко применяется с 1966 года
Классические

NTR Lab: подход к кредитному скорингу Кредитный скоринг: широко применяется с 1966
методы опираются на кредитную историю
Российская (и сообще по СНГ) ситуация – отсутствие не только кредитной истории но, зачастую, и адекватно верифицируемых доходов

Слайд 5

Проблемы потребительского кредитования

Непрозрачность расходов клиентов
Непрозрачность доходов клиентов
Отсутствие истории взаимоотношений с клиентом
Отсутствие гарантий

Проблемы потребительского кредитования Непрозрачность расходов клиентов Непрозрачность доходов клиентов Отсутствие истории взаимоотношений
доходов клиента на срок кредитования
Необходимость выдавать кредиты на точке продажи очень быстро

Слайд 6

NTR Scoring – используемая информация

Демографическая информация - это анкетная информация о клиенте.
Ситуационная

NTR Scoring – используемая информация Демографическая информация - это анкетная информация о
информация - информация о том за каким кредитом, в какое место и время пришел клиент. В случае револьверного кредитования такая информация отсутствует.
Историческая информация - информация об истории финансовых операций с клиентом. Пока что в большинстве случаев такая информация отсутствует.

Слайд 7

NTR Scoring – общий подход к выбору и построению методов

Адаптивные методы, основанные

NTR Scoring – общий подход к выбору и построению методов Адаптивные методы,
на расширенной демографике и анализе точности данных. Здесь – две идеи:
Взять сначала как можно больше анкетных и ситуационных данных о клиенте. В дальнейшем те пункты анкеты, которые не влияют на кредитный риск, отбросить
Анализировать достоверность данных, представляемых клиентом. Если есть проблемы, отказывать в кредите

Слайд 8

NTR Scoring – общая архитектура

Возможность конструировать скоринговую систему на основе голосования нескольких

NTR Scoring – общая архитектура Возможность конструировать скоринговую систему на основе голосования
скоринговых моделей
Возможность использования системы с собственным front-endом или интеграция с системой банка -заказчика на основе веб-сервисов

Слайд 9

Функциональность системы

Функциональность системы

Слайд 10

Модули

Проверка заявки
Кредитный скоринг
Фронт-офис

Модули Проверка заявки Кредитный скоринг Фронт-офис

Слайд 11

Проверка заявки

на полноту и достаточность информации (заявка проверяется сама по себе)
на

Проверка заявки на полноту и достаточность информации (заявка проверяется сама по себе)
наличие информации о клиенте в черном списке
выполнение проверки информации на внешние условия (по демографическим базам данных)
Проверка массива заявок (проверки типа не взяла ли кредит жена или на совпадение телефонов)
Примерно по 40 проверок каждого типа из трех (черный список – очевидно, одна проверка)

Слайд 12

Проверка каждого поля на допустимость соответствующего значения
Проверка совокупности полей на непротиворечивость
Результатом

Проверка каждого поля на допустимость соответствующего значения Проверка совокупности полей на непротиворечивость
логического контроля является список полей заявки требующих уточнения.

Логический контроль

Слайд 13

Поиск совпадений

Каждая вновь вводимая в клиентскую БД заявка на получение кредита

Поиск совпадений Каждая вновь вводимая в клиентскую БД заявка на получение кредита
сравнивается со всеми ранее введенными заявками на предмет поиска совпадений в полях, аналогичных по содержанию. В случае успеха поиска заявка снабжается списком всех найденных совпадений и указателей на ранее введенные заявки, где обнаружились совпадения. В процессе принятия кредитного решения по вновь поступившей заявке операторы имеют возможность:
увидеть полный список совпадений, ассоциированный с данной заявкой;
просмотреть любую из заявок, с данными которых обнаружились совпадения.

Слайд 14

Кредитный скоринг

Ключевое предположение
Прошлый опыт может быть использован для предсказания платежеспособности заемщика
Два основных

Кредитный скоринг Ключевое предположение Прошлый опыт может быть использован для предсказания платежеспособности
типа моделей
Основанные на правилах (отображение существующей кредитной политики банка)
Статистические (основанные на анализе данных о клиентах банка)

Слайд 15

Модели, основанные на правилах, в NTR Scoring

Линейная скоринговая модель
Для каждого признака определяется

Модели, основанные на правилах, в NTR Scoring Линейная скоринговая модель Для каждого
его вес, и клиенту выставляется оценка по каждому признаку. Оценки суммируются с учетом весов.
Дерево решений

Слайд 16

Общая схема построения статистических моделей

Этап 1
Постановка задачи
Подготовка данных

Этап 2
Анализ данных
Построение модели

Этап 3
Использование
Валидация

Общая схема построения статистических моделей Этап 1 Постановка задачи Подготовка данных Этап
модели

Ввод

Базовые
алгоритмы

Подстройка
моделей

Оценка

Слайд 17

Обучение моделей

Обучающие
данные

Модель

Тестовые данные

Популяция

Истинный уровень ошибок

Определяемый уровень ошибок

Кажущийся уровень ошибок

Обучение моделей Обучающие данные Модель Тестовые данные Популяция Истинный уровень ошибок Определяемый

Слайд 18

Выбор данных для обучения

Все данные

Случайный

выбор

Случайный

выбор

Случайный

выбор

Данные для построения модели

Данные для подстройки модели

Данные для

Выбор данных для обучения Все данные Случайный выбор Случайный выбор Случайный выбор
валиджации модели

Данные для тренировки модели

Слайд 19

Нейронные сети

Выходной слой

Скрытый слой

Входной слой

Нейронные сети Выходной слой Скрытый слой Входной слой

Слайд 20

Передаточная функция

Y = 1 / (1+ exp(-k(Σ Win * Xin)) 

Передаточная функция Y = 1 / (1+ exp(-k(Σ Win * Xin))

Слайд 21

Обучение

Прямой ход:
Вычисляются результаты для примера и ошибки.
Обратный ход (обратное распространение

Обучение Прямой ход: Вычисляются результаты для примера и ошибки. Обратный ход (обратное
ошибки):
Ошибки на выходе используются для изменения весов на выходных нейронах. Потом вычисляются ошибки на нейронах скрытого слоя, и на их основе изменяются веса.

Слайд 22

k ближайших соседей (k-NN)

Общий принцип – обучение по примерам. Запоминаются обучающие

k ближайших соседей (k-NN) Общий принцип – обучение по примерам. Запоминаются обучающие
примеры и для принятия решения по новому примеру ищутся наиболее похожие обучающие примеры
k-NN – выбираются k ближайших соседей (расстояние может измеряться по-разному). Пример относится к тому классу, соседей которого класса больше (возможно, с весом, обратно зависящим от расстояния)

Слайд 23

Principal Component Analysis

Тоже метод обучения по примерам
Данные переводятся в двумерную плоскость,

Principal Component Analysis Тоже метод обучения по примерам Данные переводятся в двумерную
соответствующую главным компонентам (старшим сингурялным векторам) матрицы распределения обучающих примеров
Далее – k-NN
Позволяет отфильтровать шум в выборке

Слайд 24

Локально взвешенная регрессия (обучение по примерам)

Тоже метод обучения по примерам
В окрестности примера

Локально взвешенная регрессия (обучение по примерам) Тоже метод обучения по примерам В
строится линейная регрессионная модель, дающая непрерывную вероятность принадлежности к классам
Образцы для модели взвешиваются с использованием обратно зависящего от расстояния веса

Слайд 25

Линейный дискриминантный анализ (1)

Предположим, что нам надо классифицировать клиентам по двум классам

Линейный дискриминантный анализ (1) Предположим, что нам надо классифицировать клиентам по двум
с1 и с2
X – вектор анкеты клиента
Lij – ожидаемая цена ошибки классификации
Pr(X) – Вероятность реализации X.
Pr(X|ci) – условная вероятность X в классе ci.

Слайд 26

Линейный дискриминантный анализ (2)

Применим для классификации байесовское правило: отнести Х к классу

Линейный дискриминантный анализ (2) Применим для классификации байесовское правило: отнести Х к
c1, если
Предположим, что распределение векторов в каждом классе f(X|ci) оответствует нормальному гауссовскому распределению. Тогда
где μi – средний вектор для класса i, а Σ – матрица ковариации

Слайд 27

Линейный дискриминантный анализ (3)

Таким образом, правило классификации:
μi и Σ могут быль получены

Линейный дискриминантный анализ (3) Таким образом, правило классификации: μi и Σ могут
из исторических данных
основные проблемы – оценка (Pr(c2)/ Pr(c1)) (точность зависит от представительности выборки) и (L21/L12)
Можно заменить (L21/L12) и (Pr(c2)/ Pr(c1)) константой отсечки и подбирать ее

Слайд 28

Функции фронт-офиса

Ведение жизненного цикла кредита
Управление информацией о клиентах
Управление информацией о Продуктах
Управление скорингом

Функции фронт-офиса Ведение жизненного цикла кредита Управление информацией о клиентах Управление информацией о Продуктах Управление скорингом

Слайд 29

Ведение жизненного цикла кредита

Открытие кредита
Выпуск пластиковой карты
Отслеживание погашения кредита с учетом грейс-периода
Возобновление

Ведение жизненного цикла кредита Открытие кредита Выпуск пластиковой карты Отслеживание погашения кредита
кредита
Управление досрочным закрытием

Слайд 30

Управление информацией о клиентах

создание единой базы данных по клиентам Банка, зарегистрированных в

Управление информацией о клиентах создание единой базы данных по клиентам Банка, зарегистрированных
рамках Системы;
автоматизация процессов регистрации и обработки заявок клиентов Банка на предоставление Продуктов в рамках Системы;
автоматизация процесса принятия решения о кредитоспособности клиентов на основе процедуры скоринга;
обеспечение целостности информации по клиентам в Системе;
накопление кредитной истории клиентов Банка.

Слайд 31

Управление информацией о Продуктах

автоматизация процедур управления продуктами;
обеспечение целостности информации по кредитам в

Управление информацией о Продуктах автоматизация процедур управления продуктами; обеспечение целостности информации по
Системе;
получение статистической и аналитической информации по использованию продуктов Банка.

Слайд 32

Управление скорингом

анализ истории предоставления кредитов
расчет и перерасчет скоринговых коэффициентов

Управление скорингом анализ истории предоставления кредитов расчет и перерасчет скоринговых коэффициентов

Слайд 33

Функции управления клиентами

регистрация и ведение заявок клиентов на предоставление Продукта;
выполнение проверок

Функции управления клиентами регистрация и ведение заявок клиентов на предоставление Продукта; выполнение
зарегистрированных заявок;
выполнение расчета кредитного рейтинга клиента (скоринг);
регистрация и ведение информации о клиентах;
управление статусами клиентов;
сбор информации о клиентах от других модулей Системы;
предоставление информации о клиентах другим модулям Системы;
регистрация событий, связанных с жизненным циклом клиента.

Слайд 34

Функции управления продуктами

регистрация и ведение информации о кредитах;
регистрация событий, связанных с жизненным

Функции управления продуктами регистрация и ведение информации о кредитах; регистрация событий, связанных
циклом кредита;
управление статусами кредитов;
сбор информации о кредитах от других модулей Системы;
предоставление информации о кредитах другим модулям Системы.