Анализ данных в банке и телекоме

Слайд 2

О чем поговорим?

О чем поговорим?

Слайд 3

Прогнозные модели или аналитические отчеты? Мой опыт…

Прогнозные модели или аналитические отчеты? Мой опыт…

Слайд 4

Банки…

Наша первая модель – оптимизация затрат в Soft Collection
Проблематика:
Количество клиентов выходящих на

Банки… Наша первая модель – оптимизация затрат в Soft Collection Проблематика: Количество
просрочку растет с каждым месяцем.
Колл центр расширять никто не хочет в виду высоких затрат на содержание, мотивацию, обучение и прочее затраты.
Нужен новый метод который позволит при неизменных затратах сохранять уровень по сборам
Как действует бизнес «ДО»:
Звонит с первого дня просрочки (далее регулярные звонки и СМС)
Предложение по пилоту:
Построить модель по выявлению «случайных» просрочников
Что сделали:
Построили регрессионную модель в SAS Guide с таргетом: хорошие -до 7 дней, средние –до 30, злостные – остальные)
Как оценивать результат:
В тестовых группах тестировали как отсутствие коммуникации с хорошими, так и более дешевый канал коммуникации.
Результат:
Пилот успешный, экономия состоялась за счет более грамотной политики управления каналами коммуникации

Слайд 5

Модель стресс-тестирования
Проблематика:
В рамках МСФО 9, необходимо построить модель стресс-тестирования: влияние макропоказателей на

Модель стресс-тестирования Проблематика: В рамках МСФО 9, необходимо построить модель стресс-тестирования: влияние
кредитный портфель банка
Компании или её регулирующие органы предпочитают стресс-тестирование, когда хотят посмотреть на то, как ведут себя финансовые инструменты в случае определенной стрессовой ситуации, например:
Что случится, если фондовые рынки обрушатся более чем на X% в этом году?
Что произойдет, если ВВП падает на Z% в течение данного года?
Что произойдет, если процентные ставки вырастут, по крайней мере на Y%?
Что делать, если половина инструментов в портфеле будет расторгнута через пять лет?
Что произойдет, если цена на нефть вырастет на 200%?
Что использовали:
Инструменты по работе с временными рядами в IBM SPSS Modeller
Про что важно не забыть:
Не стационарные временные ряды необходимо приводить в стационарный вид
Иначе корреляция будет между чем угодно
При рассмотрении влияния переменных с лагом на целевую, необходимо убедится в адекватности данного влияния и отсутствию сменны знака на разных уровнях лага.
Результат:
Не получилось построить модели с коэффициентом детерминации более 50%, за исключением одного продукта. Что, как нам показалось и логично

Слайд 6

Сегментации

Для чего обычно использовала:
Для понимания своих клиентов (соц демо, P&L, поведение)
Для формирования

Сегментации Для чего обычно использовала: Для понимания своих клиентов (соц демо, P&L,
программ лояльности (но тут не совсем банк, точнее ломбард был)
Для поиска вдохновения в разработке новых продуктов
Для проведения маркетинговых исследований
Прелюдия перед моделированием

Какие проблемы бывали:
Не достаточно данных для полной картинки. Особенно в очень узких задачах, когда например необходимо выяснить, кто в вашей базе клиентов –курит, водит автомобиль и т.д.
Решение:
Провести опрос силами CC по своей базе задавая интересующие вопросы – получить обучающую выборку. Далее дело техники ☺

Слайд 7

Кейсы телекома

Телеком скоринг - Аналог кредитного скоринга
Для чего нужен и как используется?
Используется

Кейсы телекома Телеком скоринг - Аналог кредитного скоринга Для чего нужен и
банками и микро кредитными организациями как
дополнительный предиктор в локальной скоринговой карте
в качестве прескоринга для таргетных/тригерных рассылок/звонков
как фильтр для телко- лидогенерации
Какая ценность для банков?
Увеличение коэффициента Gini (по опыту от 3 баллов до 8) – точность прогноза
Экономия на неэффективных звонках/СМС
Экономия на не эффективных лидах

Слайд 8

Модели для обогащения профиля

О чем это?
У телеком кампаний недостаточно регистрационных данных для

Модели для обогащения профиля О чем это? У телеком кампаний недостаточно регистрационных
профилирования клиентов по соц. Демографическому портрету (пол, возраст, семейное положение, наличие детей и т.д.)
Для чего это нужно?
Для более точных CBM моделей,
Анализа клиентов,
Сегментации и идентификации их потребностей клиентов
Как решали вопрос?
Сбор обучающей выборки с помощью СС
Прогонка всей базы по данной моделей
Что делали мы?
Построили модель по полу:
Модель отдельно по тем по кому есть 8 марта и 23 февраля и отдельно по тем по кому нет. Качество первой сильно лучше : ~80% и ~ 60% precision соответственно
Модель по возрасту:
Выборка оказалась сильно меньше чем по полу
Строили отдельно для 5 возрастных групп, трех и двух. Чем меньше сегментов не выше качество каждой в отдельности
Модель по семейному статусу была на очереди, но долго собиралась обучающая выборка…
Что еще можно?
Сегменты по интересам на базе DPI, звонковой активности: любитель сериалов, автомобилей , фитнеса и т.д.