Модели оценки рисков клиентов в банке
Росфинмониторинг в выпуске № 26 журнала «Финансовая безопасность» рассказал о том, что что делает кредитные организации притягательными для лиц, причастных к организации и осуществлению схем отмывания денег.
Сохранение на национальном уровне достаточно высокой доли теневой экономики и высокой доли оборота наличных денежных средств, использование номинальных юридических лиц (фирм-однодневок), сокрытие денежных средств и активов, полученных в результате совершения преступлений в иностранных юрисдикциях, несовершенство отдельных норм действующего законодательства в части противодействия незаконному выводу денежных средств за рубеж и обналичиванию требуют от кредитных организаций активной модернизации подходов к защите от угроз отмывания денег.
Если обратить внимание на современные достижения в области обработки больших данных, то становится очевидно, что для применения методов статистического моделирования в целях противодействия легализации преступных доходов открываются широкие возможности. Данная статья посвящена опыту внедрения и применения моделей на больших данных в целях комплаенс на примере АО «Райффайзенбанк».
Инструменты противодействия отмыванию денег
При выборе инструментов противодействия угрозам на практике, как правило, отдается предпочтение набору способов и средств, позволяющему с минимальными затратами и высокой эффективностью не допустить ущерба. Если говорить о противодействии проведению сомнительных операций в банке, то реализация оперативной оценки и раскрытия угрозы отмывания денег до того, как с потенциальным клиентом будут установлены отношения, а также до момента осуществления операции клиентом в процессе его обслуживания, позволит не допустить нанесения ущерба, связанного с использованием услуг банка в противоправных целях.
Сам факт осуществления сомнительной операции в банке, даже оперативно выявленной по факту ее проведения в режиме последующего контроля, позволяет говорить о том, что ущерб, обусловленный фактической передачей денег получателю в целях отмывания указанных средств, уже нанесен. В данном случае для снижения рисков вовлечения банка в противоправные схемы в качестве эффективного инструмента противодействия осуществлению сомнительных операций следует считать набор средств, позволяющий максимально оперативно и точно, основываясь на достаточно большом количестве данных, предсказать, оценить угрозу отмывания денег и эффективно реагировать на ее появление.
Очевидно, что решение данной задачи не представляется возможным без должного уровня автоматизации процессов предупреждения, выявления, оценки и реагирования на угрозы отмывания денег до момента нанесения ущерба.
На практике банк развивает следующий набор последовательных путей решения упомянутой выше задачи, предусматривающих применение оценки вероятности осуществления сомнительных операций.
- Выявление критично рисковых потенциальных клиентов до момента установления отношений и реализация законного права банка не принимать их на обслуживание. С одной стороны, это превентивная мера, которая делает невозможным проведение в банке сомнительных операций таким лицом. С другой стороны, к качеству процесса выявления указанных лиц предъявляются очень высокие требования — оценка вероятности осуществления сомнительной деятельности конкретным лицом осуществляется без анализа его операций (ведь в банке они еще не проводятся).
- Предотвращение сомнительных операций действующих клиентов. Это означает, что клиент уже обслуживается в банке, но по ряду причин, описанных далее, его операция попала на контроль до ее осуществления. Решение о проведении отобранной операции принимается аналитиком по результатам ее проверки.
- Сокращение времени реакции на необычное поведение клиента, выявленное в рамках последующего контроля совершенных им операций. Предсказание вероятности осуществления клиентом деятельности в целях отмывания денег осуществляется силами транзакционных моделей на основании статической и динамической информации.
Если говорить о первом пункте, то в процессе принятия на обслуживание потенциальных клиентов, кроме проверок на базовые условия, дополнительно осуществляются:
- простая проверка по спискам критично рисковых лиц;
- анализ данных с целью выявления специальных критериев, когда требуется непосредственное участие аналитика;
- проверка действительности профиля клиента;
- скоринг на основании внутренних и внешних данных.
Следует отметить, когда оценка потенциального клиента осуществляется работником банка в ручном режиме, можно полагаться только на формальные признаки вероятной вовлеченности субъекта в схемы отмывания денег — оценку риска в данном случае нельзя считать достаточно объективной. Принимая во внимание стремление банка минимизировать риск ошибки в отношении конкретного потенциального клиента применение статистических моделей позволяет объективно оценить риски отмывания денег указанным лицом и принять обоснованное решение перед заключением договора на обслуживание.
После принятия клиента на обслуживание для банка открывается новый источник данных для оценки деятельности клиента — проводимые в банке операции. Как правило, для анализа действующих клиентов в основном используются именно транзакционные данные, однако банк также учитывает и данные, полученные в отношении конкретного клиента из разных источников. Практика показывает, что обработка совокупности статических и транзакционных данных в целях оценки риска отмывания денег на уровне математических моделей дает наиболее точный и объективный результат в отношении действующих клиентов.
Если при осуществлении последующего контроля используются модели на больших данных с логикой работы, основанной на обучении в процессе применения решений множества сходных задач, — машинное обучение, то для работы в режиме реального времени используется более простая логика на уровне правил и предварительно рассчитанных параметров. Во множестве типовых случаев, когда не требуется ручная обработка результатов работы моделей, для своевременного реагирования на выявленные угрозы применяются специальные программы, автоматически выполняющие определенные действия в рамках условий обслуживания клиентов, — так называемые роботы. Данный подход позволяет аналитикам банка уделять больше времени действительно сложным случаям и не тратить его на очевидные, типовые ситуации.
Модельный ряд: становление и успех
Модели для оценки риска для потенциальных клиентов
На протяжении нескольких лет поступательно ужесточаются требования для банков в части противодействия отмыванию денег — со временем работать требуется еще быстрее и точнее.
Поскольку наиболее рисковым сегментом считается средний и малый бизнес, банк активно развивает решение, нацеленное на оценку риска отмывания денег с помощью статистических моделей в отношении относящихся к данному сегменту потенциальных клиентов, обратившихся в банк для заключения договора на рассчетно-кассовое обслуживание.
Практика показала, что наиболее точный результат оценки дает сочетание простых формализованных проверок и скоринговой модели, построенной на реальной внутренней статистике банка в сочетании с внешними данными.
Например, при принятии решения об открытии счета потенциальному клиенту. Также при постконтроле активности клиента в банке (особенно это актуально в начале обслуживания клиента, когда он еще не накопил достаточное для объективного анализа количество операций) применение статистической модели существенно улучшило качество контроля. Модель пригодилась и для сценариев онлайн-контроля — позволяет более точно оценивать риск операции в целях отмывания денег с учетом профиля конкретного клиента.
В самом начале разработок была проанализирована предсказательная сила модели, построенная исключительно на внутренних данных банка. В итоге главный вывод состоит в том, что даже на таких лаконичных данных можно относительно точно предсказывать вероятность проведения анализируемым лицом сомнительных операций, если для него будет открыт счет в банке.
Первые практические шаги в применении статистической модели для оценки риска отмывания денег потенциальными клиентами банк сделал в 2016 году — на тот момент модель учитывала исключительно внутренние данные банка.
Однако для того, чтобы улучшить качество модели, построенной исключительно на внутренних данных, необходимо использовать еще какую-либо дополнительную информацию.
Так, в 2017 году проанализировали множество различных внешних источников данных и был выбран один из них для практического использования, после чего качество модели выросло более чем на 10%. Улучшение качества модели связано с тем, что внешняя информация в отношении потенциального клиента, по своей сути, содержит сведения иного рода, нежели внутренние данные банка, что качественно в лучшую сторону изменило предсказательную силу модели. Был еще один фактор успеха новой модели: параллельно был улучшен алгоритм обработки внутренних данных.
После этого, уже в 2018 году, был проведен дополнительный анализ множества источников данных, в результате чего выявили еще один источник внешних данных, который сам по себе работал со средней силой, однако позволил еще больше увеличить предсказательную способность ансамбля моделей. Если говорить о цифрах, то это более чем пятипроцентный рост, опять же с учетом того, что модель на внутренних данных была в очередной раз обновлена.
Летом 2019 года снова доработали модель, обогатив ее дополнительными данными, доступными внутри банка, и стали более эффективно использовать внешние данные, за счет чего получили дополнительный прирост в предсказательной силе модели.
Для выбора лучшего ансамбля моделей использовалась специальная метрика, основанная на бизнес-процессе, который обеспечивается в результате работы модели:
- для критично рисковых потенциальных клиентов — реализация законного права банка не принимать на обслуживание;
- для относительно рисковых потенциальных клиентов — открытие счета в банке с рядом условий в обслуживании;
- для потенциальных клиентов с низким уровнем риска — открытие счета в банке в стандартном режиме обслуживания.
Очевидно, что данный подход требует очень точно определять оттенки внутри группы потенциальных клиентов с уровнем риска, отличным от низкого — для группы с низким уровнем риска точность определения внутренних отличий не критична.
Для достижения этой цели была создана метрика, которая оценивает точность модели в нижних скоринговых баллах. Технически локальный балл, который строится на внутренних данных банка, является результатом применения логистической регрессии с L1 регуляризацией, а «ансамблирование» баллов происходит с помощью дерева решений. Высокий результат при максимальной наглядности и гибкости выделили данный подход для практического применения в будущем.
За моделью необходимо «ухаживать» и систематически наблюдать за ней. Так, для проверки качества работы модели банк осуществляет ежемесячный мониторинг ее состояния. Если в результате мониторинга состояния модели установлено снижение предсказательной способности, то модель перестраивается по новым данным.
Следует отметить, что важным моментом является ведение корректного учета лиц, не принятых на обслуживание в результате работы модели. Дело в том, что по причине отсутствия реальных транзакционных данных указанной группы лиц у банка нет возможности определить, насколько действительно операции этих лиц имели бы отношение к отмыванию денег, если бы банк их все-таки принял на обслуживание.
Если выделить небольшую часть потенциальных клиентов (так называемую фокус-группу), в отношении участников которой рассчитан низкий скоринговый балл, препятствующий установлению отношений с банком, но несмотря на скоринг, открыть счета для этой группы лиц, то по реальному поведению фокус-группы можно оценить в целом, насколько рисковыми явились для банка ее участники, и сопоставить эту оценку с ожиданиями. Если ожидания подтверждаются, то модель разработана и внедрена корректно.
Модель оценки риска для действующих клиентов
Как уже упоминалось выше, для оценки рисков отмывания денег действующими клиентами банк применяет скоринг-модели, построенные на транзакционных данных, в сочетании с анализом анкетных данных клиентов.
Далее рассмотрим особенности моделей, построенных для оценки риска отмывания денег юридическими лицами, индивидуальными предпринимателями и физическими лицами, соответственно.
Модель оценки риска для юридических лиц и индивидуальных предпринимателей
Для юридических лиц и индивидуальных предпринимателей разработана поведенческая модель, которая анализирует в основном осуществляемые в банке транзакции, при этом анкетным данным клиентов также уделяется достаточное внимание при определении скорингового балла.
Работа над моделью началась с определения параметров (было протестировано более 150 позиций), по которым оценивается деятельность клиента на основании рекомендаций Банка России, Росфинмониторинга и внутренней экспертизы. В расчет были приняты такие показатели, как налоговая нагрузка, структура платежей в разрезе хозяйственной деятельности в целом, параметры отдельных операций, а также другие показатели, позволяющие оценить реальность ведения хозяйственной деятельности и ее соответствие правилам и требованиям.
В создание рабочего набора параметров были вовлечены специалисты, обладающие разноплановой экспертизой: аналитики в области противодействия отмыванию денег, непосредственно разработчики модели и др. При выборе параметров проверялась их статистическая значимость, а также их вклад в финальную модель.
Особенность поведенческой модели такова, что она «смотрит» на общие тренды, а не на отдельные типологии, то есть модель не выявляет конкретные схемы движения денег, а по совокупности параметров показывает клиентов, осуществляющих операции, вероятно связанные с отмыванием денег.
Модель по сути состоит из двух частей: медленная, которая обрабатывает операции за большой интервал времени, и быстрая, которая «смотрит» на самые свежие операции. Такой подход позволяет быстро и достаточно точно идентифицировать подозрительное поведение.
На основании уровня риска и профиля клиента выявляются три группы рисковых клиентов по признакам вероятного обналичивания, транзита денежных средств и операций смешанного типа по первым двум признакам. При этом в отношении каждой из групп применяется своя мера, которая минимизирует риск продолжения совершения подозрительных операций.
Как уже отмечалось выше, важно регулярно проверять качество работы модели и при необходимости ее перестраивать, т. к. недобросовестные хозяйствующие субъекты находят новые способы реализации противоправных действий и их поведение постоянно меняется.
Модель оценки риска для физических лиц
В среднем, уровень риска отмывания денег физическими лицами ниже, чем для юридических лиц, однако в абсолютном выражении данный сегмент содержит значительное количество участников, вовлеченных в противоправные схемы в целях отмывания денег.
Для выявления клиентов — физических лиц, вовлеченных в схемы отмывания денег, была создана поведенческая модель, состоящая из двух частей: медленной и быстрой, аналогично модели для юридических лиц. Быстрая часть модели состоит из нескольких переменных, которые были отобраны из тестовой группы, состоящей из более чем ста шестидесяти позиций. По аналогии с поведенческой моделью для юридических лиц большая часть переменных имеет отношение к транзакциям клиента, при этом также учитываются и имеют важное значение анкетные данные клиента.
Все активные клиенты на основании проводимых операций с помощью модели относятся к одной из четырех групп, отличных друг от друга по степени реакции банка на проводимые операции в зависимости от вероятности обналичивания денег.
В случае наличия критично высокого риска отмывания денег оперативно прекращается дистанционное обслуживание клиента, осуществляющего такие операции. Операции с умеренным риском обрабатываются аналитиками в ручном режиме.
Важно отметить, для распределения по группам недостаточно знать только риск конкретной операции — для указанных целей используются простые правила, основанные на шаблоне поведения клиента, а также его анкетных данных и банковских продуктах.
С начала осени 2019 года модель была полностью перестроена. Для этого были заново проверены все известные лучшие переменные и дополнительно создано более ста новых переменных. Также были использованы более сложные математические алгоритмы, а именно градиентный бустинг над ансамблем деревьев. При этом проверка правильной работы зависимостей и частичная интерпретируемость результата была достигнута с помощью значений Шепли из теории игр. В настоящий момент продолжается тестирование обновленной модели в «боевом» режиме.
С учетом того, что все больше внимания регулятора уделяется способности банков заранее предотвращать проведение сомнительных операций, не допуская нанесения ущерба, банк сконцентрировался на применении набора различных инструментов, позволяющих заблаговременно с высокой вероятностью предсказывать, надежно пресекать и прекращать проведение в банке операций в целях отмывания денег.
Важно отметить, что применяемые сценарии основаны на рекомендациях Банка России, Росфинмониторинга и внутренней статистике, а модели — в основном на внутренней статистике, но для потенциальных клиентов банк дополнительно использует и внешние данные.
Более сложные подходы к моделированию требовательны к количеству и качеству данных, однако полученный результат того стоит. Кроме того, все модели нуждаются в регулярном мониторинге и обновлении, чтобы учесть изменения в поведениях клиентов, экономической ситуации в стране и, конечно, информации от Росфинмониторинга и Банка России. В рамках мониторинга банк оценивает и пересматривает качество своих моделей каждый месяц.
Кроме регулярных обновлений моделей, планы на будущее включают в себя поиск и анализ новых источников данных, более детальную оценку связей клиента, дальнейший переход к инструментам онлайн-контроля и роботизации процессов.