LIVE

Проверить ИИ-скоринг: 5 факторов оценки заемщика банками

ПРОТОКОЛ ТИПОВОГО ИНЦИДЕНТА…

Анна Смирнова·Обновлено: 14 июня 2026 г.·8 мин

Проверить ИИ-скоринг: 5 факторов оценки заемщика банками

ПРОТОКОЛ ТИПОВОГО ИНЦИДЕНТА

Объект: физическое лицо, сегмент масс-афлюэнт.

Запрос: потребительский кредит, 380 000 руб.

Входные данные: кредитная история без просрочек, доход подтверждён по форме 2-НДФЛ, стаж на текущем месте работы — 4 года.

Решение: автоматический отказ.

Формулировка банка: «решение принято скоринговой моделью, детализация невозможна».

Аномалия: формальные основания для отказа отсутствуют.

Алгоритм машинного обучения прочитал цифровой след заявителя за шестьдесят секунд сессии в мобильном приложении и зафиксировал набор поведенческих маркеров, которые классический скоринг не интерпретирует. Чтобы проверить 5 факторов оценки заемщика банками, недостаточно запросить отчёт в БКИ — требуется понимание того, какие альтернативные данные анализирует предиктивная модель и какие поведенческие переменные вносят вклад в итоговый балл. Документируем механику по шагам.

За пределами БКИ: как Big Data меняет правила кредитования

Традиционная модель кредитного скоринга — логистическая регрессия по ограниченному набору переменных из кредитной истории — постепенно уступает позиции гибридным моделям на основе машинного обучения. Ансамблевые методы (Gradient Boosting, Random Forest) обрабатывают тысячи параметров за секунды, причём речь идёт не только о финансовой дисциплине заёмщика.

Современный ИИ-скоринг в банках анализирует так называемые альтернативные данные. В этот пул входят:

  • история оплат жилищно-коммунальных услуг;
  • регулярность пополнения счёта мобильного оператора;
  • паттерны входа в мобильное приложение банка (частота, время суток, геолокация сессии);
  • транзакционная активность по дебетовым картам;
  • поведенческие характеристики при заполнении онлайн-анкеты;
  • косвенные маркеры платёжеспособности, агрегируемые из внешних источников.

По оценкам McKinsey, внедрение предиктивных моделей машинного обучения позволяет снизить уровень неработающих кредитов (NPL) на 10–20% по сравнению с классическими логистическими регрессиями. Экономический эффект для банка прямой: меньше просрочек — меньше резервов — выше маржинальность портфеля. Для заёмщика последствия обратные: отказ или ухудшение условий может прилететь по неочевидной причине, которую невозможно верифицировать через бюро кредитных историй.

Проверить 5 факторов оценки заемщика банками через отчёт БКИ — то же, что анализировать уязвимости сетевого протокола по одному заголовку пакета. Кадр неполный, выводы будут ошибочны.

Цифровой след и транзакционная активность: что ИИ видит в вашем смартфоне

Вектор эксплуатации данных здесь — телеметрия, которую устройство пользователя передаёт при взаимодействии с веб-формой или мобильным приложением банка. В контексте скоринга эти же параметры работают как поведенческие маркеры надёжности. Фактор «цифрового следа» включает анализ следующих переменных:

  • тип и версия операционной системы устройства;
  • версия и тип браузера;
  • уровень заряда батареи смартфона на момент подачи заявки;
  • устойчивость интернет-соединения (количество разрывов сессии);
  • скорость заполнения полей анкеты;
  • факт подключения через публичные сети Wi-Fi.

Звучит парадоксально, однако заряд батареи действительно коррелирует с уровнем финансовой дисциплины. Исследования в области поведенческой экономики показывают, что пользователи с хронически разряженным устройством чаще допускают просрочки по платежам — вероятно, вследствие общего снижения уровня самоконтроля при когнитивной перегрузке. Модель это учитывает: low battery становится одной из переменных в дереве решений, наравне с типом ОС и стабильностью соединения.

Транзакционная активность анализируется не по абсолютной сумме, а по структуре расходов. Алгоритм выделяет категориальный микс, регулярность трат, склонность к снятию наличных и характер P2P-переводов.

ПараметрЧто оценивает модельРиск-сигнал
Регулярность тратСтабильность дохода и привычекВысокая дисперсия = повышенный риск
Категориальный миксСоотношение «здоровых» и «рисковых» категорийПерекос в бары, ломбарды, микрофинансовые сервисы снижает скор
Снятие наличныхСклонность к неформализованным операциямЧастое снятие — потенциальный флаг для фрод-мониторинга
P2P-переводыНаличие неформализованного доходаСистематические переводы физлицам могут снизить оценку
Возвраты и оспариванияСклонность к чарджбэкамИстория диспутов — красный флаг для скоринговой модели

До 90% решений по кредитам малого объёма (до 100–150 тысяч рублей) в ряде банков принимаются полностью автоматически, без участия кредитного инспектора. Это означает, что цифровой след, оставленный в сессии, — не вспомогательная метрика, а основной вектор принятия решения. Человеческий взгляд включается только при пересечении пороговых значений либо при оспаривании клиентом.

При проверке факторов оценки заёмщика имеет смысл протестировать собственное устройство: устаревшая ОС, подключение через публичный Wi-Fi при заполнении анкеты, нестабильное соединение — каждая из этих переменных вносит вклад в финальный балл. Поведенческая телеметрия смартфона — именно тот слой данных, который считывает скоринговая модель при компрометации сессии, и к его гигиене стоит относиться с той же серьёзностью, что и к кредитной истории: проверять настройки приватности, отключать лишние разрешения приложений, избегать заполнения анкет в условиях нестабильного или потенциально скомпрометированного соединения.

Психометрический анализ и социальные связи: оценка надёжности для новичков

Отдельный пласт — сегмент new-to-bank. Это клиенты без кредитной истории: молодые специалисты, фрилансеры, недавно переехавшие, мигранты. У классического скоринга для них данных нет, и банк вынужден искать косвенные маркеры.

В этом сегменте применяется психометрический скоринг — оценка, основанная на поведении в социальных сетях, ответах на специализированные тесты, анализе круга контактов. Формально психометрия чаще встречается в микрофинансовых организациях, однако крупные банки при кредитовании thin-file клиентов также прибегают к поведенческим моделям, опирающимся на открытые данные и согласованные с пользователем источники.

Что именно анализируется:

1. Социальный граф — наличие «якорей»: друзей с положительной кредитной историей, профильных контактов с указанием места работы, длительных и устойчивых связей, указывающих на социальную интеграцию.

2. Стабильность цифровой идентичности — давно созданный профиль с многолетней историей активности оценивается выше, чем свежий аккаунт без следов, что снижает риск подмены личности.

3. Тональность и лексика публикаций — модели NLP (обработки естественного языка) выявляют признаки импульсивного поведения, агрессии, зависимостей, склонности к конспирологическому мышлению и асоциальным паттернам.

4. Регулярность и характер онлайн-активности — паттерны «живого» пользователя против бота или фейка, что косвенно подтверждает подлинность личности.

Психометрический скоринг остаётся самым дискуссионным из пяти факторов. Логика банка понятна: для клиента без кредитной истории это единственный способ сформировать предсказательный скор-балл до первого фактического взаимодействия. Логика критиков тоже прозрачна: корреляция между стилем публикаций в социальной сети и вероятностью дефолта не установлена с той же статистической значимостью, что и для транзакционных данных. Тем не менее алгоритм не делает различий между «сильной» и «слабой» переменной — он считает вклад каждой в ансамблевое решение, и для thin-file сегмента психометрия нередко становится весомым компонентом.

Социальные связи в этой системе выступают полноценным залогом. Не юридическим — статистическим. Поручительство XXI века, оформленное без подписи.

Математика против NPL: почему алгоритмы Gradient Boosting точнее классики

Техническая основа нового скоринга — ансамблевые методы машинного обучения. Логистическая регрессия работает с линейными комбинациями признаков, что ограничивает её способность улавливать нелинейные зависимости. Gradient Boosting и Random Forest строят деревья решений и агрегируют их, что позволяет выявлять сложные взаимосвязи: например, что определённое сочетание типа устройства, времени подачи заявки и категории покупок сигнализирует о фрод-риске с точностью, недостижимой для классической модели. Каждое следующее дерево в ансамбле корректирует ошибки предыдущего, что в итоге даёт робастную нелинейную аппроксимацию целевой переменной — дефолта.

Снижение NPL на 10–20% — это прямой финансовый результат, который невозможно игнорировать. Банк, отказавшийся от ML-моделей, проигрывает в эффективности и, как следствие, в стоимости фондирования для заёмщика. Ставки по кредитам у «классиков» выше именно вследствие закладываемого риска — консервативная модель компенсирует потери повышенной маржой, при условии что регулятор допускает подобное ценообразование.

При этом важно понимать ограничения. ИИ не исключает человеческий фактор полностью: финальные настройки модели — feature engineering, отбор переменных, калибровка порогов — остаются за риск-менеджерами. Кроме того, модели подвержены concept drift: с течением времени паттерны поведения заёмщиков меняются, и модель, обученная на данных 2020 года, к 2024-му деградирует без переобучения. Что влечёт за собой регулярные аудиты, перекалибровку и пересмотр весов — операционную нагрузку, которую банки не афишируют в маркетинговых материалах.

Дополнительный риск — adversarial attacks. Злоумышленник, знающий структуру скоринговой модели, способен целенаправленно формировать «правильный» цифровой след: эмулировать стабильное поведение, накручивать транзакционную историю через сеть подставных лиц, использовать верифицированные устройства. Это превращает поведенческий скоринг в новый вектор компрометации кредитного процесса, против которого у большинства банков нет адекватной защиты — игнорировать этот факт при настройке модели недопустимо.

Регуляторные рамки и прозрачность: почему банк не обязан раскрывать веса факторов

В России использование ИИ в скоринге регулируется рекомендациями ЦБ РФ, выпущенными в период 2020–2023 годов. Ключевое требование — обеспечение интерпретируемости алгоритмов. Банк обязан уметь объяснить регулятору логику работы модели, выявить и устранить дискриминирующие факторы: пол, возраст, национальность, религия в качестве прямых переменных исключены или тщательно контролируются.

Однако перед клиентом банк такой обязанности не несёт. Точный перечень факторов конкретного банка — коммерческая тайна. Веса, которые присваиваются каждому фактору, динамически меняются при переобучении модели, что делает их раскрытие бессмысленным с точки зрения банка. Клиент получает лишь общую формулировку отказа — «не соответствует кредитной политике банка» — без детализации, какой именно из 5 факторов оценки заёмщика сработал против него. Юридически банк обязан обосновать отказ, но не раскрывать алгоритм, — что создаёт принципиально иную систему обязательств, нежели в странах с open banking.

Это формирует асимметрию информации. Банк знает о клиенте значительно больше, чем клиент знает о логике банка. В такой ситуации проверить 5 факторов оценки заемщика банками — значит принять, что полная прозрачность недостижима, и работать с тем, что доступно: гигиена цифрового следа, стабильность транзакционного профиля, отсутствие «красных флагов» в поведенческих метриках, минимизация публичных цифровых идентичностей, осознанное управление согласиями на обработку данных.

Финал: регламент поведения заёмщика

Проверить 5 факторов оценки заемщика банками — это не разовая процедура с фиксированным результатом, а регламент поведения. Цифровой след, транзакционная активность, поведенческие паттерны при заполнении анкеты, социальные связи и косвенные маркеры — пять векторов, по которым предиктивная модель считывает заёмщика за минуты. Банк не раскрывает веса, ЦБ требует интерпретируемости для регулятора, но не для клиента. Результат — непрозрачная для пользователя система, в которой отказ может прилететь по неочевидной причине, а успешная заявка — прилететь по неочевидной заслуге. Что влечёт за собой практический вывод: перед подачей заявки на кредит имеет смысл провести ревизию собственного цифрового профиля с той же методичностью, с какой исследователь проверяет платёжный протокол на уязвимости, — последовательно, по чек-листу, без иллюзий относительно полноты картины. Другой опции рынок пока не предоставляет.