Commonwealth Bank детализирует способ обнаружения злоупотребления транзакцией

205

Commonwealth Bank предоставил более подробную информацию о точках данных и языковых моделях, которые он использует для выявления финансовых злоупотреблений в описаниях транзакций.

Команда лаборатории искусственного интеллекта банка опубликовала исследовательскую работу на arXiv. [pdf] в нем описывается «многоэтапный подход», а также предлагается вклад «широкого исследовательского сообщества» для улучшения текущего метода.

Поскольку в середине 2020 года банк обнаружил притеснения и запугивания в описаниях транзакций с низкой стоимостью, он работал над разработкой и оттачиванием модели машинного обучения для обнаружения таких случаев.

Все остальные банки «большой четверки» аналогичным образом обратились к расширенной аналитике и алгоритмам, чтобы попытаться решить эту проблему.

В своем исследовательском документе CBA подробно описывает, как она решила проблему с машинным обучением.

На уровне транзакции банк смотрит на «специфику», такую ​​как сумма в долларах и частота, а также на некоторый «простой текстовый» анализ поля произвольного текста, где он смотрит на такие переменные, как «длина описания транзакции, флаги верхнего/нижнего/смешанного регистра, количество слов, длина самого длинного слова в описании транзакции, [and] содержит ли сообщение специальные символы/цифры».

Банк также использует три предварительно обученные языковые модели для обнаружения «эмоций, токсичности и настроений» в описаниях.

Оттуда он объединяет свои выводы до уровня «отношений» — между обидчиком и потенциальной жертвой.

Если у обидчика более одной жертвы, это помечается как «две жертвы». [or more] отчетливые отношения высокого риска».

Банк также проверяет, ответила потенциальная жертва или нет.

Все это передается в модель случайного леса, которая в конечном итоге классифицирует отношения как «сильно оскорбительные или не оскорбительные».

«Окончательная модель уже полностью работоспособна в банке», — написала команда AI Labs.

«Чтобы повысить надежность модели, мы регулярно проводим ее переобучение, когда отправленные кейсы проверяются специалистами заказчика по уязвимостям».

Исследователи AI Labs заявили, что из-за «новизны» проблемы банк мало что мог использовать или опираться при разработке технического ответа на сообщения.

Он стремился получить более широкий вклад в то, что он собрал до сих пор, а также предложил модель для принятия другими учреждениями.

Банк также отметил, что дальнейшие улучшения проводятся собственными силами.

«Существует ряд потенциальных улучшений, над которыми мы сейчас работаем и планируем опубликовать в будущих работах», — написала команда лаборатории.

«Некоторые примеры потенциальных улучшений: лучшее освещение иностранных языков, [and] использование несколько месяцев [of] история разговоров для выявления длительных злоупотреблений».

Читать полную новость на сайте