Commonwealth Bank предоставил более подробную информацию о точках данных и языковых моделях, которые он использует для выявления финансовых злоупотреблений в описаниях транзакций.
Команда лаборатории искусственного интеллекта банка опубликовала исследовательскую работу на arXiv. [pdf] в нем описывается «многоэтапный подход», а также предлагается вклад «широкого исследовательского сообщества» для улучшения текущего метода.
Поскольку в середине 2020 года банк обнаружил притеснения и запугивания в описаниях транзакций с низкой стоимостью, он работал над разработкой и оттачиванием модели машинного обучения для обнаружения таких случаев.
Все остальные банки «большой четверки» аналогичным образом обратились к расширенной аналитике и алгоритмам, чтобы попытаться решить эту проблему.
В своем исследовательском документе CBA подробно описывает, как она решила проблему с машинным обучением.
На уровне транзакции банк смотрит на «специфику», такую как сумма в долларах и частота, а также на некоторый «простой текстовый» анализ поля произвольного текста, где он смотрит на такие переменные, как «длина описания транзакции, флаги верхнего/нижнего/смешанного регистра, количество слов, длина самого длинного слова в описании транзакции, [and] содержит ли сообщение специальные символы/цифры».
Банк также использует три предварительно обученные языковые модели для обнаружения «эмоций, токсичности и настроений» в описаниях.
Оттуда он объединяет свои выводы до уровня «отношений» — между обидчиком и потенциальной жертвой.
Если у обидчика более одной жертвы, это помечается как «две жертвы». [or more] отчетливые отношения высокого риска».
Банк также проверяет, ответила потенциальная жертва или нет.
Все это передается в модель случайного леса, которая в конечном итоге классифицирует отношения как «сильно оскорбительные или не оскорбительные».
«Окончательная модель уже полностью работоспособна в банке», — написала команда AI Labs.
«Чтобы повысить надежность модели, мы регулярно проводим ее переобучение, когда отправленные кейсы проверяются специалистами заказчика по уязвимостям».
Исследователи AI Labs заявили, что из-за «новизны» проблемы банк мало что мог использовать или опираться при разработке технического ответа на сообщения.
Он стремился получить более широкий вклад в то, что он собрал до сих пор, а также предложил модель для принятия другими учреждениями.
Банк также отметил, что дальнейшие улучшения проводятся собственными силами.
«Существует ряд потенциальных улучшений, над которыми мы сейчас работаем и планируем опубликовать в будущих работах», — написала команда лаборатории.
«Некоторые примеры потенциальных улучшений: лучшее освещение иностранных языков, [and] использование несколько месяцев [of] история разговоров для выявления длительных злоупотреблений».
Читать полную новость на сайте