ChatGPT уступает студентам: экзамены по бухгалтерскому учету стали настоящим испытанием

ChatGPT сдаёт экзамены по бухгалтерскому учёту хуже, чем студенты, борется с математическим процессом - статья о том, как искусственный интеллект ChatGPT справляется с экзаменами по бухгалтерскому учёту и какие проблемы возникают при решении математических задач.

350

Исследователи из Университета Бригама Янга (BYU) и 186 других университетов провели исследование, чтобы узнать, как ChatGPT, продукт чат-бота OpenAI, покажет себя на экзаменах по бухгалтерскому учету. В их исследовании было обнаружено, что студенты лучше сдали экзамены по бухгалтерскому учету, чем ChatGPT. Однако, исследователи отметили, что производительность ChatGPT была впечатляющей и что это изменит правила игры, которое изменит то, как все преподают и учатся – к лучшему.

На экзамене по бухгалтерскому учету студенты набрали в среднем 76,7%, по сравнению с 47,4% ChatGPT. В то время как в 11,3 процентах вопросов ChatGPT показал более высокие результаты, чем в среднем по учащимся, было обнаружено, что ИИ-бот хуже справляется с налоговыми, финансовыми и управленческими оценками. Исследователи считают, что это могло быть связано с тем, что ChatGPT боролся с математическими процессами, необходимыми для последнего типа.

Кроме того, было обнаружено, что бот с искусственным интеллектом, который использует машинное обучение для генерации текста на естественном языке, лучше справляется с вопросами «верно/неверно» и вопросами с несколькими вариантами ответов, но с трудом справляется с вопросами с короткими ответами.

Исследователи отметили, что ChatGPT иногда выдумывает факты и совершает бессмысленные математические ошибки. Они также обнаружили, что бот часто давал объяснения своим ответам, даже если они были неверными, и продолжал выбирать неправильный ответ с несколькими вариантами ответов, несмотря на предоставление точных описаний.

Исследователи заявили, что ChatGPT труднее ответить на вопросы более высокого порядка и что он предоставляет авторитетные письменные описания неправильных ответов или отвечает на один и тот же вопрос по-разному.

Желая внести свой вклад в продолжающиеся интенсивные дебаты о том, как модели, подобные ChatGPT, должны влиять на образование, ведущий автор исследования Дэвид Вуд, профессор бухгалтерского учета УБЯ, решил нанять как можно больше профессоров, чтобы увидеть, как ИИ показал себя по сравнению с реальными университетскими студентами-бухгалтерами.

Читать полную новость на сайте