Студенти обманюють університетських оцінювачів екзаменаційними роботами, згенерованими ШІ

Дослідники з Університету Редінга обдурили власних професорів, таємно надавши згенеровані штучним інтелектом відповіді на іспити, які залишилися непоміченими та отримали кращі оцінки, ніж справжні студенти.Проєкт створював підроблені особи студентів, щоб подавати невідредаговані відповіді, згенеровані ChatGPT-4, під час онлайн-оцінювання студентських курсів.

Університетські оцінювачі, яким не було повідомлено про проєкт, відзначили лише одну з 33 записів, а решта відповідей ШІ отримали вищі за середні оцінки, ніж студенти.

Автори стверджують, що їхні висновки показали, що процесори штучного інтелекту, такі як ChatGPT, тепер проходять «тест Тюрінга», названий на честь піонера обчислювальної техніки Алана Тюрінга, і можуть пройти непомітно досвідчені судді.

Автори, названі «найбільшим і найнадійнішим сліпим дослідженням у своєму роді», щоб дослідити, чи можуть педагоги виявляти відповіді, створені ШІ, автори попередили, що це має серйозні наслідки для того, як університети оцінюють студентів.

«Наше дослідження показує, що розуміння того, як штучний інтелект вплине на цілісність освітніх оцінок, має міжнародне значення», — сказав доктор Пітер Скарф, один із авторів і доцент Школи психології та клінічних мовних наук Редінга.

«Ми не обов’язково повністю повернемося до рукописних іспитів, але глобальний освітній сектор потребуватиме розвитку в умовах ШІ».

У дослідженні зроблено висновок: «З огляду на поточні тенденції, здатність штучного інтелекту демонструвати більш абстрактні міркування зросте, а його здатність до виявлення зменшиться, що означає, що проблема академічної доброчесності погіршиться».

Експерти, які перевіряли дослідження, сказали, що це посмертний дзвін для домашніх іспитів або неконтрольованих курсових робіт.

Професор Карен Юнг, науковий співробітник у галузі права, етики та інформатики Бірмінгемського університету, сказала: «Публікація цього реального тесту забезпечення якості дуже чітко демонструє, що генеративні інструменти штучного інтелекту, які є у відкритому доступі, дозволяють студентам обманювати, беручи додому. іспити без труднощів, щоб отримати кращі оцінки, але таке списування практично неможливо виявити».

Дослідження припускає, що університети могли б використовувати матеріал ШІ, створений студентами, під час оцінювання. Професор Етьєн Реш, інший автор, сказав: «Як сектор, ми повинні погодитися, як ми очікуємо, що студенти використовуватимуть і визнають роль ШІ в їхній роботі. Те саме стосується ширшого використання ШІ в інших сферах життя, щоб запобігти кризі довіри в суспільстві».

Професор Елізабет Маккрам, проректор Редінга з питань освіти, сказала, що університет «відходить» від онлайн-іспитів, які можна взяти додому, і розробляє альтернативи, які включатимуть застосування знань у «реальному житті, часто пов’язаному з роботою».

МакКрам сказав: «Деякі оцінювання допоможуть учням використовувати ШІ. Навчати їх використовувати його критично та етично; розвивати їхню грамотність у сфері штучного інтелекту та озброювати їх необхідними навичками для сучасного робочого місця. Інші оцінки будуть виконані без використання штучного інтелекту».

Але Єнг сказав, що дозвіл на використання ШІ на іспитах у школах та університетах може створити власні проблеми з «дезактивністю» студентів.

«Подібно до того, як багато хто з нас більше не може орієнтуватися в незнайомих місцях без допомоги Карт Google, існує реальна небезпека, що прийдешнє покоління виявиться фактично прив’язаним до цих машин, нездатним серйозно думати, аналізувати чи писати. без їхньої допомоги», — сказав Єнг.

У примітках до дослідження автори припускають, що вони, можливо, використовували ШІ для підготовки та написання дослідження, зазначаючи: «Чи вважаєте ви це «обманом»? Якби ви вважали це «шахрайством», але ми заперечували використання GPT-4 (або будь-якого іншого штучного інтелекту), як би ви спробували довести, що ми брехали?»

Представник Reading підтвердив, що дослідження «безумовно проводилося людьми».