GPT-4, последняя версия чат-бота с искусственным интеллектом (AI), ChatGPT, может сдавать тесты в старших классах и экзамены на юридический факультет с оценками в 90-м процентиле и имеет новые возможности обработки, которые были недоступны в предыдущей версии.
14 марта его создатель OpenAI поделился цифрами результатов тестов GPT-4, показав, что он также может преобразовывать изображения, аудио и видео в текст в дополнение к более творческой и надежной обработке «гораздо более тонких инструкций».
«Он проходит смоделированный экзамен на адвоката с оценкой около 10% лучших участников теста», — добавил OpenAI. «Напротив, оценка GPT-3.5 была около нижних 10%».
Цифры показывают, что GPT-4 набрал 163 балла в 88-м процентиле на экзамене LSAT — тесте, который студенты колледжей должны пройти в Соединенных Штатах, чтобы поступить в юридический вуз.
Оценка GPT4 ставит ее в хорошие условия для поступления в 20 лучших юридических школ, и всего на несколько баллов меньше заявленных оценок, необходимых для поступления в престижные школы, такие как Гарвард, Стэнфорд, Принстон или Йель.
Предыдущая версия ChatGPT набрала всего 149 баллов на LSAT, что означает, что она попала в нижние 40%.
GPT-4 также набрал 298 баллов из 400 на Едином экзамене для юристов — тесте, который проходят недавно окончившие учебу студенты-юристы, что позволяет им заниматься адвокатской практикой в любой юрисдикции США.
Старая версия ChatGPT боролась с трудностями в этом тесте, заняв 10% худших результатов с результатом 213 баллов из 400.
Что касается экзаменов SAT Evidence-Based Reading & Writing и SAT Math, сдаваемых учащимися средних школ США для оценки их готовности к поступлению в колледж, GPT-4 набрал 93-й и 89-й процентили соответственно.
GPT-4 преуспел и в «точных» науках, набрав намного выше среднего процентиля по биологии (85–100%), химии (71–88%) и физике 2 (66–84%).
Однако его оценка AP Calculus была довольно средней, занимая от 43r до 59-го процентиля.
Еще одна область, в которой не хватало GPT-4, — это экзамены по английской литературе, в которых баллы находились в диапазоне от 8-го до 44-го процентиля по двум отдельным тестам.
OpenAI заявила, что GPT-4 и GPT-3.5 взяли эти тесты из практических экзаменов 2022–2023 годов, и что инструменты обработки языка не проходили «специального обучения»:
«Мы не проводили специальной подготовки к этим экзаменам. Меньшая часть проблем на экзаменах была замечена моделью во время обучения, но мы считаем, что результаты репрезентативны».
Результаты вызвали страх и в сообществе Twitter.
Связанный: Как ChatGPT повлияет на пространство Web3? Отраслевые ответы
Ник Алмонд, основатель FactoryDAO, 14 марта сообщил своим 14 300 подписчикам в Твиттере, что GPT4 собирается «напугать людей» и «обрушит» глобальную систему образования.
Теория оценивания была большой частью моей жизни в течение нескольких лет. Я стучал об этом дне, наступившем много лет назад. В то время я буквально звучал как местный чудак.
Но… на самом деле это означает, что с этого момента все, кроме неусыпной оценки, закончилось.
— дрник ️² (@DrNickA) 14 марта 2023 г.
Бывший директор Coinbase Конор Гроган сказал, что вставил активный смарт-контракт Ethereum в GPT-4, сразу же указал на несколько «уязвимостей безопасности» и рассказал, как можно использовать код:
Я сбросил активный контракт Ethereum в GPT-4.
В одно мгновение он выявил ряд уязвимостей в системе безопасности и указал области, где контракт может быть использован. Затем он проверил, каким образом я могу использовать контракт pic.twitter.com/its5puakUW.
— Конор (@jconorgrogan) 14 марта 2023 г.
Более ранние аудиты смарт-контрактов в ChatGPT показали, что его первая версия также способна в разумной степени обнаруживать ошибки в коде.
Роуэн Чунг, основатель информационного бюллетеня AI «The Rundown», поделился видео о том, как GPT транскрибирует нарисованный от руки поддельный веб-сайт на листе бумаги в код.
Я только что наблюдал, как GPT-4 превратил нарисованный от руки эскиз в функциональный веб-сайт.
Это безумие. pic.twitter.com/P5nSjrk7Wn
— Роуэн Чунг (@rowancheung) 14 марта 2023 г.
Источник: Сointеlеgrаph
Какая это была неделя. Возвращение Ревущей Китти в воскресенье вечером привело к торговому безумию: акции…
Предполагаемый бывший сотрудник Pump.fun вчера удалил из протокола Solana на сумму около 2 миллионов долларов.…
Вот вам и возрождение акций мемов GameStop, а также связанный с ними рост монет мемов.Поскольку…
Илон Маск, генеральный директор Tesla, SpaceX и Neuralink, объявил сегодня в твите, что Neuralink ищет…
Похоже, Ревущего Китти разочаровал его любимый магазин видеоигр.GameStop, компания, которую трейдер (он же Кит Гилл)…
Цена Биткойна выросла до самого высокого уровня со времени широко обсуждавшегося события 19 апреля, коснувшись…