Поддержать команду Зеркала
Беларусы на войне
  1. На БелАЭС сработала сигнализация — второй энергоблок отключили от сети
  2. «Не держу вокруг себя трусов». В 18 лет учащийся гомельского колледжа проснулся под дулом пистолета и попал в колонию — поговорили с ним
  3. Светлана Тихановская получает от правительства Литвы 35 тысяч евро в месяц? Что ответили в Офисе и МИД
  4. «Приходят десятки сообщений, что ужесточается контроль на границе». Узнали, как сейчас силовики ищут участников протестов 2020 года
  5. Беларус вернулся на родину из Литвы — его судили и дали два года колонии с крупным штрафом
  6. Последние инициативы Трампа заставили Кремль вспомнить старые нарративы. Но озвучивают их уже с новой целью — рассказываем подробности
  7. У Николая Лукашенко увеличился один из бюджетных источников дохода — его отец подписал указ
  8. Мобильные операторы вводят изменения. Клиентам дали несколько дней, чтобы перейти на новые услуги
  9. Поймали таинственного зверя, пугавшего жителей Сеницы и Прилук
  10. «А мне воняет не гарью, а кошачьим туалетом». Беларусы возмущаются, что пакеты в магазинах неприятно пахнут. Объясняем почему
  11. «Однозначно установить запрет на использование». Нацбанк объявил, что хочет ввести очередное ограничение — какое на этот раз
  12. «Преступная война Путина приближается к нашим границам». Российские беспилотники атаковали польский завод


/

На прошлой неделе американская технологическая компания OpenAI представила новейшие большие языковые модели искусственного интеллекта, получившие названия o3 и o4-mini. Однако, как показали тесты, обе модели, по-видимому, сделали значительный шаг назад: они склонны придумывать — или галлюцинировать — сильнее, чем их более ранние версии, пишет Naked Science.

Изображение носит иллюстративный характер. Фото: Freepik.com
Изображение носит иллюстративный характер. Фото: Freepik.com

По данным издания TechCrunch, новые модели OpenAI противоречат исторической тенденции, согласно которой каждая новая модель давала все меньше галлюцинаций, чем предыдущая, что позволяет предположить, что OpenAI теперь движется в неверном направлении.

Согласно результатам внутреннего тестирования OpenAI, o3 и o4-mini склонны к галлюцинациям чаще, чем старые модели, включая o1, o1-mini и даже o3-mini. Модель o3 выдала 33% ошибок на тесте точности компании. Это примерно вдвое больше, чем у предыдущих моделей OpenAI. Тогда как o4-mini показала еще более худший результат — 48%.

Хуже того, специалисты компании, похоже, не до конца понимают причины проблем. Согласно их техническому отчету, «необходимы дополнительные исследования, чтобы понять причину» этих ошибок.