Чим довша бесіда — тим більше «галюцинацій»: нові дані про ШІ

Популярні чат-боти зі штучним інтелектом після тривалого спілкування з користувачами починають демонструвати більше помилок і неточностей. Таких висновків дійшли дослідники Microsoft Research спільно з Salesforce, повідомляє Windows Central.

Під час дослідження було проаналізовано понад 200 тисяч розмов із чат-ботами на основі великих мовних моделей. Результати показали, що сумарний рівень помилок у довгих діалогах може зростати більш ніж на 100%. Користувачі найчастіше скаржаться на так звані «галюцинації» — вигадані або неточні факти.

Експеримент охопив провідні моделі, зокрема GPT-4.1, Gemini 2.5 Pro, Claude 3.7 Sonnet та DeepSeek R1.

Якщо під час одноразових запитів такі системи демонструють приблизно 90% успішних відповідей, то у тривалих розмовах із додатковими уточненнями цей показник знижується до 65%. З ускладненням контексту ефективність моделей помітно падає.

Дослідники також зафіксували явище «роздування відповідей»: у багатоходових діалогах тексти ставали довшими на 20–300%. Водночас разом із обсягом зростала кількість припущень та помилкових тверджень, які закріплювалися в контексті та впливали на подальші відповіді.

Навіть моделі з розширеними можливостями міркування, такі як OpenAI o3 та DeepSeek R1, не змогли повністю уникнути цього ефекту.

Автори підкреслюють, що мова не йде про буквальне «тупішання» моделей. Йдеться радше про обмеження в утриманні великого обсягу інформації та коректній інтерпретації складного контексту під час тривалого діалогу.

Як зазначає Windows Central, ці особливості варто враховувати під час інтеграції чат-ботів у продукти, орієнтовані на довгу взаємодію з користувачами. Адже помилки та «галюцинації» можуть вводити людей в оману — особливо якщо ШІ використовується як джерело точної або критично важливої інформації.

Поділитися:

АКТУАЛЬНО

ЦІКАВЕ ЗА ТЕМОЮ
У ФОКУСІ

В Польщі ліквідовано потужну друкарню, що виготовляла фальшиві євро

Співробітники Агентства внутрішньої безпеки Польщі (ABW) провели успішну операцію в Мазовецькому воєводстві, в результаті якої було закрито підпільну друкарню, що спеціалізувалася на виробництві підроблених євро. Встановлено, що частина фальшивих грошей планувалася для реалізації на території України. Правоохоронці затримали чотирьох польських громадян віком від 44 до 71 року. Вони були організат...

Блогерку вигнали з Emily Resort Григорія Козловського за критику сервісу: скандальне відео облетіло мережу

В соцмережах розходиться відео блогерки Юліани Камишової на якому охоронці заміського комплексу Emily Resort виганяють жінку за те, що вона зауважила про невідповідність цін в закладі рівню сервісу. Після грубого поводження охорони Emily Resort, блогерка записала частину конфлікту з охоронцем та свою позицію на відео, яке виклала в Інстаграм:  “Дорого і готель гарний, але сервіс […]

Можливий дозвіл Японії на передачу ракет Patriot у власному виробництві до Європи

Японія розглядає можливість розширення експорту своїх ракет Patriot до країн Європи та інших регіонів, що може мати стратегічне значення для України в її боротьбі проти Росії. Уряд Японії планує оновити інструкції щодо експорту оборонної продукції вже цієї п’ятниці. Це дозволить постачання ракет та іншого обладнання, яке виготовлене за ліцензією, до країн, де є власники патентів. […]

Мобілізаційні правила в Україні: що зміниться з 1 квітня

З 1 квітня в Україні не варто очікувати значних змін у мобілізаційних процедурах, незважаючи на численні чутки про можливе посилення вимог. Юристи підкреслюють, що існують важливі аспекти, які вже викликають питання у військовозобов'язаних, зокрема щодо поняття так званого "розшуку". Адвокат Андрій Межирицький пояснює, що термін "розшук" вживається скоріше в побутовому сенсі і не має чітко визнач...

Орбан відмовляється підтримати повторне призначення фон дер Ляєн на посаду голови Єврокомісії

Прем’єр-міністр Угорщини Віктор Орбан перед самітом лідерів заявив, що не може підтримати повторне призначення Урсули фон дер Ляєн на посаду голови Єврокомісії. Про це заявив прессекретар угорського уряду Золтан Ковач у Twitter. Орбан зазначив, що Угорщина не може підтримати продовження мандату фон дер Ляєн, звинувативши її у використанні інструментів для захисту верховенства права проти Угорщини. […]

Організатори Каннського кінофестивалю заборонили провокативні образи на червоній доріжці

Організатори Каннського кінофестивалю 2025 року вперше ввели суворий дрес-код, аби покласти край популярному тренду на так звані “голі сукні”. Згідно з новими правилами, гостям фестивалю буде заборонено з’являтися на червоній доріжці у відвертих вбраннях, що надмірно відкривають тіло. Як повідомляє Daily Mail, на червону доріжку дозволено допускати лише класичні вечірні сукні в підлогу, костюми, коктейльні […]

Як нова політика Трампа змінить хід війни

Інавгурація Дональда Трампа як 47-го президента США, запланована на 20 січня 2025 року, стане не лише важливою подією для Сполучених Штатів, але й суттєво вплине на глобальну політику. У найближчі чотири роки Трамп, ймовірно, слідуватиме одному з кількох сценаріїв, які можуть суттєво змінити міжнародну ситуацію. Як зазначає Financial Times, Україна буде згадуватися у двох з […]

Затримання підлітка в Норвегії за підозрою у терористичних намірах

У Норвегії 17-річного хлопця затримали через підозру в підготовці терористичного акту на військовій базі НАТО, розташованій у Ставангері на південному заході країни. На цій базі функціонує Об’єднаний військовий центр Альянсу (JWC), відповідальний за моделювання та навчання військових операцій. Про цей інцидент 27 лютого повідомив норвезький державний мовник NRK. Суд прийняв рішення про утримання...