Популярні чат-боти зі штучним інтелектом після тривалого спілкування з користувачами починають демонструвати більше помилок і неточностей. Таких висновків дійшли дослідники Microsoft Research спільно з Salesforce, повідомляє Windows Central.
Під час дослідження було проаналізовано понад 200 тисяч розмов із чат-ботами на основі великих мовних моделей. Результати показали, що сумарний рівень помилок у довгих діалогах може зростати більш ніж на 100%. Користувачі найчастіше скаржаться на так звані «галюцинації» — вигадані або неточні факти.
Експеримент охопив провідні моделі, зокрема GPT-4.1, Gemini 2.5 Pro, Claude 3.7 Sonnet та DeepSeek R1.
Якщо під час одноразових запитів такі системи демонструють приблизно 90% успішних відповідей, то у тривалих розмовах із додатковими уточненнями цей показник знижується до 65%. З ускладненням контексту ефективність моделей помітно падає.
Дослідники також зафіксували явище «роздування відповідей»: у багатоходових діалогах тексти ставали довшими на 20–300%. Водночас разом із обсягом зростала кількість припущень та помилкових тверджень, які закріплювалися в контексті та впливали на подальші відповіді.
Навіть моделі з розширеними можливостями міркування, такі як OpenAI o3 та DeepSeek R1, не змогли повністю уникнути цього ефекту.
Автори підкреслюють, що мова не йде про буквальне «тупішання» моделей. Йдеться радше про обмеження в утриманні великого обсягу інформації та коректній інтерпретації складного контексту під час тривалого діалогу.
Як зазначає Windows Central, ці особливості варто враховувати під час інтеграції чат-ботів у продукти, орієнтовані на довгу взаємодію з користувачами. Адже помилки та «галюцинації» можуть вводити людей в оману — особливо якщо ШІ використовується як джерело точної або критично важливої інформації.

Естонія розглядає можливість використання мін на своєму кордоні з Росією у разі війни, що стане частиною загальної оборонної стратегії країни. Про це заявив представник інженерних військ Сил оборони Естонії Айнар Афанасьєв. За його словами, у кризовий період планується застосування вибухових загороджень, мін та інших вибухових пристроїв, а також знищення стратегічно важливих об’єктів, таких як мости […]
Україна вже влітку отримає перші кошти від заморожених російських активів. Рішення Ради ЄС про розблокування використання надходжень від активів російського центробанку в ЄС схвалив віцеголова Європейської комісії Валдіс Домбровскіс. Рішення набуде чинності після публікації в Офіційному журналі ЄС. “ЄС обрав шлях, який є юридично обґрунтованим і гнучким, щоб підтримка могла бути адаптована до найнагальніших потреб […]
Президент Азербайджану Ільхам Алієв заявив про необхідність бути готовими до війни, наголосивши, що гарантією безпеки країни можуть бути лише власні сили. Заява пролунала після підписання мирної угоди з Вірменією та на тлі загострення риторики з боку російських пропагандистів, які погрожують розпочати так звану “спеціальну військову операцію” на Південному Кавказі. Алієв підкреслив, що ситуація у світі […]
Президент України Володимир Зеленський прокоментував аварію російських танкерів у Чорному морі, наголосивши на масштабній загрозі, яку вони становлять для екології та миру. Глава держави заявив, що російські танкери, які використовують застарілі судна, не тільки сприяють фінансуванню війни, але й завдають значної шкоди природі. “Росія використовує дуже старі посудини – по 50 років, – лише для […]
Нове дослідження, проведене вченими, надає свіжі докази того, що перші випадки зараження Covid-19 мали місце на ринку в Ухані, Китаї. Аналіз 800 зразків з ринку виявив ДНК диких тварин, а також сліди вірусу, що свідчить про можливу передачу інфекції від тварин до людей. Дослідження, опубліковане в журналі Cell, засноване на більш ніж 800 зразках, зібраних […]
До Києва прибули представники Великої Британії, Франції, Німеччини та Італії. Про це повідомив керівник Офісу президента Андрій Єрмак у п’ятницю, 12 вересня. Разом із міністром закордонних справ Андрієм Сибігою вони зустріли партнерів України у столиці. Єрмак наголосив, що присутність цих країн саме зараз є потужним сигналом солідарності. Велика Британія, Франція, Німеччина та Італія, за його […]
У 2025 році найбільше покупок українці здійснюють у супермаркетах і закладах харчування. Про це свідчать дані оновленого дашборду monobank, який проаналізував категорії витрат користувачів. Найпопулярнішою категорією для покупок стали продукти та супермаркети — 42,8% усіх транзакцій. На другому місці — кафе та ресторани з часткою 12,4%. Це свідчить про те, що попри економічну нестабільність, витрати […]
В адміністративному центрі іспанської автономної спільноти Валенсія на протест вийшли 130 тисяч людей. Причиною невдоволення стала, на їхню думку, неадекватна реакція місцевої влади на нещодавні повені, що призвели до загибелі понад 200 людей. Протест було організовано понад 60 різними організаціями та профспілками, які вимагали відставки регіонального прем’єр-міністра Карлеса Масона та його уряду. Марш тривав півтори […]