Meta потрапила у скандал через маніпуляції з результатами тестів нових моделей штучного інтелекту

Нові моделі штучного інтелекту Llama 4 від Meta, включаючи легку Scout та середньоформатну Maverick, які за заявами компанії перевершують GPT-4o та Gemini 2.0 Flash у популярних тестах, стали об’єктом скандалу через маніпуляції з результатами тестування. Як з’ясувалося, для реклами публічної версії моделі була використана статистика експериментальної версії, недоступної для широкої аудиторії, що викликало обурення серед користувачів та аналітиків.

У пресрелізі Meta було зазначено, що модель Maverick посіла друге місце за рейтингом ELO (1417 балів), перевершуючи GPT-4o від OpenAI і наближаючись до Gemini 2.5 Pro. Ці результати спочатку виглядали вражаючими та сприяли позитивному іміджу нових моделей. Однак користувачі платформи LMArena, де порівнюють різні моделі штучного інтелекту, швидко помітили, що в документації Meta була вказівка на те, що тестувалась не публічна версія моделі, а спеціально налаштована експериментальна версія, створена для оптимізації результатів у чатах.

Meta не відразу розкрила, що для тестування було використано кастомізовану версію Llama-4-Maverick-03-26-Experimental. Після того, як ця інформація стала відома, компанія підтвердила, що статистика, використана для реклами, не відображає реальних характеристик публічної версії моделей, доступної для користувачів. Це викликало критику з боку спільноти, яка вважає такі маніпуляції недопустимими.

Керівництво LMArena в свою чергу звинуватило Meta в тому, що компанія не дотрималась стандартів чесного тестування, що підірвало довіру до їхньої платформи як індикатора реальної продуктивності моделей ШІ. У відповідь на скандал, LMArena вже оголосила про намір змінити свої правила, щоб уникнути подібних ситуацій у майбутньому. Вони зазначили, що постачальники, які можуть надати спеціально оптимізовані версії своїх моделей для тестування, а потім випускати інші публічні версії, порушують прозорість і об’єктивність тестування.

Поділитися:

АКТУАЛЬНО

ЦІКАВЕ ЗА ТЕМОЮ
У ФОКУСІ

Чому Дональд Трамп не запровадив нові мита для Росії

Нещодавно президент США Дональд Трамп оголосив про введення нових мит на товари з різних країн, однак Росія залишилася поза списком держав, до яких будуть застосовані ці тарифи. Директор Національної економічної ради США Кевін Гассет пояснив, чому Росія не потрапила під ці нові обмеження. У своєму інтерв’ю для ABC News Гассет зазначив, що головною причиною цього […]

Трамп вимагає від Європи виплатити репарації за торгові порушення

Президент США Дональд Трамп виступив з різким закликом до європейських країн виплатити значні фінансові репарації, заявивши, що переговори з Європою не розпочнуться, поки континент не погодиться на щорічні виплати, як за теперішні, так і за минулі порушення. Зі слів Трампа, США вже ввели високі мита на європейські товари, і тепер європейські країни повинні “платити” за […]

Сенатори США відвідали Київ і закликали до жорстких санкцій проти Росії

Сенатори США Ліндсі Грем (республіканець) і Річард Блюменталь (демократ) 30 травня прибули з візитом до Києва, де зустрілися з президентом України Володимиром Зеленським. Під час поїздки американські законодавці оглянули зруйновану інфраструктуру внаслідок російських ракетних ударів і заявили про необхідність негайних дій з боку США та їхніх союзників. За словами Блюменталя, масштаби руйнувань в Україні свідчать […]

Франція готується конфіскувати активи РФ

Франція може стати першою країною Європейського Союзу, яка ухвалить закон про повну конфіскацію заморожених російських активів. Про це заявив голова Верховної Ради України Руслан Стефанчук, коментуючи підсумки своїх зустрічей у парламентах країн ЄС та на Парламентській асамблеї НАТО. За словами Стефанчука, французький парламент перебуває на фінальній стадії розгляду законодавства, яке дозволить не просто арештовувати, а […]

Україна та Швеція визначили пріоритети співпраці на 2025-2026 роки

Україна та Швеція обговорили ключові напрями співпраці в рамках нового пакета допомоги. Перемовини відбулися між заступником міністра оборони України з питань європейської інтеграції Сергієм Боєвим та шведською делегацією, очолюваною бригадним генералом Йоганом Аксельссоном. Сторони зосередили увагу на пріоритетах оборонної підтримки на 2025-2026 роки та форматах співпраці з українським оборонно-промисловим комплексом (ОПК). Раніше уряд Швеції оголосив […]

Європа на роздоріжжі: Як страх може призвести до краху Євросоюзу

Європейський Союз стоїть перед викликами, які ставлять під загрозу його майбутнє. Побоювання поразки України, дій у відповідь Росії, мігрантів, конфлікту в Газі та можливого повернення Дональда Трампа на посаду президента США змушують лідерів Старого Світу приймати рішення, які можуть мати далекосяжні негативні наслідки. У своїй статті для The Guardian експерти попереджають: безрозсудне боягузтво може стати […]

Сонячний зонд “Паркер” побив рекорди і пережив історичне зближення з Сонцем

Сонячний зонд “Паркер” NASA увійшов в історію космонавтики, ставши першим апаратом, який наблизився до Сонця на рекордно близьку відстань і встановив новий рекорд швидкості польоту в космосі. “Паркер” здійснив історичне зближення з нашою зіркою, наблизившись до Сонця на відстань всього 6 мільйонів 100 тисяч кілометрів — це менше 1/10 відстані між Сонцем і Меркурієм. У […]

Опозиційні депутати в Албанії спровокували пожежу під час сесії в парламенті

Опозиційні депутати в Албанії зірвали  засідання парламенту як прояв протесту проти, на їхню думку, все більш авторитарного правління соціалістів. Депутати-демократи влаштували вражаючий протест, розставивши стільці один на одного і підпалюючи фаєри, коли прем’єр-міністр Еді Рама почав голосування за бюджет на наступний рік. Охоронці не дозволили опозиційним депутатам наблизитися до урядових місць. Ліві соціалісти, які мають […]