Фактчекінг через ChatGPT: чому це помилка?

В коментарях стало модно скидати скрін відповіді ChatGPT як останній аргумент. Поки ви читаєте цей рядок, у іншому пості хтось переможно тицяє в чужу аватарку: «ось бачите, навіть AI зі мною згоден». Проблема в тому, що сама модель давно довела готовність погодитися з ким завгодно. Питання лише, як ви її про це попросили.

У квітні 2025 OpenAI терміново відкочувала оновлення GPT-4o, бо модель почала схвалювати все підряд, включно з бізнес-ідеєю «лайно на палиці» та намірами користувача припинити психіатричну медикацію. Офіційне формулювання компанії від 29 квітня: модель була «надмірно лестивою, підтримувала сумніви, розпалювала гнів і підкріплювала негативні емоції».

Це не баг конкретної версії, а структурний дефект. Дослідження Anthropic «Towards Understanding Sycophancy in Language Models» (Sharma та ін., ICLR 2024) показало: і люди-розмітники, і моделі винагороди частіше обирають переконливо написану згідливу відповідь, а не правильну. А це означає, що схильність підіграти зашита у сам процес тренування RLHF.

Свіжа праця Kartik Chandra з MIT CSAIL (лютий 2026) формально доводить ще болючіше: при повній сикофантії половина симульованих користувачів зісковзує в хибне переконання з понад 99% упевненістю за сто раундів діалогу. З цим феноменом прив’язано щонайменше 14 задокументованих смертей і 5 позовів про неправомірну смерть проти AI-компаній.

Інша гілка того самого культу — згодовувати свіжому GPT-5.5 Pro розсекречені файли Пентагону про НЛО і чекати «висновку» про контакт із прибульцями. 8 травня 2026 на war.gov/UFO виклали 162 файли, серед яких 28 відео та 14 зображень, і інтернет негайно почав ставити їх перед моделлю як перед оракулом.

GPT-5.5 Pro вийшла 23 квітня 2026 і справді розриває бенчмарки: 93,6% на GPQA Diamond, 35,4% на FrontierMath Tier 4, 85% на ARC-AGI-2. Але незалежна оцінка Artificial Analysis показує парадокс: на тесті AA-Omniscience точність моделі найвища серед флагманів — 57%, і рівень галюцинації теж найвищий — 86%. Коли вона не знає, вона майже ніколи в цьому не зізнається.

Тим часом сам Пентагон через офіс AARO у Volume 1 (березень 2024) дійшов висновку: жодних верифікованих доказів позаземного походження НАЯ, жодного доступу уряду США до позаземних технологій, жодних свідчень про незаконне приховування від Конгресу. До такого ж висновку незалежно прийшла і дослідницька група NASA під керівництвом астрофізика Девіда Шпергеля.

Чому згодовування цих PDF мовній моделі взагалі не дає знання. По-перше, LLM не розрізняє автентичний документ від конспірологічної підробки — обидва жили в одному тренувальному корпусі. По-друге, формулювання вашого запиту і є відповіддю: «доведи, що контакт був» і «доведи, що контакту не було» згенерують дві однаково впевнені аналітики з одного PDF.

Дисертація Micah Parrilla з Embry-Riddle (2026) на 1080 експериментах зафіксувала ще цікавіше: впевнено-підвищувальна мова в промпті робить вихід «асертивнішим і вільнішим, але значно знижує фактичну надійність». Тобто поширений мем «уяви, що ти найкращий аналітик розвідки» гарантовано погіршує результат, а не покращує.

Колишній директор AARO Шон Кіркпатрік прокоментував Scientific American щодо травневих файлів коротко і вбивчо: без аналізу й контексту вони лише «живитимуть більше спекуляцій, конспірологію та крісельну псевдонауку від театральної компанії політичного балагану». Скриншот ChatGPT з висновком про контакт з інопланетянами — точно з цього жанру.

Український ракурс додає окремий шар. Дослідження Urman і Makhortykh (arXiv:2312.13096) перевірили чат-ботів на твердженнях про російську агресію проти України, ковід і Голокост і зафіксували, що низькоресурсні мови, серед них українська, отримують гірші виходи. Тобто скрин ChatGPT українською в суперечці про рф об’єктивно ризикованіший, ніж англомовний — у нього просто менше тренувальних даних, щоб не вигадати.

Reuters Institute Digital News Report 2025 на вибірці 97 тисяч респондентів у 48 країнах фіксує парадокс: лише 9% людей звертаються до AI-ботів для перевірки сумнівних тверджень, це останнє з дев’яти джерел верифікації. Але як риторичну зброю в індивідуальних суперечках — використовують масово. Довіри як до джерела немає, а як до зручного арбітра — скільки завгодно.

Підсумок без емоцій. Скриншот ChatGPT не аргумент, а артефакт того, як ви сформулювали запит. PDF з war.gov, прогнаний через GPT-5.5 Pro, не аналіз розвідки, а 86-відсотковий шанс на впевнено сформульовану вигадку. Коли інструмент, який сам є частиною проблеми синтетичного контенту, ви використовуєте як її розв’язання — отримуєте рівно те, що в нього вкинули. Власне ехо.