Модель OpenAI o3: Нижчі результати тестувань викликають питання щодо претензій та прозорості штучного інтелекту

OpenAI: Поглиблений погляд на можливості та реальність

OpenAI давно відома своїми амбітними проєктами у сфері штучного інтелекту. Найбільше обговорюється їх модель o-series, яка викликає зацікавленість завдяки обіцянкам вирішення складних завдань. Зокрема, модель o3, представлена торік, мала солідні претензії: вирішення складних математичних завдань з FrontierMath. Але чи завжди можливості відповідають заявам?

Перевірка на точність: Незалежне тестування від EpochAI

EpochAI провела незалежне тестування моделі o3, щоб перевірити ці амбітні заяви OpenAI. Виявилося, що модель насправді здатна вирішити лише 10% математичних задач, значно відстаючи від спочатку заявлених можливостей. Така різниця між очікуваннями та реальністю викликала хвилю критики як серед користувачів, так і серед експертів галузі.

Критика та прозорість: Що кажуть користувачі?

OpenAI стала об’єктом критики за відсутність прозорості в своїх заявах. Далі виникає питання: чи є такі обіцянки достовірними, чи стратегією з продажів? Згідно з інформацією, отриманою з ТехКранч, модель o3, яка використовується в публічних чатах, могла бути оптимізована для інших цілей порівняно з тією, що використовувалась у тестах. Отже, оригінальні заяви OpenAI не зовсім відповідають реальній продуктивності.

Розвиток та нові функції ChatGPT: Що далі?

Проблеми з моделлю o3 не затримали OpenAI від подальшого розвитку. Актуальною новинкою стала функція генерації зображень у ChatGPT без використання DALL-E. Крім того, були вдосконалені академічно орієнтовані функції, серед яких новий інструмент для проведення глибоких досліджень.

OpenAI продовжує залишатися на заголовках новин завдяки своїм новаторським рішенням. Але важливо завжди перевіряти їх заяви на відповідність дійсності, адже від цього залежить як репутація, так і довіра користувачів до технологічних гігантів.