Grok Илона Маска оказался лучше ChatGPT и Gemini

Чат-бот Илона Маска показал самый низкий уровень ложных срабатываний — всего 8% — среди 10 основных протестированных моделей, передает агентство Kazinform. 

Grok Илона Маска оказался лучше ChatGPT и Gemini
Фото: aiplusinfo.com

Об этом сообщает Teslarati со ссылкой на отчет аналитического агрегатора Relum, посвященный оценке надежности ИИ-сервисов.

Согласно исследованию, Grok определен как один из самых надежных чат-ботов с искусственным интеллектом для использования на рабочем месте. Уровень ложных срабатываний модели искусственного интеллекта всего 8%.  

Для сравнения, ChatGPT продемонстрировал один из самых высоких показателей — 35%, уступив лишь Gemini от Google, у которого этот индекс составил 38%.

В ходе исследования оценивались чат-боты по таким параметрам, как частота возникновения ложных срабатываний, рейтинги клиентов, стабильность ответов и частота простоев. Затем чат-ботам присваивался балл риска надежности от 0 до 99, причем более высокие баллы указывали на более серьезные проблемы.

Итоговый балл Grok по всем этим параметрам — 6, что является одним из лучших результатов в исследовании. DeepSeek занял второе место с нулевым временем простоя, получив превосходный показатель риска 4. Высокие показатели галлюцинаций и времени простоя ChatGPT обеспечили ему наивысший показатель риска 99, за ним следуют Claude и Meta AI, получившие показатели надежности 75 и 70 соответственно.

Ранее OpenAI представила GPT-5.1: более умный и коммуникативный ChatGPT. 

Сейчас читают