Grok Илона Маска оказался лучше ChatGPT и Gemini
Чат-бот Илона Маска показал самый низкий уровень ложных срабатываний — всего 8% — среди 10 основных протестированных моделей, передает агентство Kazinform.
Об этом сообщает Teslarati со ссылкой на отчет аналитического агрегатора Relum, посвященный оценке надежности ИИ-сервисов.
Согласно исследованию, Grok определен как один из самых надежных чат-ботов с искусственным интеллектом для использования на рабочем месте. Уровень ложных срабатываний модели искусственного интеллекта всего 8%.
Для сравнения, ChatGPT продемонстрировал один из самых высоких показателей — 35%, уступив лишь Gemini от Google, у которого этот индекс составил 38%.
В ходе исследования оценивались чат-боты по таким параметрам, как частота возникновения ложных срабатываний, рейтинги клиентов, стабильность ответов и частота простоев. Затем чат-ботам присваивался балл риска надежности от 0 до 99, причем более высокие баллы указывали на более серьезные проблемы.
Итоговый балл Grok по всем этим параметрам — 6, что является одним из лучших результатов в исследовании. DeepSeek занял второе место с нулевым временем простоя, получив превосходный показатель риска 4. Высокие показатели галлюцинаций и времени простоя ChatGPT обеспечили ему наивысший показатель риска 99, за ним следуют Claude и Meta AI, получившие показатели надежности 75 и 70 соответственно.
Ранее OpenAI представила GPT-5.1: более умный и коммуникативный ChatGPT.