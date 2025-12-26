Об этом сообщает Teslarati со ссылкой на отчет аналитического агрегатора Relum, посвященный оценке надежности ИИ-сервисов.

Согласно исследованию, Grok определен как один из самых надежных чат-ботов с искусственным интеллектом для использования на рабочем месте. Уровень ложных срабатываний модели искусственного интеллекта всего 8%.

Для сравнения, ChatGPT продемонстрировал один из самых высоких показателей — 35%, уступив лишь Gemini от Google, у которого этот индекс составил 38%.

В ходе исследования оценивались чат-боты по таким параметрам, как частота возникновения ложных срабатываний, рейтинги клиентов, стабильность ответов и частота простоев. Затем чат-ботам присваивался балл риска надежности от 0 до 99, причем более высокие баллы указывали на более серьезные проблемы.

Итоговый балл Grok по всем этим параметрам — 6, что является одним из лучших результатов в исследовании. DeepSeek занял второе место с нулевым временем простоя, получив превосходный показатель риска 4. Высокие показатели галлюцинаций и времени простоя ChatGPT обеспечили ему наивысший показатель риска 99, за ним следуют Claude и Meta AI, получившие показатели надежности 75 и 70 соответственно.

