[Перевод] Результаты OpenAI o1, тестирование и заметки о новой модели
o1-preview За последние 24 часа мы получили доступ к недавно выпущенным моделям OpenAI, o1-mini специально обученным для эмуляции рассуждений. Этим моделям дается дополнительное время для генерации и уточнения токенов рассуждений перед тем, как дать окончательный ответ. Сотни людей спрашивали, как o1 выглядит на ARC Prize. Поэтому мы протестировали его, используя ту же базовую тестовую систему, которую мы использовали для оценки Claude 3.5 Sonnet, GPT-4o и Gemini 1.5. Вот результаты: