zhub.link is one of the many independent Mastodon servers you can use to participate in the fediverse.

Administered by:

Server stats:

27
active users

#o1

0 posts0 participants0 posts today

Думающие модели o1-3: краткий обзор и чего программистам ждать дальше

Когда LLM впервые появились, они были немного похожи на детей - говорили первое, что приходило им в голову, и не особо заботились о логике. Им нужно было напоминать: «Подумай, прежде чем отвечать». Многие утверждали, что из-за этого у моделей нет настоящего интеллекта и что их необходимо дополнять либо человеческой помощью, либо каким-то внешним каркасом поверх самой LLM, например Chain of Thought.

habr.com/ru/companies/raft/art

ХабрДумающие модели o1-3: краткий обзор и чего программистам ждать дальшеКогда LLM впервые появились, они были немного похожи на детей - говорили первое, что приходило им в голову, и не особо заботились о логике. Им нужно было напоминать: «Подумай, прежде чем отвечать»....

Стоит ли ChatGPT о1 Pro своих денег? Небольшой тест-драйв модели

Доброго времени суток, Хабр. Хотя с релиза новой модели прошло порядка двух недель, мне все равно захотелось протестировать модель, хотя уже и есть различные обзорные материалы. Все-таки, все познается на практике. Поэтому предлагаю меньше слов и больше дела, приглашаю вместе со мной протестировать модель о1 в режиме pro, а также сравнить ее с ChatGPT o1 и ChatGPT 4o, чтобы понять, стоит ли она своих денег. Приятного прочтения (:

habr.com/ru/companies/bothub/a

ХабрСтоит ли ChatGPT о1 Pro своих денег? Небольшой тест-драйв моделиДоброго времени суток, Хабр. Хотя с релиза новой модели прошло порядка двух недель, мне все равно захотелось протестировать модель, хотя уже и есть различные обзорные материалы. Все-таки, все...

Проигрыватель видео с поддержкой транскрипта

Как и многих пользователей Хабра меня интересует вопрос, как можно повысить эффективность изучения иностранных языков. Один из наиболее часто рекомендуемых методов — смотреть фильмы на изучаемом языке. И, естественно, я им пользуюсь. Периодически меня посещают мысли о необходимости оптимизации этого подхода. Сначала я нашел себе проигрыватели, которые поддерживают одновременное отображение субтитров на двух языках: субтитры на изучаемом языке отображаются как обычно внизу экрана, а вверху отображаются субтитры на русском. Но этого мне показалось мало. Я пошел искать проигрыватель, который мог бы отображать не только текущие субтитры, но и "транскрипт" — последовательность, включающую как текущий фрагмент субтитров, так и соседние, что бы из них можно было сложить связанный более крупный фрагмент текста. Это может быть удобно если: - при просмотре было что-то непонятно, нужно прочитать субтитр, а он уже скрыт и при этом не хочется перематывать назад и ловить пропущенный кусок - субтитры разбиты на фрагменты таким образом что каждый из них не является законченной фразой и для того что бы понять смысл нужно иметь перед глазами две-три строки субтитров Такая функциональность есть, например, на YouTube и на Корсэре. Однако после некоторых изысканий я к своему удивлению обнаружил что этой фичи нет ни в одном Windows-проигрывателе. У меня как раз чесались руки попробовать что из себя представляет связка Cursor + o1 . Так спонтанно родилось решение использовать такой проигрыватель в качестве объекта для экспериментов с этими инструментами. Сразу скажу, что навыков разработки у меня практически нет (если не считать минимальных фрагментарных представлений о разработке для веба).

habr.com/ru/articles/845400/

ХабрПроигрыватель видео с поддержкой транскриптаКак и многих пользователей Хабра меня интересует вопрос, как можно повысить эффективность изучения иностранных языков. Один из наиболее часто рекомендуемых методов — смотреть фильмы на изучаемом...

Насколько нейросеть — хороший калькулятор?

Насколько опасно умножать числа с помощью ChatGPT и OpenAI o1-preview, насколько можно доверять вычисленным ей константам? Стоит ли тратить деньги на o1-preview, если есть mini (в контексте умножения чисел)? Мини-исследование под катом.

habr.com/ru/companies/bar/arti

ХабрНасколько нейросеть — хороший калькулятор?Исследованием поделился Yuntian Deng в Твиттере. Он протестировал умножение чисел с разным количеством знаков, вплоть до 20. На примере сравнения o1, o1-mini и gpt-4o. Оказалось, что GPT4o еле вывозит...
#openai#chatgpt#gpt

о1: почему новая GPT от OpenAI — это не хайп, а переход к новой парадигме в ИИ

Последние пару лет развитие языковых нейросетей как будто бы шло по принципу «больше, длиннее, жирнее»: разработчики пытались раздуть свои модели на как можно большее число параметров и прогнать через них максимальный объем тренировочных данных. 12 сентября OpenAI выпустили новую LLM, которая добавляет в это уравнение еще одно измерение для прокачки: теперь можно масштабировать объем «мыслей», который модель будет тратить в процессе своей работы. В этой статье мы разберемся, чему научилась новая GPT o1, и как это повлияет на дальнейшую эволюцию ИИ. Давайте выясним →

habr.com/ru/companies/ods/arti

Хабро1: почему новая GPT от OpenAI — это не хайп, а переход к новой парадигме в ИИПоследние пару лет развитие языковых нейросетей как будто бы шло по принципу «больше, длиннее, жирнее»: разработчики пытались раздуть свои модели на как можно большее число параметров и прогнать через...

[Перевод] Результаты OpenAI o1, тестирование и заметки о новой модели

o1-preview За последние 24 часа мы получили доступ к недавно выпущенным моделям OpenAI, o1-mini специально обученным для эмуляции рассуждений. Этим моделям дается дополнительное время для генерации и уточнения токенов рассуждений перед тем, как дать окончательный ответ. Сотни людей спрашивали, как o1 выглядит на ARC Prize. Поэтому мы протестировали его, используя ту же базовую тестовую систему, которую мы использовали для оценки Claude 3.5 Sonnet, GPT-4o и Gemini 1.5. Вот результаты:

habr.com/ru/articles/843262/

ХабрРезультаты OpenAI o1, тестирование и заметки о новой моделиo1-preview За последние 24 часа мы получили доступ к недавно выпущенным моделям OpenAI,  o1-mini специально обученным для эмуляции рассуждений. Этим моделям дается дополнительное время для...