zhub.link is one of the many independent Mastodon servers you can use to participate in the fediverse.

Administered by:

Server stats:

28
active users

Habr

Непреодолимая пропасть между DeepSeek 671B и иллюзорной мощью Qwen QwQ 32B

Вступление. В мире ИИ разгораются споры: может ли сравнительно небольшая модель превзойти или хотя бы заменить гиганта на порядок большего размера? Недавний пример — противостояние между Qwen QwQ 32B (32-миллиардная модель от Alibaba) и DeepSeek 671B (671-миллиардная модель). QwQ 32B привлекла к себе внимание тем, что при гораздо меньшем размере показывает результаты, сопоставимые с DeepSeek, в ряде стандартных тестов ( QwQ-32B: Embracing the Power of Reinforcement Learning ). Более того, её запуск и использование обходятся куда дешевле: если для DeepSeek-R1 требуются сверхмощные серверы (сотни гигабайт памяти на видеокарте), то QwQ 32B можно запустить даже на одном высокопроизводительном настольном ПК. На первый взгляд кажется, что выбор очевиден — зачем платить больше, если новая компактная модель справляется «почти так же хорошо»? Однако в профессиональных задачах, где цена ошибки слишком высока , подобное упрощение чревато последствиями. Рассмотрим, почему впечатляющие результаты тестов Qwen QwQ 32B не означают, что она способна полностью заменить DeepSeek 671B в сферах, требующих абсолютной точности.

habr.com/ru/articles/889742/

ХабрНепреодолимая пропасть между DeepSeek 671B и иллюзорной мощью Qwen QwQ 32BВступление.  В мире ИИ разгораются споры: может ли сравнительно небольшая модель превзойти или хотя бы заменить гиганта на порядок большего размера? Недавний пример — противостояние между ...