#deepseek_r1 - Mastodon on ZHub

Recent searches

Search options

Only available when logged in.

1 post1 participant0 posts today

ChatGPT-4.5: бенчмарки, генерация художественных текстов и сравнение с DeepSeek-r1

В конце февраля OpenAI официально представила ChatGPT-4.5 — самую крупную и продвинутую модель для диалогового взаимодействия на сегодняшний день. 4.5 обладает улучшенными навыками общения и письма, расширенным кругозором и, как заявляет компания, «более утончённой личностью» в сравнении с предыдущими версиями. Но что это вообще за модель? OpenAI не слишком хорошо объяснила, что она из себя представляет. Поэтому давайте разберёмся сами, как показывает себя эта новейшая и пока ещё не до конца понятная нейросеть компании в различных тестах и генерации контента.

https://habr.com/ru/companies/bothub/articles/889996/

ХабрChatGPT-4.5: бенчмарки, генерация художественных текстов и сравнение с DeepSeek-r1В конце февраля OpenAI официально представила ChatGPT-4.5 — самую крупную и продвинутую модель для диалогового взаимодействия на сегодняшний день. 4.5 обладает улучшенными...

#ии #ai #chatgpt_45

Битва титанов: DeepSeek VS ChatGPT

Привет, Хабр! Ну что ж, пожалуй, вы уже все знаете и о том, что такое DeepSeek, и о его бешеной популярности. Предлагаю разобраться, почему он вызвал такой большой интерес среди пользователей и разработчиков.

https://habr.com/ru/companies/reksoft/articles/883530/

ХабрБитва титанов: DeepSeek VS ChatGPTПривет, Хабр! Ну что ж, пожалуй, вы уже все знаете и о том, что такое DeepSeek, и о его бешеной популярности. Предлагаю разобраться, почему он вызвал такой большой интерес среди пользователей и...

#deepseek #deepseek_r1 #chatgpt

Так ли хороша DeepSeek-R1, как о ней говорят

Во всем AI-мире сейчас говорят о новой китайской языковой модели DeepSeek и, конечно, наша команда развития AI не могла пройти мимо этой темы. Мы сравнили ответы новой модели на реальные запросы к нашей технической поддержке с ответами других популярных моделей. Что из этого получилось и какие выводы мы сделали расскажу я — Максим Михайлов, продуктовый менеджер Узнать подробности

https://habr.com/ru/companies/cloud_ru/articles/882630/

ХабрТак ли хороша DeepSeek-R1, как о ней говорятВо всем AI-мире сейчас говорят о новой китайской языковой модели DeepSeek и, конечно, наша команда развития AI не могла пройти мимо этой темы. Мы сравнили ответы новой модели на реальные запросы к...

#llmмодели #deepseek #qwen25max

DeepSeek AI: что есть у Китая, чего нет у США

ИИ-гонка США и Китая носит нелинейный характер: анализируя особенности китайского подхода, которые внесли вклад в возможность DeepSeek нагнать OpenAI GPT, обнаруживаешь, что развилка в подходах возникает не на уровне самих проектов, и даже не на уровне индустрии, а на уровне государственной политики. Т.е. это не просто гонка команд, как на хакатоне, где разрыв сводится к человеческо-менеджерскому фактору (квалификации разработчиков и менеджеров), а буквально соревнование систем: Китай в этой гонке выставил не просто свою команду на своей машине, а прокладывает свой собственный маршрут в том же направлении. А гордые и независимые корпорации из Кремниевой Долины, десятилетиями пиарившие себя как эпицентр инноваций на планете Земля, вдруг в одночасье показались неповоротливыми мамонтами, жравшими непомерно много денег относительно их реальных достижений, пока неизвестный раньше ИИ-разработчик DeepSeek, как юркий «Тысячелетний сокол» проскочив под носом неповоротливого имперского Звёздного разрушителя, одним махом срезал им самооценку, буквально, на триллион. Вопрос: откуда у Китая взялась такая прыть?

https://habr.com/ru/articles/882882/

ХабрDeepSeek AI: что есть у Китая, чего нет у СШАИИ ещё не меняет мир, но уже меняет наши представления о мире: гордые и независимые корпорации из Кремниевой Долины, десятилетиями пиарившие себя как эпицентр инноваций на планете Земля, вдруг в...

#DeepSeek #DeepSeek_R1 #Китай

Дипсик не работает: Обходим ошибку Deepseek service is busy хитрым способом

DeepSeek всё чаще оказывается недоступен из-за перегруженности серверов. В этой статье решим проблему оригинальным способом – установим Дипсик локально, чтобы он работал вообще без подключения к Интернету.

https://habr.com/ru/articles/878498/

ХабрДипсик не работает: Обходим ошибку Deepseek service is busy хитрым способомDeepSeek взорвал рынок ИИ, и китайскую нейросеть уже наверное попробовал каждый. Однако из-за перегрузки чаще всего Дипсик не работает. Нейросеть не отвечает, отправляя ошибки типа: The server is...

#deepseek_r1 #deepseek_v3 #deepseek_ai

Так ли страшен DeepSeek, как его малюет Cerebras?

В последнее время две темы в новостях о новейших достижениях в области ИИ привлекали наибольшее внимание специалистов и досужей публики, которая желает все знать — китайский проект DeepSeek и производитель оборудования для ИИ американская компания Cerebras. Здесь, на Хабре своевременно появлялись публикации по обеим темам. Я сходил по некоторым ссылкам к первоисточникам, приведенным в этих публикациях для проверки фактов. Вы тоже можете это сделать, если захотите. Для тех, кто не следил, напоминаю, что с успехами DeepSeek связывают недавнее обрушение фондового рынка Америки на триллион долларов, из которых шестьсот миллиардов пришлось на флагман в производстве оборудования для ИИ — компанию NVIDIA, поскольку сервис DeepSeek китайского базирования работает на платформе, не использующей NVIDIA. Мы еще не успели пережить крах Intel, а тут такое. Cerebras Systems тоже приходит к владельцам и управляющим NVIDIA в страшных снах, поскольку предлагают альтернативное GPU архитектурам решение для ИИ платформ, особенно облачных — компьютеры на кристалле по технологии wafer scale integration. Некоторые горячие головы называют Cerebras убийцей NVIDIA. Убийца или нет, но черный лебедь точно. А два черных лебедя — это тяжело даже для компании с капитализацией 2.89 триллиона долларов даже после последнего падения на 17.8% (с тех пор отпрыгнули опять за три триллиона). И вот, последняя новость, два черных лебедя слились в объятьях — 30 января компания Cerebras объявила о том, что разместит на серверах, расположенных в США, китайскую модель ИИ DeepSeek R1 (оригинал публикации на сайте технологических новостей Venture Beat здесь , ее пересказ в блоге компании BotHub на Хабре — здесь ). Я выделил жирным шрифтом те слова, которые, как мне кажется, отражают главный смысл этой новости. Чуть позже в той же публикации цитируются слова директора по маркетингу продуктов Cerebras Джеймса Ванга (James Wang), который в пересказе BotHub ошибочно называется старшим исполнительным директором. Так вот, этот Джеймс Ванг сказал в эксклюзивном интервью сайту Venture Beat буквально следующее: “Если вы используете API DeepSeek, который сейчас очень популярен, эти данные отправляются прямо в Китай” и это заявление меня слегка удивило своей неполиткорректностью и отсутствием доказательств. Впрочем, на мой взгляд, оно вполне в стиле внешней политики новой администрации США, которая того и гляди начнет торговую войну с Китаем.

https://habr.com/ru/companies/idx/articles/881314/

ХабрТак ли страшен DeepSeek, как его малюет Cerebras?В последнее время две темы в новостях о новейших достижениях в области ИИ привлекали наибольшее внимание специалистов и досужей публики, которая желает все знать — китайский проект DeepSeek и...

#ИИ #llm #deepseek_r1

Запускаем DeepSeek-R1 на обычном сервере с 768Гб ОЗУ в LM-Studio

Если у вас нет парка видеокарт, но есть сервер с ОЗУ то не отчаивайтесь, вы тоже можете запустить DeepSeek R1 :-) Покажу на практике как легко и просто без использования командной строки запустить полноразмерную модель DeepSeek R1 на сервере с 768 гигами ОЗУ и что из этого получилось. Статья подойдет и для тех кто хочет и на домашнем компе запустить нейросети, но не знает с чего начать.

https://habr.com/ru/articles/880328/

ХабрЗапускаем DeepSeek-R1 на обычном сервере с 768Гб ОЗУ в LM-StudioЧто побудило написать статью? Была тут недавно статья с картинками железа, ценами на железо, но без описания настроек, но зато с ссылками на GitHub и цитирую «...

#deepseek_r1 #нейросеть_локально #LM_Studio

DeepSeek и Qwen 2.5 против ChatGPT: как китайские компании запустили новый скачок в мире ИИ

В последние недели мир искусственного интеллекта (ИИ) был потрясен значительными достижениями китайских компаний, особенно DeepSeek и Alibaba, которые представили свои передовые модели — DeepSeek-R1 и Qwen 2.5-Max соответственно. Конечно же, эти события вызвали широкий резонанс в технологическом сообществе и привели к обсуждению будущего ИИ. Меня зовут Роман Ленц, я начальник отдела анализа данных и машинного обучения ПГК Диджитал — цифровой дочки Первой грузовой компании – крупнейшего частного оператора грузовых железнодорожных перевозок в России. В этой статье мы разберемся, что за «зверь» этот DeepSeek и Qwen и что их появление значит для мира ИИ?

https://habr.com/ru/companies/pgk/articles/880156/

ХабрDeepSeek и Qwen 2.5 против ChatGPT: как китайские компании запустили новый скачок в мире ИИВ последние недели мир искусственного интеллекта (ИИ) был потрясен значительными достижениями китайских компаний, особенно DeepSeek и Alibaba, которые представили свои передовые модели — DeepSeek-R1 и...

#ии #deepseek #deepseek_r1

Habr 25+ @habr25

Опять DeepSeek? Побудем в роли детектива

Когда про DeepSeek-r1 начали говорить уже из каждого утюга, я долго думал, а стоит ли еще и свои 5 копеек вставлять в эту историю, и подумал, конечно же да! Ведь могу. Если коротко, просыпаюсь в понедельник и вижу сотни постов в час на тему «революции в ИИ», «гигантский скачок в развитии LLM», «Акции big tech компаний падают», «NVIDIA потеряла сотни миллиардов долларов» — все эти статьи и посты имели кое-что общее — упоминание DeepSeek. Первое, что я почувствовал, это, конечно, небольшое недоумение — так он уже несколько дней точно лежит в библиотеке ollama, а до этого еще лежал на hugging face, да еще и я уже и развернул его на домашнем сервере и тестирую, так почему он внезапно то хайповать стал?! Подумал, подумал, и пошел работать, лишь к вечеру вернувшись к этому вопросу. Решил разобраться, откры Хабр и понял, что уже куча опубликованных статей в стиле «️», так что решил подождать чуть более логичных рассуждений обо всей этой истории. В итоге, время шло-шло-шло, я уже состарился на целую неделю, параллельно изучая причины происходящего, но, так и не дождался полноценного разбора произошедшего, так что я решил написать статью в стиле «».

https://habr.com/ru/articles/879358/?utm_source=habrahabr&utm_medium=rss&utm_campaign=879358

ХабрОпять DeepSeek? Побудем в роли детектива这篇帖子是用一碗米饭支付的，猫老婆 Хайп, хайп и еще раз хайп Когда про DeepSeek-r1 начали говорить уже из каждого утюга, я долго думал, а стоит ли еще и свои 5 копеек вставлять в эту историю, и подумал, конечно же да!...

#DeepSeek #ai #deepseek_r1

[Перевод] DeepSeek R1: раскройте возможности моделей DeepSeek R1. Полное руководство для новичков и экспертов

Если вы новичок, желающий погрузиться в мир ИИ, или эксперт, стремящийся оптимизировать свои рабочие процессы, в этом руководстве вы узнаете обо всем, что нужно знать о моделях DeepSeek R1. Я расскажу вам про установку модели как локально, так и в Azure с помощью каталога моделей и о подключении с помощью API-ключей.

https://habr.com/ru/articles/879452/

ХабрDeepSeek R1: раскройте возможности моделей DeepSeek R1. Полное руководство для новичков и экспертовИскусственный интеллект (ИИ) совершает революцию в сфере высоких технологий, и модели DeepSeek R1 находятся в авангарде этой трансформации. Если вы новичок, желающий погрузиться в мир ИИ, или эксперт,...

#deepseek #deepseek_r1 #deepseek_ai

[Перевод] Взаимодействие с документами с помощью DeepSeek и Ollama: локальный чатбот RAG для диалогов с учетом контекста

С ростом популярности модели deepseek-r1:1.5b опасения по поводу конфиденциальности облачных решений становятся как никогда актуальными. Этот проект делает еще один шаг вперед, демонстрируя, как построить продвинутую систему RAG локально, используя DeepSeek, LangChain и Streamlit. Используя мощные возможности DeepSeek, эта система гарантирует, что ваши личные данные останутся на вашем компьютере, обеспечивая повышенную конфиденциальность и контроль. Чатбот предоставляет ответы с учетом контекста, включая содержимое документов и историю разговора, а возможность показать или скрыть обоснование ответов моделей DeepSeek добавляет уровень прозрачности, делая работу в целом более безопасной и надежной. Локальный запуск DeepSeek с помощью Ollama не только позволяет обойти проблемы облачного хранения данных, но и позволяет обеспечить более безопасное и конфиденциальное взаимодействие с пользователем. Давайте рассмотрим, как создать этот безопасный, контекстно-ориентированный и ориентированный на конфиденциальность RAG-чатбот на вашем компьютере.

https://habr.com/ru/articles/879438/

ХабрВзаимодействие с документами с помощью DeepSeek и Ollama: локальный чатбот RAG для диалогов с учетом контекстаРеволюционное взаимодействие с документами с помощью DeepSeek и Ollama: локальный чатбот RAG для диалогов с учетом контекста С ростом популярности модели deepseek-r1:1.5b опасения по поводу...

#deepseek #deepseek_r1 #deepseek_ai

Опять DeepSeek? Побудем в роли детектива

Когда про DeepSeek-r1 начали говорить уже из каждого утюга, я долго думал, а стоит ли еще и свои 5 копеек вставлять в эту историю, и подумал, конечно же да! Ведь могу. Если коротко, просыпаюсь в понедельник и вижу сотни постов в час на тему «революции в ИИ», «гигантский скачок в развитии LLM», «Акции big tech компаний падают», «NVIDIA потеряла сотни миллиардов долларов» — все эти статьи и посты имели кое-что общее — упоминание DeepSeek. Первое, что я почувствовал, это, конечно, небольшое недоумение — так он уже несколько дней точно лежит в библиотеке ollama, а до этого еще лежал на hugging face, да еще и я уже и развернул его на домашнем сервере и тестирую, так почему он внезапно то хайповать стал?! Подумал, подумал, и пошел работать, лишь к вечеру вернувшись к этому вопросу. Решил разобраться, откры Хабр и понял, что уже куча опубликованных статей в стиле «️», так что решил подождать чуть более логичных рассуждений обо всей этой истории. В итоге, время шло-шло-шло, я уже состарился на целую неделю, параллельно изучая причины происходящего, но, так и не дождался полноценного разбора произошедшего, так что я решил написать статью в стиле «».

https://habr.com/ru/articles/879358/

ХабрОпять DeepSeek? Побудем в роли детектива这篇帖子是用一碗米饭支付的，猫老婆 Хайп, хайп и еще раз хайп Когда про DeepSeek-r1 начали говорить уже из каждого утюга, я долго думал, а стоит ли еще и свои 5 копеек вставлять в эту историю, и подумал, конечно же да!...

#DeepSeek #ai #deepseek_r1

[Перевод] Сможет ли DeepSeek R-1 ответить на эти 5 сложных для ИИ вопросов?

Каждый раз, когда появляется новая языковая модель, у меня всегда возникает желание проверить ее с помощью нескольких обманчиво простых, но каверзных вопросов. Это моя личная привычка - своего рода стресс-тест, чтобы проверить, насколько хорошо эти модели справляются с логикой и рассуждениями. Несколько дней назад вышел DeepSeek R-1, и он сразу же стал мировой сенсацией благодаря тому, что это умная ИИ-модель с открытым исходным кодом, и тому, как хорошо она работает с логикой. Бенчмарки показывают, что она сопоставима, а иногда даже лучше, чем модели с закрытым исходным кодом, такие как o1 от OpenAI и Claude 3.5 Sonnet от Anthropic. Учитывая всю шумиху вокруг возможностей DeepSeek R-1 в области рассуждений, давайте посмотрим, насколько хорошо она ответит на эти пять каверзных вопросов:

https://habr.com/ru/articles/879334/

ХабрСможет ли DeepSeek R-1 ответить на эти 5 сложных для ИИ вопросов?Сможет ли DeepSeek R-1 ответить на эти 5 сложных вопросов для ИИ? Каждый раз, когда появляется новая языковая модель, у меня всегда возникает желание проверить ее с помощью нескольких обманчиво...

#deepseek #deepseek_r1 #дипсик

[Перевод] Быстрое локальное развертывание DeepSeek

В этой статье я поделюсь опытом быстрого локального развертывания модели DeepSeek — решения, которое позволяет не зависеть от облачных сервисов, сохранять конфиденциальность данных и тонко настраивать модель под собственные задачи.

https://habr.com/ru/articles/879076/

ХабрБыстрое локальное развертывание DeepSeekMidjourney В этой статье я поделюсь опытом быстрого локального развертывания модели DeepSeek — решения, которое позволяет не зависеть от облачных сервисов, сохранять конфиденциальность данных и тонко...

#ai #deepseek_r1 #deepseek

[Перевод] Модель DeepSeek R-1 добавили в инструмент для программистов Cursor AI

Как разработчик, использующий искусственный интеллект в своих личных проектах в течение последнего года, я не могу не радоваться тому, что модель DeepSeek R-1 теперь доступна в Cursor AI. О поддержке новой модели компания DeepSeek объявила в X . Модели Deepseek теперь доступны в Cursor! Размещены на американских серверах. Несмотря на то, что мы являемся большими поклонниками Deepseek, Sonnet все же лучше справляется с реальными задачами. Наслаждайтесь! Теперь главный вопрос: так ли он хорош, как Claude 3.5 Sonnet, или даже лучше? Давайте узнаем.

https://habr.com/ru/articles/878880/

ХабрМодель DeepSeek R-1 добавили в инструмент для программистов Cursor AIDeepSeek R-1 теперь поддерживается в Cursor AI Как разработчик, использующий искусственный интеллект в своих личных проектах в течение последнего года, я не могу не радоваться тому, что модель...

#deepseek #deepseek_r1 #cursor

Сравнение кода DeepSeek и ChatGPT(Golang)

Весь этот шум заставил меня заинтресоваться DeepSeek. Самое банально сравнить с ChatGPT. Ну и плюсом у меня сегодня выходной, можно и поиграть немного. Код конечно на Go. Модели GPT-o1 и Deepseek-R1.

https://habr.com/ru/articles/878766/

ХабрСравнение кода DeepSeek и ChatGPT(Golang)Весь этот шум заставил меня заинтресоваться DeepSeek. Самое банальное сравнить с ChatGPT. Ну и плюсом, у меня сегодня выходной, можно и поиграть немного. Код пусть будет на Go. Модели GPT-o1 и...

#go #deepseek_r1 #deepseek

[Перевод] DeepSeek подтвердила мои подозрения относительно OpenAI. Разработчик ChatGPT ведет проигрышную игру

Есть три типичные причины, по которым OpenAI попадает в новости: 1. Члены совета директоров терпят фиаско. 2. Они запускают новый продукт 3. Или они ноют о том, что все еще не получают прибыль Недавно они попали в новости по причине номер 3. В начале января Сэм Альтман опубликовал этот раздражающий твит.

https://habr.com/ru/articles/878588/

ХабрDeepSeek подтвердила мои подозрения относительно OpenAI. Разработчик ChatGPT ведет проигрышную игруDeepSeek только что подтвердил мои подозрения относительно OpenAI. Разработчик ChatGPT ведет проигрышную игру Есть три типичные причины, по которым OpenAI попадает в новости: Члены совета директоров...

#chatgpt #openai #deepseek

[Перевод] Неужели DeepSeek скопировала OpenAI?

В последние несколько дней вокруг китайского ИИ-стартапа DeepSeek разгорелись споры о том, что он якобы использует проприетарные модели OpenAI. Вопрос возник после того, как DeepSeek выпустила две модели, DeepSeek-V3 и DeepSeek-R1, производительность которых сопоставима с аналогами OpenAI при значительно меньших затратах. OpenAI обвинила DeepSeek в неправомерном использовании своих данных для обучения конкурирующей ИИ-модели. Это обвинение вызвало острую дискуссию о правах интеллектуальной собственности в области ИИ и этике дистилляции моделей. Дистилляция моделей , также известная как дистилляция знаний, - это техника машинного обучения, используемая для передачи знаний от большой, сложной модели («учителя») к меньшей, более эффективной модели («ученику»). По сути, дистиллированная модель - это меньшая модель, которая работает так же, как и большая, но требует меньше вычислительных ресурсов.

https://habr.com/ru/articles/878078/

ХабрНеужели DeepSeek скопировала OpenAI?Неужели DeepSeek скопировала OpenAI? В последние несколько дней вокруг китайского ИИ-стартапа DeepSeek разгорелись споры о том, что он якобы использует проприетарные модели OpenAI. Вопрос возник после...

#openai #deepseek #deepseek_r1

Мануал по запуску полной модели DeepSeek-R1 локально (бюджет ~6k$)

Давеча наткнулся в экс- Твиттере на интересный тред ( https://x.com/carrigmat/status/1884244369907278106?s=52 ) о том, как запустить самую мощную (на сегодня) ИИ reasoning модель DeepSeek-R1 прямо у себя под столом. DeepSeek-R1 — это одна из топовых моделей (из Китая), наделавших много шума (и не только), для задач логики, математики и программирования. Она настолько умная, что может (с некоторыми оговорками) "конкурировать" с решениями от OpenAI, но при этом её можно запустить локально , без интернета , без смс и полностью контролировать весь процесс. Почему это круто? * все данные остаются с вами, никакие сторонние сервисы не получат доступ к вашим запросам. * запуск на своём железе избавляет от затрат на облачные сервисы. * модель способна решать сложные задачи и выдавать результаты на уровне профессионалов. В статье я расскажу: * какое оборудование нужно для запуска DeepSeek-R1. * чем локальный запуск отличается от серверного. * какие возможности открывает эта модель и как она может быть полезна. * как сохранить безопасность и приватность при работе с ИИ. В этом мануале описано, как настроить локальный запуск модели DeepSeek-R1 Q8 , сохраняя максимальное качество и производительность без дистилляции или уменьшенной квантизации. Общая стоимость сборки составит около ~ $6,000 , и ниже приведены все необходимые ссылки на компоненты и инструкции.

https://habr.com/ru/articles/877832/

X (formerly Twitter)Matthew Carrigan (@carrigmat) on XComplete hardware + software setup for running Deepseek-R1 locally. The actual model, no distillations, and Q8 quantization for full quality. Total cost, $6,000. All download and part links below:

#deepseek_r1 #inference #llm

Deepseek v3: Как скачать китайскую нейросеть Дипсик AI, все способы

Рассказываю про способы, как можно установить китайскую модель локально и использовать без интернета. Причем так, чтобы работать не через консоль, а через удобный интерфейс чат-бота.

https://habr.com/ru/articles/877772/

ХабрDeepseek v3: Как скачать китайскую нейросеть Дипсик AI, все способыДипсик R1 - нашумевшая ИИ модель от китайской компании Deepseek AI. За основу взята модель Deepseek v3, возможности которой схожи с ChatGPT. Однако благодаря открытому исходному коду китайской...

#deepseek #deepseek_v3 #deepseek_r1

Drag & drop to upload