zhub.link is one of the many independent Mastodon servers you can use to participate in the fediverse.

Administered by:

Server stats:

28
active users

#обучение_моделей

0 posts0 participants0 posts today

[Перевод] Человеческий мозг против ML-модели: сходства и различия между психикой и машинным обучением

Адаптировали статью Marina Tosic, в которой автор выясняет, в чём сходства и различия между устройством человеческого мозга и моделей машинного обучения. Разобраться в теме нам помогли: кандидат технических наук Василий Борисов и архитектор ML-решений в РБК Кирилл Думнов.

habr.com/ru/companies/netology

ХабрЧеловеческий мозг против ML-модели: сходства и различия между психикой и машинным обучениемАдаптировали статью Marina Tosic, в которой автор выясняет, в чём сходства и различия между устройством человеческого мозга и моделей машинного обучения. Разобраться в теме нам помогли: кандидат...

Как эффективно бороться с галлюцинациями нейросетей

Привет, я — Олег Рогов , руководитель фронтенд-разработки. В статье рассмотрю, почему искусственный интеллект (ИИ) галлюцинирует и как с этим бороться. С развитием ИИ больших языковых моделей перед пользователями встает вопрос о достоверности информации, которую они предоставляют. Иногда ИИ может выдавать ответы, которые выглядят убедительно, но на самом деле являются вымышленными или неточными. Явление, при котором языковая модель генерирует ложную информацию, получило название «галлюцинация».

habr.com/ru/companies/beeline_

ХабрКак эффективно бороться с галлюцинациями нейросетейПривет, я — Олег Рогов , руководитель фронтенд-разработки. В статье рассмотрю, почему искусственный интеллект (ИИ) галлюцинирует и как с этим бороться. С развитием ИИ больших языковых моделей...

[Перевод] LIMO: Меньше — значит больше для рассуждающих LLM

"Мы представляем фундаментальное открытие, которое бросает вызов нашему пониманию того, как сложные рассуждения возникают в больших языковых моделях" - так нескромно начинается аннотация к свежей статье от 5 февраля 2025 года. Авторы приводят результаты эксперимента, в котором небольшое количество хорошо подобранных задач с ответами может "всколыхнуть и заставить работать" весь "спящий" внутри LLM объем знаний, которые она накопила, перелопатив гигатонны текста. Возможно, данная работа войдет в список обязательных к прочтению статей по теории нейросетей.

habr.com/ru/articles/881974/

ХабрLIMO: Меньше — значит больше для рассуждающих LLMМизерный объем задач с ответами может разбудить спящего LLM-льва... "Мы представляем фундаментальное открытие, которое бросает вызов нашему пониманию того, как сложные рассуждения возникают в больших...

[Перевод] Теперь ИИ может заменить любого актера в фильме

Свет, камера... алгоритм? Теперь экран перестал быть уделом исключительно актеров из плоти и крови - все благодаря недавним достижениям в области искусственного интеллекта. В наши дни очень легко создать видео, в котором актеры делают или говорят то, чего на самом деле никогда не делали, или взять фрагмент из фильма и заменить лицо актера на другое. В ИИ-генератор видео с открытым исходным кодом Hunyuan от Tencent недавно была интегрирована поддержка технологии Low-Rank Adaptation (LoRA), что означает, что теперь вы можете обучать пользовательские стили, персонажей и движения, делая ваши ИИ-видео по-настоящему уникальными и персонализированными.

habr.com/ru/articles/878432/

ХабрТеперь ИИ может заменить любого актера в фильмеТеперь ИИ может заменить любого актера в фильме Свет, камера... алгоритм? Теперь экран перестал быть уделом исключительно актеров из плоти и крови - все благодаря недавним достижениям в области...

[Перевод] Платформа для генерации 3D-данных от Bifrost помогает промышленности ускорить обучение моделей

Привет, на связи Юлия Рогозина, бизнес-аналитик Шерпа Роботикс. Сегодня я перевела для вас статью, посвященную стартапу, который создал платформу для 3D-генерации данных без команды 3D-специалистов. Приглашаю ознакомиться с возможной идеей для бизнеса, ведь основным рынком компания считает США, но в России есть точно такие же потребности.

habr.com/ru/companies/sherpa_r

ХабрПлатформа для генерации 3D-данных от Bifrost помогает промышленности ускорить обучение моделейПривет, на связи Юлия Рогозина, бизнес-аналитик Шерпа Роботикс. Сегодня я перевела для вас статью, посвященную стартапу, который создал платформу для 3D-генерации данных без команды 3D-специалистов....

Как работает поисковое ранжирование для миллионов объявлений Авито

Привет! Меня зовут Илья Валяев, я data science team lead поискового ранжирования в Авито. В статье расскажу, как у нас всё устроена система ранжирования, какие технологии используем и как именно улучшаем поисковые выдачи. Статья будет интересна ML-инженерам, которые владеют базовой теорией машинного обучения и хотят разобраться в том, как устроено поисковое ранжирование.

habr.com/ru/companies/avito/ar

ХабрКак работает поисковое ранжирование для миллионов объявлений АвитоПривет! Меня зовут Илья Валяев, я data science team lead поискового ранжирования в Авито . В этой статье рассказываю, как у нас всё устроена система ранжирования, какие технологии используем и как...

[Перевод] Опыт тюнинга Llama3 405B на AMD MI300x

Опенсорсные модели становятся всё объёмнее, поэтому потребность в надёжной инфраструктуре для выполнения крупномасштабного обучения ИИ сегодня как никогда высока. Недавно наша компания выполнила fine-tuning модели LLaMA 3.1 405B на GPU AMD, доказав их способность эффективно справляться с крупномасштабными задачами ИИ. Наш опыт был крайне положительным, и мы с радостью выложили всю свою работу на GitHub в опенсорс. GPU AMD, и в особенности серия MI300X — это серьёзная альтернатива ИИ-оборудованию NVIDIA, обеспечивающая больше производительности на вложенный доллар. Наша система состояла из одного узла с 8 GPU AMD MI300x , а для fine-tuning мы использовали JAX . В этой статье мы расскажем всю историю fine-tuning LLaMA 405B, в том числе и подробности шардинга параметров и реализации LoRA.

habr.com/ru/articles/845674/

ХабрОпыт тюнинга Llama3 405B на AMD MI300xВведение Опенсорсные модели становятся всё объёмнее, поэтому потребность в надёжной инфраструктуре для выполнения крупномасштабного обучения ИИ сегодня как никогда высока. Недавно наша компания...
#llama#amd#nvidia

Drag and drop деплой ML-моделей: убираем рутину с помощью web-интерфейса

Привет, Хабр! Мы — DS-ы Павел Парфенов и Максим Шаланкин в команде Финтеха Big Data МТС. У нас много ML-моделей, которые нужно тестировать и внедрять в прод. Все это создает высокий темп разработки c кучей рутинных и ручных операций: от постановки задачи до продуктивизации и сопровождении модели. Мы смогли частично победить эту рутину с помощью drag and drop деплоя ML-моделей через web-интерфейс. В этой статье расскажем, что у него под капотом и какие функции в нем реализованы.

habr.com/ru/companies/ru_mts/a

ХабрDrag and drop деплой ML-моделей: убираем рутину с помощью web-интерфейсаПривет, Хабр! Мы — DS-ы Павел Парфенов и Максим Шаланкин в команде Финтеха Big Data МТС. У нас много ML-моделей, которые нужно тестировать и внедрять в прод. Все это создает высокий темп разработки c...

Real-time-распознавание лиц: методы обучения быстрых и точных моделей для работы на мобильных девайсах

Привет, Хабр! Меня зовут Вадим Селютин, я старший исследователь в компании VisionLabs. Наши решения по распознаванию лиц можно встретить в офисных центрах, московском метро и кассах самообслуживания супермаркетов. Во всех этих кейсах мы используем нейросети, которые адаптируем специально для мобильных устройств. В этой статье я расскажу про постановку задачи распознавания лиц, подходящие мобильные архитектуры, обучение распознаванию лиц на больших объемах данных и способы повысить точность маленькой архитектуры.

habr.com/ru/companies/ru_mts/a

ХабрReal-time-распознавание лиц: методы обучения быстрых и точных моделей для работы на мобильных девайсахПривет, Хабр! Меня зовут Вадим Селютин, я старший исследователь в компании VisionLabs. Наши решения по распознаванию лиц можно встретить в офисных центрах, московском метро и кассах самообслуживания...

NER для начинающих: Простое объяснение с примерами на SpaCy

В этой статье мы подробно рассмотрим распознавание именованных сущностей (Named Entity Recognition, NER) и его применение на практике. Простым и доступным языком объясним , как работает NER, приведем примеры кода с использованием библиотеки SpaCy и покажем, как обучать модели для распознавания именованных сущностей. Эта статья поможет вам быстро освоить основы и начать применять NER в своих проектах!

habr.com/ru/articles/826820/

ХабрNER для начинающих: Простое объяснение с примерами на SpaCyЧто же такое, этот ваш NER? Named Entity Recognition (NER) — это задача в области NLP (Natural Language Processing) , направленная на выделение фрагментов в тексте, относящихся к классам, таким как...