zhub.link is one of the many independent Mastodon servers you can use to participate in the fediverse.

Administered by:

Server stats:

28
active users

#обработка_естественного_языка

0 posts0 participants0 posts today
Habr<p>Пришёл, накодил, победил: хакатон глазами победителей и организаторов</p><p>В этой статье мы хотим поделиться своим опытом, который поможет вам подготовиться к любому хакатону (hackathon). Наверняка вы уже слышали про этот специфический формат соревнований для айтишников. На них ставятся практические задачи, которые участники решают за определённое время, имея ограниченные ресурсы. Обычно участники представлены командами, поэтому крайне важно уметь работать сообща. Помимо денежного приза победители получают известность. В дальнейшем это способствует обращению к ним с заказами на решение подобных задач. Для работодателя хакатон заменяет десятки собеседований и знакомство с заявленными в резюме проектами (которые ещё неизвестно кто и как делал). Он сразу получает представление о реальных возможностях готовой команды разработчиков и может пригласить лучшую на свой проект. Российская ИТ-компания «Криптонит» тоже участвует в хакатонах, причём в разных качествах. Наши молодые специалисты пробуют силы в профильных конкурсах, а их более опытные наставники сами организуют хакатоны для поиска сильных команд. Вот пара историй для лучшего понимания деталей. Veni, cogitavi, vici! У нас есть лаборатория ИИ, сотрудники которой приняли участие в хакатоне SafeSpeak-2024 , организованном университетом МТУСИ и институтом AIRI. Заявки на этот конкурс подали наши специалисты Анна Холькина и Карина Янышевская, специализирующиеся на алгоритмах обработки естественного языка. Задача хакатона была на злобу дня: требовалось представить решение для борьбы с мошенниками, говорящими с жертвой от имени кого-то из её знакомых. Техника таких атак называется аудио-спуфинг и всё чаще используется в генерации дипфейков. Командам нужно было создать модель машинного обучения для обнаружения таких дипфейков и обеспечения безопасности голосовой связи.</p><p><a href="https://habr.com/ru/companies/kryptonite/articles/881648/" target="_blank" rel="nofollow noopener noreferrer" translate="no"><span class="invisible">https://</span><span class="ellipsis">habr.com/ru/companies/kryptoni</span><span class="invisible">te/articles/881648/</span></a></p><p><a href="https://zhub.link/tags/%D1%85%D0%B0%D0%BA%D0%B0%D1%82%D0%BE%D0%BD" class="mention hashtag" rel="tag">#<span>хакатон</span></a> <a href="https://zhub.link/tags/%D0%BC%D0%B0%D1%88%D0%B8%D0%BD%D0%BD%D0%BE%D0%B5_%D0%BE%D0%B1%D1%83%D1%87%D0%B5%D0%BD%D0%B8%D0%B5" class="mention hashtag" rel="tag">#<span>машинное_обучение</span></a> <a href="https://zhub.link/tags/%D0%BE%D0%B1%D1%80%D0%B0%D0%B1%D0%BE%D1%82%D0%BA%D0%B0_%D0%B5%D1%81%D1%82%D0%B5%D1%81%D1%82%D0%B2%D0%B5%D0%BD%D0%BD%D0%BE%D0%B3%D0%BE_%D1%8F%D0%B7%D1%8B%D0%BA%D0%B0" class="mention hashtag" rel="tag">#<span>обработка_естественного_языка</span></a> <a href="https://zhub.link/tags/%D1%80%D0%B5%D1%87%D0%B5%D0%B2%D1%8B%D0%B5_%D1%82%D0%B5%D1%85%D0%BD%D0%BE%D0%BB%D0%BE%D0%B3%D0%B8%D0%B8" class="mention hashtag" rel="tag">#<span>речевые_технологии</span></a> <a href="https://zhub.link/tags/%D0%BC%D0%BE%D0%B4%D0%B5%D0%BB%D0%B8_%D0%BC%D0%B0%D1%88%D0%B8%D0%BD%D0%BD%D0%BE%D0%B3%D0%BE_%D0%BE%D0%B1%D1%83%D1%87%D0%B5%D0%BD%D0%B8%D1%8F" class="mention hashtag" rel="tag">#<span>модели_машинного_обучения</span></a> <a href="https://zhub.link/tags/%D0%B8%D1%81%D0%BA%D1%83%D1%81%D1%81%D1%82%D0%B2%D0%B5%D0%BD%D0%BD%D1%8B%D0%B9_%D0%B8%D0%BD%D1%82%D0%B5%D0%BB%D0%BB%D0%B5%D0%BA%D1%82" class="mention hashtag" rel="tag">#<span>искусственный_интеллект</span></a> <a href="https://zhub.link/tags/deepfake" class="mention hashtag" rel="tag">#<span>deepfake</span></a> <a href="https://zhub.link/tags/%D0%B4%D0%B8%D0%BF%D1%84%D0%B5%D0%B9%D0%BA" class="mention hashtag" rel="tag">#<span>дипфейк</span></a></p>
Habr<p>NLP: когда машины начинают понимать нас (Часть 3)</p><p>В этой статье мы продолжим изучение NLP и перейдем к более продвинутым темам, которые являются главными для построения современных приложений и моделей в области обработки естественного языка. А также создадим и обучим модели самостоятельно, используя TensorFlow/Keras и PyTorch.</p><p><a href="https://habr.com/ru/articles/864912/" target="_blank" rel="nofollow noopener noreferrer" translate="no"><span class="invisible">https://</span><span class="">habr.com/ru/articles/864912/</span><span class="invisible"></span></a></p><p><a href="https://zhub.link/tags/%D0%BE%D0%B1%D1%80%D0%B0%D0%B1%D0%BE%D1%82%D0%BA%D0%B0_%D0%B5%D1%81%D1%82%D0%B5%D1%81%D1%82%D0%B2%D0%B5%D0%BD%D0%BD%D0%BE%D0%B3%D0%BE_%D1%8F%D0%B7%D1%8B%D0%BA%D0%B0" class="mention hashtag" rel="tag">#<span>обработка_естественного_языка</span></a> <a href="https://zhub.link/tags/nlp" class="mention hashtag" rel="tag">#<span>nlp</span></a> <a href="https://zhub.link/tags/natural_language_processing" class="mention hashtag" rel="tag">#<span>natural_language_processing</span></a> <a href="https://zhub.link/tags/python" class="mention hashtag" rel="tag">#<span>python</span></a> <a href="https://zhub.link/tags/%D0%BC%D0%B0%D1%88%D0%B8%D0%BD%D0%BD%D0%BE%D0%B5_%D0%BE%D0%B1%D1%83%D1%87%D0%B5%D0%BD%D0%B8%D0%B5" class="mention hashtag" rel="tag">#<span>машинное_обучение</span></a> <a href="https://zhub.link/tags/machine_learning" class="mention hashtag" rel="tag">#<span>machine_learning</span></a> <a href="https://zhub.link/tags/keras" class="mention hashtag" rel="tag">#<span>keras</span></a> <a href="https://zhub.link/tags/tensorflow" class="mention hashtag" rel="tag">#<span>tensorflow</span></a> <a href="https://zhub.link/tags/pytorch" class="mention hashtag" rel="tag">#<span>pytorch</span></a> <a href="https://zhub.link/tags/%D0%B8%D1%81%D0%BA%D1%83%D1%81%D1%81%D1%82%D0%B2%D0%B5%D0%BD%D0%BD%D1%8B%D0%B9_%D0%B8%D0%BD%D1%82%D0%B5%D0%BB%D0%BB%D0%B5%D0%BA%D1%82" class="mention hashtag" rel="tag">#<span>искусственный_интеллект</span></a></p>
Habr<p>NLP: когда машины начинают понимать нас (Часть 2)</p><p>В прошлой статье мы с вами изучили теоретические основы обработки естественного языка (NLP) и теперь готовы перейти к практике. В мире NLP выбор подходящего языка программирования и инструментов играет ключевую роль в успешной реализации проектов. Одним из наиболее популярных языков для решения задач в этой области является Python. Его простота, читаемость и поддержка мощных библиотек делают его идеальным выбором для разработчиков.</p><p><a href="https://habr.com/ru/articles/864778/" target="_blank" rel="nofollow noopener noreferrer" translate="no"><span class="invisible">https://</span><span class="">habr.com/ru/articles/864778/</span><span class="invisible"></span></a></p><p><a href="https://zhub.link/tags/%D0%BE%D0%B1%D1%80%D0%B0%D0%B1%D0%BE%D1%82%D0%BA%D0%B0_%D0%B5%D1%81%D1%82%D0%B5%D1%81%D1%82%D0%B2%D0%B5%D0%BD%D0%BD%D0%BE%D0%B3%D0%BE_%D1%8F%D0%B7%D1%8B%D0%BA%D0%B0" class="mention hashtag" rel="tag">#<span>обработка_естественного_языка</span></a> <a href="https://zhub.link/tags/nlp" class="mention hashtag" rel="tag">#<span>nlp</span></a> <a href="https://zhub.link/tags/natural_language_processing" class="mention hashtag" rel="tag">#<span>natural_language_processing</span></a> <a href="https://zhub.link/tags/machine_learning" class="mention hashtag" rel="tag">#<span>machine_learning</span></a> <a href="https://zhub.link/tags/%D0%BC%D0%B0%D1%88%D0%B8%D0%BD%D0%BD%D0%BE%D0%B5_%D0%BE%D0%B1%D1%83%D1%87%D0%B5%D0%BD%D0%B8%D0%B5" class="mention hashtag" rel="tag">#<span>машинное_обучение</span></a> <a href="https://zhub.link/tags/%D0%B8%D1%81%D0%BA%D1%83%D1%81%D1%81%D1%82%D0%B2%D0%B5%D0%BD%D0%BD%D1%8B%D0%B9_%D0%B8%D0%BD%D1%82%D0%B5%D0%BB%D0%BB%D0%B5%D0%BA%D1%82" class="mention hashtag" rel="tag">#<span>искусственный_интеллект</span></a> <a href="https://zhub.link/tags/python" class="mention hashtag" rel="tag">#<span>python</span></a> <a href="https://zhub.link/tags/%D0%BF%D0%B0%D0%B9%D1%82%D0%BE%D0%BD" class="mention hashtag" rel="tag">#<span>пайтон</span></a> <a href="https://zhub.link/tags/nltk" class="mention hashtag" rel="tag">#<span>nltk</span></a> <a href="https://zhub.link/tags/spacy" class="mention hashtag" rel="tag">#<span>spacy</span></a></p>
Habr<p>NLP: когда машины начинают понимать нас (Часть 1)</p><p>Представьте, что вы можете разговаривать с компьютером так же естественно, как с обычным человеком. Вы задаёте вопросы, получаете ответы, даёте команды - и это всё на вашем родном языке. Именно этим и занимается обработка естественного языка ( Natural Language Proccessing , или NLP) - область искусственного интеллекта, которая фокусируется на взаимодействии между компьютерами и людьми с помощью естественного языка. Цель NLP - научить компьютеры понимать, интерпретировать и генерировать человеческую речь и текст так же, как это делаем мы. Это включает в себя не только распознавание слов, но и понимание их смысла, контекста и эмоций.</p><p><a href="https://habr.com/ru/articles/864656/" target="_blank" rel="nofollow noopener noreferrer" translate="no"><span class="invisible">https://</span><span class="">habr.com/ru/articles/864656/</span><span class="invisible"></span></a></p><p><a href="https://zhub.link/tags/nlp" class="mention hashtag" rel="tag">#<span>nlp</span></a> <a href="https://zhub.link/tags/%D0%BE%D0%B1%D1%80%D0%B0%D0%B1%D0%BE%D1%82%D0%BA%D0%B0_%D0%B5%D1%81%D1%82%D0%B5%D1%81%D1%82%D0%B2%D0%B5%D0%BD%D0%BD%D0%BE%D0%B3%D0%BE_%D1%8F%D0%B7%D1%8B%D0%BA%D0%B0" class="mention hashtag" rel="tag">#<span>обработка_естественного_языка</span></a> <a href="https://zhub.link/tags/%D0%BC%D0%B0%D1%88%D0%B8%D0%BD%D0%BD%D0%BE%D0%B5_%D0%BE%D0%B1%D1%83%D1%87%D0%B5%D0%BD%D0%B8%D0%B5" class="mention hashtag" rel="tag">#<span>машинное_обучение</span></a> <a href="https://zhub.link/tags/machinelearning" class="mention hashtag" rel="tag">#<span>machinelearning</span></a> <a href="https://zhub.link/tags/ml" class="mention hashtag" rel="tag">#<span>ml</span></a> <a href="https://zhub.link/tags/natural_language_processing" class="mention hashtag" rel="tag">#<span>natural_language_processing</span></a></p>
Habr<p>[Перевод] VALL-E 2: Нейронные кодировочные языковые модели являются синтезаторами речи с человеческим уровнем в zero-shot</p><p>VALL-E 2, последнее достижение в области нейронных кодировочных языковых моделей, которое стало вехой в синтезе речи в zero-shot, достигнув человеческого уровня впервые. Zero-shot - способность модели генерировать речь для голоса, который она не слышала во время обучения. Другими словами, модель может синтезировать речь для нового диктора, основываясь лишь на коротком аудио образце его голоса (prompt). Основанная на своем предшественнике VALL-E, новая итерация вводит два значительных улучшения: Repetition Aware Sampling и Grouped Code Modeling . Repetition Aware Sampling (Выборка с учетом повторений) решает проблему зацикливания, с которой сталкивался предыдущий VALL-E. Если модель начинает повторять одни и те же звуки, она автоматически переключается на более точный метод выбора, чтобы избежать &quot;застревания&quot;. Grouped Code Modeling (Моделирование групп кодов) - звуковые коды группируются и обрабатываются вместе, как слоги в словах. Это ускоряет синтез речи и позволяет модели лучше учитывать контекст, делая речь более естественной и связной. Синтез речи из текста ( TTS ) направлен на генерацию высококачественной речи из текстового ввода с высокой степенью ясности и разборчивости.</p><p><a href="https://habr.com/ru/articles/864494/" target="_blank" rel="nofollow noopener noreferrer" translate="no"><span class="invisible">https://</span><span class="">habr.com/ru/articles/864494/</span><span class="invisible"></span></a></p><p><a href="https://zhub.link/tags/%D0%BE%D0%B1%D1%80%D0%B0%D0%B1%D0%BE%D1%82%D0%BA%D0%B0_%D0%B5%D1%81%D1%82%D0%B5%D1%81%D1%82%D0%B2%D0%B5%D0%BD%D0%BD%D0%BE%D0%B3%D0%BE_%D1%8F%D0%B7%D1%8B%D0%BA%D0%B0" class="mention hashtag" rel="tag">#<span>обработка_естественного_языка</span></a> <a href="https://zhub.link/tags/%D1%81%D0%B8%D0%BD%D1%82%D0%B5%D0%B7_%D1%80%D0%B5%D1%87%D0%B8" class="mention hashtag" rel="tag">#<span>синтез_речи</span></a> <a href="https://zhub.link/tags/nlp" class="mention hashtag" rel="tag">#<span>nlp</span></a> <a href="https://zhub.link/tags/tts" class="mention hashtag" rel="tag">#<span>tts</span></a></p>
Habr<p>Как мы создали LLM-модель Cotype Nano</p><p>На связи группа фундаментальных исследований MTS AI. В этой статье мы расскажем про дроп трех маленьких моделей Cotype-Nano, Cotype-Nano-4bit и Cotype-Nano-CPU. Расскажем, как нам удалось достичь 1 места на RuGeneralArena в своей весовой категории.</p><p><a href="https://habr.com/ru/companies/mts_ai/articles/861398/" target="_blank" rel="nofollow noopener noreferrer" translate="no"><span class="invisible">https://</span><span class="ellipsis">habr.com/ru/companies/mts_ai/a</span><span class="invisible">rticles/861398/</span></a></p><p><a href="https://zhub.link/tags/%D0%B8%D1%81%D0%BA%D1%83%D1%81%D1%81%D1%82%D0%B2%D0%B5%D0%BD%D0%BD%D1%8B%D0%B9_%D0%B8%D0%BD%D1%82%D0%B5%D0%BB%D0%BB%D0%B5%D0%BA%D1%82" class="mention hashtag" rel="tag">#<span>искусственный_интеллект</span></a> <a href="https://zhub.link/tags/nlp" class="mention hashtag" rel="tag">#<span>nlp</span></a> <a href="https://zhub.link/tags/%D1%8F%D0%B7%D1%8B%D0%BA%D0%BE%D0%B2%D1%8B%D0%B5_%D0%BC%D0%BE%D0%B4%D0%B5%D0%BB%D0%B8" class="mention hashtag" rel="tag">#<span>языковые_модели</span></a> <a href="https://zhub.link/tags/llm" class="mention hashtag" rel="tag">#<span>llm</span></a> <a href="https://zhub.link/tags/opensource" class="mention hashtag" rel="tag">#<span>opensource</span></a> <a href="https://zhub.link/tags/%D0%BE%D0%B1%D1%80%D0%B0%D0%B1%D0%BE%D1%82%D0%BA%D0%B0_%D0%B5%D1%81%D1%82%D0%B5%D1%81%D1%82%D0%B2%D0%B5%D0%BD%D0%BD%D0%BE%D0%B3%D0%BE_%D1%8F%D0%B7%D1%8B%D0%BA%D0%B0" class="mention hashtag" rel="tag">#<span>обработка_естественного_языка</span></a> <a href="https://zhub.link/tags/%D0%BE%D1%82%D0%BA%D1%80%D1%8B%D1%82%D1%8B%D0%B9_%D0%BA%D0%BE%D0%B4" class="mention hashtag" rel="tag">#<span>открытый_код</span></a> <a href="https://zhub.link/tags/%D0%BD%D0%B5%D0%B9%D1%80%D0%BE%D0%BD" class="mention hashtag" rel="tag">#<span>нейрон</span></a> <a href="https://zhub.link/tags/%D0%BD%D0%B5%D0%B9%D1%80%D0%BE%D1%81%D0%B5%D1%82%D1%8C" class="mention hashtag" rel="tag">#<span>нейросеть</span></a> <a href="https://zhub.link/tags/%D0%B8%D0%B8" class="mention hashtag" rel="tag">#<span>ии</span></a></p>
Habr<p>[Перевод] Идеально ли текстовые эмбеддинги кодируют текст?</p><p>Этот материал посвящён исследованию восстановления текстов из текстовых эмбеддингов. Рост популярности векторных баз данных В последние годы наблюдается стремительное развитие генеративного искусственного интеллекта. Это привело к тому, что многие компании спешат внедрить соответствующие ИИ-инструменты в свои бизнес-процессы. Один из самых распространённых способов это сделать заключается в создании ИИ-систем, которые отвечают на вопросы, имеющие отношение к информации, которую можно найти в некоей базе данных, хранящей документы. Большинство решений этой задачи основано на подходе, называемом «генерация с дополненной выборкой»</p><p><a href="https://habr.com/ru/companies/wunderfund/articles/859232/" target="_blank" rel="nofollow noopener noreferrer" translate="no"><span class="invisible">https://</span><span class="ellipsis">habr.com/ru/companies/wunderfu</span><span class="invisible">nd/articles/859232/</span></a></p><p><a href="https://zhub.link/tags/%D0%98%D0%98" class="mention hashtag" rel="tag">#<span>ИИ</span></a> <a href="https://zhub.link/tags/%D0%98%D1%81%D0%BA%D1%83%D1%81%D1%81%D1%82%D0%B2%D0%B5%D0%BD%D0%BD%D1%8B%D0%B9_%D0%B8%D0%BD%D1%82%D0%B5%D0%BB%D0%BB%D0%B5%D0%BA%D1%82" class="mention hashtag" rel="tag">#<span>Искусственный_интеллект</span></a> <a href="https://zhub.link/tags/%D0%BE%D0%B1%D1%80%D0%B0%D0%B1%D0%BE%D1%82%D0%BA%D0%B0_%D0%B5%D1%81%D1%82%D0%B5%D1%81%D1%82%D0%B2%D0%B5%D0%BD%D0%BD%D0%BE%D0%B3%D0%BE_%D1%8F%D0%B7%D1%8B%D0%BA%D0%B0" class="mention hashtag" rel="tag">#<span>обработка_естественного_языка</span></a></p>
Habr<p>Наш опыт создания контекстного переводчика</p><p>Все началось осенью 2017 года, тогда у нас уже был опыт разработки веб-приложений. Искали проект, удовлетворяющий следующим условиям: 1. Можно сделать небольшой командой. 2. Проверенная идея и большой потенциал роста. 3. Понимание как сделать лучше. 4. Оптимальное время разработки и выход на самоокупаемость. 5. Отсутствие проблем с правообладателями и законом.</p><p><a href="https://habr.com/ru/articles/851856/" target="_blank" rel="nofollow noopener noreferrer" translate="no"><span class="invisible">https://</span><span class="">habr.com/ru/articles/851856/</span><span class="invisible"></span></a></p><p><a href="https://zhub.link/tags/%D0%BF%D0%B5%D1%80%D0%B5%D0%B2%D0%BE%D0%B4%D1%87%D0%B8%D0%BA" class="mention hashtag" rel="tag">#<span>переводчик</span></a> <a href="https://zhub.link/tags/%D0%B8%D0%B7%D1%83%D1%87%D0%B5%D0%BD%D0%B8%D0%B5_%D1%8F%D0%B7%D1%8B%D0%BA%D0%BE%D0%B2" class="mention hashtag" rel="tag">#<span>изучение_языков</span></a> <a href="https://zhub.link/tags/%D0%BA%D0%BE%D0%BD%D1%82%D0%B5%D0%BA%D1%81%D1%82%D0%BD%D1%8B%D0%B9_%D0%BF%D0%BE%D0%B8%D1%81%D0%BA" class="mention hashtag" rel="tag">#<span>контекстный_поиск</span></a> <a href="https://zhub.link/tags/%D0%BE%D0%B1%D1%80%D0%B0%D0%B1%D0%BE%D1%82%D0%BA%D0%B0_%D0%B5%D1%81%D1%82%D0%B5%D1%81%D1%82%D0%B2%D0%B5%D0%BD%D0%BD%D0%BE%D0%B3%D0%BE_%D1%8F%D0%B7%D1%8B%D0%BA%D0%B0" class="mention hashtag" rel="tag">#<span>обработка_естественного_языка</span></a> <a href="https://zhub.link/tags/%D1%81%D1%82%D0%B0%D1%80%D1%82%D0%B0%D0%BF%D1%8B" class="mention hashtag" rel="tag">#<span>стартапы</span></a></p>
Habr<p>Гайд по работе языковых моделей для начинающих</p><p>Вместе с дата-сайентистом и биоинформатиком Марией Дьяковой подготовили подробный гайд о том, как устроены языковые модели и что нужно знать, чтобы начать с ними работать.</p><p><a href="https://habr.com/ru/companies/skillfactory/articles/837366/" target="_blank" rel="nofollow noopener noreferrer" translate="no"><span class="invisible">https://</span><span class="ellipsis">habr.com/ru/companies/skillfac</span><span class="invisible">tory/articles/837366/</span></a></p><p><a href="https://zhub.link/tags/%D1%8F%D0%B7%D1%8B%D0%BA%D0%BE%D0%B2%D1%8B%D0%B5_%D0%BC%D0%BE%D0%B4%D0%B5%D0%BB%D0%B8" class="mention hashtag" rel="tag">#<span>языковые_модели</span></a> <a href="https://zhub.link/tags/%D1%8F%D0%B7%D1%8B%D0%BA%D0%BE%D0%B2%D0%B0%D1%8F_%D0%BC%D0%BE%D0%B4%D0%B5%D0%BB%D1%8C" class="mention hashtag" rel="tag">#<span>языковая_модель</span></a> <a href="https://zhub.link/tags/llm" class="mention hashtag" rel="tag">#<span>llm</span></a> <a href="https://zhub.link/tags/nlp" class="mention hashtag" rel="tag">#<span>nlp</span></a> <a href="https://zhub.link/tags/nlp_" class="mention hashtag" rel="tag">#<span>nlp_</span></a>(natural_language_processing) <a href="https://zhub.link/tags/gpt" class="mention hashtag" rel="tag">#<span>gpt</span></a> <a href="https://zhub.link/tags/bert" class="mention hashtag" rel="tag">#<span>bert</span></a> <a href="https://zhub.link/tags/pytorch" class="mention hashtag" rel="tag">#<span>pytorch</span></a> <a href="https://zhub.link/tags/tensorflow" class="mention hashtag" rel="tag">#<span>tensorflow</span></a> <a href="https://zhub.link/tags/%D0%BE%D0%B1%D1%80%D0%B0%D0%B1%D0%BE%D1%82%D0%BA%D0%B0_%D0%B5%D1%81%D1%82%D0%B5%D1%81%D1%82%D0%B2%D0%B5%D0%BD%D0%BD%D0%BE%D0%B3%D0%BE_%D1%8F%D0%B7%D1%8B%D0%BA%D0%B0" class="mention hashtag" rel="tag">#<span>обработка_естественного_языка</span></a></p>
Habr<p>Быстрее, выше, сильнее в распознавании речи: SpeechKit, SaluteSpeech или SpeechFlow?</p><p>Меня зовут Екатерина, я IT-архитектор в ML-команде SimbirSoft , специализируюсь на темах по обработке естественного языка. Сегодня мы обсудим особенности решения задач распознавания речи. Проверим наши предположения на собственных аудиоданных, которые будем переводить из акустического сигнала в текст тремя передовыми коммерческими системами: Yandex SpeechKit , SaluteSpeech от Сбера и SpeechFlow от Bluepulse. Статья будет полезна тем, кто интересуется тенденциями развития машинного обучения или хочет присмотреться к возможностям и уязвимым местам существующих решений для их внедрения в бизнес-приложения. Погрузиться ⚡</p><p><a href="https://habr.com/ru/companies/simbirsoft/articles/833882/" target="_blank" rel="nofollow noopener noreferrer" translate="no"><span class="invisible">https://</span><span class="ellipsis">habr.com/ru/companies/simbirso</span><span class="invisible">ft/articles/833882/</span></a></p><p><a href="https://zhub.link/tags/nlp_" class="mention hashtag" rel="tag">#<span>nlp_</span></a>(natural_language_processing) <a href="https://zhub.link/tags/%D0%BE%D0%B1%D1%80%D0%B0%D0%B1%D0%BE%D1%82%D0%BA%D0%B0_%D0%B5%D1%81%D1%82%D0%B5%D1%81%D1%82%D0%B2%D0%B5%D0%BD%D0%BD%D0%BE%D0%B3%D0%BE_%D1%8F%D0%B7%D1%8B%D0%BA%D0%B0" class="mention hashtag" rel="tag">#<span>обработка_естественного_языка</span></a> <a href="https://zhub.link/tags/stt" class="mention hashtag" rel="tag">#<span>stt</span></a> <a href="https://zhub.link/tags/asr" class="mention hashtag" rel="tag">#<span>asr</span></a> <a href="https://zhub.link/tags/yandex_speechkit" class="mention hashtag" rel="tag">#<span>yandex_speechkit</span></a> <a href="https://zhub.link/tags/salutespeech" class="mention hashtag" rel="tag">#<span>salutespeech</span></a> <a href="https://zhub.link/tags/hugging_face" class="mention hashtag" rel="tag">#<span>hugging_face</span></a> <a href="https://zhub.link/tags/large_language_models" class="mention hashtag" rel="tag">#<span>large_language_models</span></a> <a href="https://zhub.link/tags/nlp" class="mention hashtag" rel="tag">#<span>nlp</span></a></p>
Habr<p>Семантический поиск (homemade)</p><p>Основой семантического поиска может являться ML задача Sentence Similarity , а если быть еще конкретнее, то это Semantic Textual Similarity . Модели, обученные под эту задачу, способны оценивать насколько близки предложения по своему смыслу. Всё, что нам дальше остается, так это засунуть модель в некоторую поисковую систему... Но тут давайте по порядку</p><p><a href="https://habr.com/ru/articles/834356/" target="_blank" rel="nofollow noopener noreferrer" translate="no"><span class="invisible">https://</span><span class="">habr.com/ru/articles/834356/</span><span class="invisible"></span></a></p><p><a href="https://zhub.link/tags/%D1%81%D0%B5%D0%BC%D0%B0%D0%BD%D1%82%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B8%D0%B9_%D0%BF%D0%BE%D0%B8%D1%81%D0%BA" class="mention hashtag" rel="tag">#<span>семантический_поиск</span></a> <a href="https://zhub.link/tags/%D0%BC%D0%B0%D1%88%D0%B8%D0%BD%D0%BD%D0%BE%D0%B5_%D0%BE%D0%B1%D1%83%D1%87%D0%B5%D0%BD%D0%B8e" class="mention hashtag" rel="tag">#<span>машинное_обучениe</span></a> <a href="https://zhub.link/tags/%D0%BE%D0%B1%D1%80%D0%B0%D0%B1%D0%BE%D1%82%D0%BA%D0%B0_%D0%B5%D1%81%D1%82%D0%B5%D1%81%D1%82%D0%B2%D0%B5%D0%BD%D0%BD%D0%BE%D0%B3%D0%BE_%D1%8F%D0%B7%D1%8B%D0%BA%D0%B0" class="mention hashtag" rel="tag">#<span>обработка_естественного_языка</span></a> <a href="https://zhub.link/tags/nlp" class="mention hashtag" rel="tag">#<span>nlp</span></a> <a href="https://zhub.link/tags/bert" class="mention hashtag" rel="tag">#<span>bert</span></a> <a href="https://zhub.link/tags/machine_learning" class="mention hashtag" rel="tag">#<span>machine_learning</span></a> <a href="https://zhub.link/tags/sentence_transformer" class="mention hashtag" rel="tag">#<span>sentence_transformer</span></a> <a href="https://zhub.link/tags/transformers" class="mention hashtag" rel="tag">#<span>transformers</span></a> <a href="https://zhub.link/tags/deep_learning" class="mention hashtag" rel="tag">#<span>deep_learning</span></a> <a href="https://zhub.link/tags/ai" class="mention hashtag" rel="tag">#<span>ai</span></a></p>
Habr<p>OpenSource на поле против OpenAI: Function Calls здесь и сейчас для самых маленьких… ресурсов</p><p>Вызов функций на локально развернутых LLM возможен. Прочитайте статью и узнайте, как это можно реализовать и насколько хорошо это работает!</p><p><a href="https://habr.com/ru/articles/833518/" target="_blank" rel="nofollow noopener noreferrer" translate="no"><span class="invisible">https://</span><span class="">habr.com/ru/articles/833518/</span><span class="invisible"></span></a></p><p><a href="https://zhub.link/tags/%D0%B8%D1%81%D0%BA%D1%83%D1%81%D1%81%D1%82%D0%B2%D0%B5%D0%BD%D0%BD%D1%8B%D0%B9_%D0%B8%D0%BD%D1%82%D0%B5%D0%BB%D0%BB%D0%B5%D0%BA%D1%82" class="mention hashtag" rel="tag">#<span>искусственный_интеллект</span></a> <a href="https://zhub.link/tags/%D0%BC%D0%B0%D1%88%D0%B8%D0%BD%D0%BD%D0%BE%D0%B5_%D0%BE%D0%B1%D1%83%D1%87%D0%B5%D0%BD%D0%B8%D0%B5" class="mention hashtag" rel="tag">#<span>машинное_обучение</span></a> <a href="https://zhub.link/tags/%D0%BE%D0%B1%D1%80%D0%B0%D0%B1%D0%BE%D1%82%D0%BA%D0%B0_%D0%B5%D1%81%D1%82%D0%B5%D1%81%D1%82%D0%B2%D0%B5%D0%BD%D0%BD%D0%BE%D0%B3%D0%BE_%D1%8F%D0%B7%D1%8B%D0%BA%D0%B0" class="mention hashtag" rel="tag">#<span>обработка_естественного_языка</span></a> <a href="https://zhub.link/tags/llm" class="mention hashtag" rel="tag">#<span>llm</span></a> <a href="https://zhub.link/tags/mistral" class="mention hashtag" rel="tag">#<span>mistral</span></a> <a href="https://zhub.link/tags/natural_language_processing" class="mention hashtag" rel="tag">#<span>natural_language_processing</span></a></p>
Habr<p>Вызов функций с помощью LLM</p><p>Всем привет, меня зовут Алан, я разработчик-исследователь из команды фундаментальных исследований MTS AI. Мы изучаем возможности генеративного ИИ, и видим, что большие языковые модели отлично справляются с различными текстовыми задачами, но мы можем расширить их функционал. Например, пока что LLM не может правильно посчитать логарифм, узнать погоду или какую-то другую информацию. Как решить эту задачу? Нужно научить модель пользоваться внешними инструментами/функциями. В этой статье мы поговорим о вызове функций с помощью больших языковых моделей, рассмотрим некоторые проприетарные и открытые модели, связанные исследования, а затем проведем небольшой эксперимент с отправкой электронной почты при помощи LLM.</p><p><a href="https://habr.com/ru/companies/mts_ai/articles/831220/" target="_blank" rel="nofollow noopener noreferrer" translate="no"><span class="invisible">https://</span><span class="ellipsis">habr.com/ru/companies/mts_ai/a</span><span class="invisible">rticles/831220/</span></a></p><p><a href="https://zhub.link/tags/%D0%B8%D1%81%D0%BA%D1%83%D1%81%D1%82%D0%B2%D0%B5%D0%BD%D0%BD%D1%8B%D0%B9_%D0%B8%D0%BD%D1%82%D0%B5%D0%BB%D0%BB%D0%B5%D0%BA%D1%82" class="mention hashtag" rel="tag">#<span>искуственный_интеллект</span></a> <a href="https://zhub.link/tags/nlp" class="mention hashtag" rel="tag">#<span>nlp</span></a> <a href="https://zhub.link/tags/%D1%8F%D0%B7%D1%8B%D0%BA%D0%BE%D0%B2%D1%8B%D0%B5_%D0%BC%D0%BE%D0%B4%D0%B5%D0%BB%D0%B8" class="mention hashtag" rel="tag">#<span>языковые_модели</span></a> <a href="https://zhub.link/tags/agent" class="mention hashtag" rel="tag">#<span>agent</span></a> <a href="https://zhub.link/tags/llm" class="mention hashtag" rel="tag">#<span>llm</span></a> <a href="https://zhub.link/tags/%D0%BE%D0%B1%D1%80%D0%B0%D0%B1%D0%BE%D1%82%D0%BA%D0%B0_%D0%B5%D1%81%D1%82%D0%B5%D1%81%D1%82%D0%B2%D0%B5%D0%BD%D0%BD%D0%BE%D0%B3%D0%BE_%D1%8F%D0%B7%D1%8B%D0%BA%D0%B0" class="mention hashtag" rel="tag">#<span>обработка_естественного_языка</span></a> <a href="https://zhub.link/tags/%D0%BD%D0%B5%D0%B9%D1%82%D1%80%D0%BE%D0%BD%D0%BD%D1%8B%D0%B5_%D1%81%D0%B5%D1%82%D0%B8" class="mention hashtag" rel="tag">#<span>нейтронные_сети</span></a> <a href="https://zhub.link/tags/%D0%BD%D0%B5%D0%B9%D1%80%D0%BE%D1%81%D0%B5%D1%82%D0%B8" class="mention hashtag" rel="tag">#<span>нейросети</span></a> <a href="https://zhub.link/tags/api" class="mention hashtag" rel="tag">#<span>api</span></a> <a href="https://zhub.link/tags/%D0%BD%D0%B5%D0%B9%D1%80%D0%BE%D1%81%D0%B5%D1%82%D1%8C" class="mention hashtag" rel="tag">#<span>нейросеть</span></a></p>
Habr<p>Долой рандом, или ищем лучшие настройки для аугментации текстов</p><p>Всем привет. На связи Игорь Буянов, старший разработчик в MTS AI. Этот пост — текстовый вариант моего доклада, с которым я выступал в прошлую пятницу на Pycon 2024. Расскажу о том, как мы оптимизировали параметры аугментаций для текстовых данных и что из этого получилось. Текст рассчитан на широкий круг читателей, поэтому если вы слышите про аугментации впервые — не пугайтесь, разберемся.</p><p><a href="https://habr.com/ru/companies/mts_ai/articles/832272/" target="_blank" rel="nofollow noopener noreferrer" translate="no"><span class="invisible">https://</span><span class="ellipsis">habr.com/ru/companies/mts_ai/a</span><span class="invisible">rticles/832272/</span></a></p><p><a href="https://zhub.link/tags/%D0%B0%D1%83%D0%B3%D0%BC%D0%B5%D0%BD%D1%82%D0%B0%D1%86%D0%B8%D1%8F" class="mention hashtag" rel="tag">#<span>аугментация</span></a> <a href="https://zhub.link/tags/%D0%BE%D0%B1%D1%80%D0%B0%D0%B1%D0%BE%D1%82%D0%BA%D0%B0_%D0%B5%D1%81%D1%82%D0%B5%D1%81%D1%82%D0%B2%D0%B5%D0%BD%D0%BD%D0%BE%D0%B3%D0%BE_%D1%8F%D0%B7%D1%8B%D0%BA%D0%B0" class="mention hashtag" rel="tag">#<span>обработка_естественного_языка</span></a> <a href="https://zhub.link/tags/%D0%B3%D0%B8%D0%BF%D0%B5%D1%80%D0%BF%D0%B0%D1%80%D0%B0%D0%BC%D0%B5%D1%82%D1%80%D1%8B" class="mention hashtag" rel="tag">#<span>гиперпараметры</span></a> <a href="https://zhub.link/tags/%D0%BE%D0%BF%D1%82%D0%B8%D0%BC%D0%B8%D0%B7%D0%B0%D1%86%D0%B8%D1%8F" class="mention hashtag" rel="tag">#<span>оптимизация</span></a> <a href="https://zhub.link/tags/pycon" class="mention hashtag" rel="tag">#<span>pycon</span></a></p>
Habr<p>NER для начинающих: Простое объяснение с примерами на SpaCy</p><p>В этой статье мы подробно рассмотрим распознавание именованных сущностей (Named Entity Recognition, NER) и его применение на практике. Простым и доступным языком объясним , как работает NER, приведем примеры кода с использованием библиотеки SpaCy и покажем, как обучать модели для распознавания именованных сущностей. Эта статья поможет вам быстро освоить основы и начать применять NER в своих проектах!</p><p><a href="https://habr.com/ru/articles/826820/" target="_blank" rel="nofollow noopener noreferrer" translate="no"><span class="invisible">https://</span><span class="">habr.com/ru/articles/826820/</span><span class="invisible"></span></a></p><p><a href="https://zhub.link/tags/named_entity_recognition" class="mention hashtag" rel="tag">#<span>named_entity_recognition</span></a> <a href="https://zhub.link/tags/ner" class="mention hashtag" rel="tag">#<span>ner</span></a> <a href="https://zhub.link/tags/natural_language_processing" class="mention hashtag" rel="tag">#<span>natural_language_processing</span></a> <a href="https://zhub.link/tags/nlp" class="mention hashtag" rel="tag">#<span>nlp</span></a> <a href="https://zhub.link/tags/spacy" class="mention hashtag" rel="tag">#<span>spacy</span></a> <a href="https://zhub.link/tags/%D0%BC%D0%B0%D1%88%D0%B8%D0%BD%D0%BD%D0%BE%D0%B5_%D0%BE%D0%B1%D1%83%D1%87%D0%B5%D0%BD%D0%B8%D0%B5" class="mention hashtag" rel="tag">#<span>машинное_обучение</span></a> <a href="https://zhub.link/tags/%D0%BE%D0%B1%D1%80%D0%B0%D0%B1%D0%BE%D1%82%D0%BA%D0%B0_%D0%B5%D1%81%D1%82%D0%B5%D1%81%D1%82%D0%B2%D0%B5%D0%BD%D0%BD%D0%BE%D0%B3%D0%BE_%D1%8F%D0%B7%D1%8B%D0%BA%D0%B0" class="mention hashtag" rel="tag">#<span>обработка_естественного_языка</span></a> <a href="https://zhub.link/tags/python" class="mention hashtag" rel="tag">#<span>python</span></a> <a href="https://zhub.link/tags/%D0%BF%D1%80%D0%B8%D0%BC%D0%B5%D1%80%D1%8B_%D0%BA%D0%BE%D0%B4%D0%B0" class="mention hashtag" rel="tag">#<span>примеры_кода</span></a> <a href="https://zhub.link/tags/%D0%BE%D0%B1%D1%83%D1%87%D0%B5%D0%BD%D0%B8%D0%B5_%D0%BC%D0%BE%D0%B4%D0%B5%D0%BB%D0%B5%D0%B9" class="mention hashtag" rel="tag">#<span>обучение_моделей</span></a></p>
Habr<p>Как LLM учат понимать синтаксис</p><p>Скорее всего, вы поняли заголовок правильно, хотя в нём есть стилистическая ошибка — двусмысленность (кто-то учит LLM, или они учат кого-то?). Человеческое понимание языка остается ориентиром и пока недостижимой целью для языковых моделей. При всей небезошибочности первого и при всех невероятных успехах последних. Например, человеку обычно не составляет труда однозначно трактовать двусмысленные фразы исходя из контекста. Более того, мы с удовольствием используем такие каламбуры в шутках разного качества. Из самого известного приходит на ум только “В Кремле голубые не только ели, но и пили” (предложите свои варианты в комментариях — будет интересно почитать). Есть ещё “казнить нельзя помиловать”, но эта двусмысленность разрешается запятой. Самый известный пример в английском: “ Time flies like an arrow; Fruit flies like a banana”. Человек скорее всего после некоторых раздумий поймёт это как “ Время летит как стрела, мухи любят банан ” (хотя мне, например, понадобилось на это несколько секунд). Яндекс переводчик понимает эту фразу так: “ Время летит как стрела, фрукты разлетаются как бананы ”. Google translator демонстрирует зоологическую эрудированность: “ Время летит как стрела; Фруктовые мушки, как банан ”, а ChatGPT предлагает “ Время летит как стрела; Мухи на фруктах летают как бананы ”. В общем, никто не справился.</p><p><a href="https://habr.com/ru/companies/ntr/articles/812107/" target="_blank" rel="nofollow noopener noreferrer" translate="no"><span class="invisible">https://</span><span class="ellipsis">habr.com/ru/companies/ntr/arti</span><span class="invisible">cles/812107/</span></a></p><p><a href="https://zhub.link/tags/llm" class="mention hashtag" rel="tag">#<span>llm</span></a> <a href="https://zhub.link/tags/nlp" class="mention hashtag" rel="tag">#<span>nlp</span></a> <a href="https://zhub.link/tags/large_language_model" class="mention hashtag" rel="tag">#<span>large_language_model</span></a> <a href="https://zhub.link/tags/transformers" class="mention hashtag" rel="tag">#<span>transformers</span></a> <a href="https://zhub.link/tags/%D1%82%D1%80%D0%B0%D0%BD%D1%81%D1%84%D0%BE%D1%80%D0%BC%D0%B5%D1%80%D1%8B" class="mention hashtag" rel="tag">#<span>трансформеры</span></a> <a href="https://zhub.link/tags/%D1%81%D0%B8%D0%BD%D1%82%D0%B0%D0%BA%D1%81%D0%B8%D1%81" class="mention hashtag" rel="tag">#<span>синтаксис</span></a> <a href="https://zhub.link/tags/%D0%BE%D0%B1%D1%80%D0%B0%D0%B1%D0%BE%D1%82%D0%BA%D0%B0_%D0%B5%D1%81%D1%82%D0%B5%D1%81%D1%82%D0%B2%D0%B5%D0%BD%D0%BD%D0%BE%D0%B3%D0%BE_%D1%8F%D0%B7%D1%8B%D0%BA%D0%B0" class="mention hashtag" rel="tag">#<span>обработка_естественного_языка</span></a></p>
Habr<p>Жажда «цифровой крови»: Как Google, OpenAI и Meta переступают черту ради развития ИИ</p><p>Технологические гиганты OpenAI, Google и Meta* в погоне за онлайн-данными для обучения своих новейших систем искусственного интеллекта готовы на всё: игнорировать корпоративные политики, менять собственные правила и даже обсуждать возможность обхода законов об авторском праве.</p><p><a href="https://habr.com/ru/articles/806021/" target="_blank" rel="nofollow noopener noreferrer" translate="no"><span class="invisible">https://</span><span class="">habr.com/ru/articles/806021/</span><span class="invisible"></span></a></p><p><a href="https://zhub.link/tags/%D0%B8%D1%81%D0%BA%D1%83%D1%81%D1%81%D1%82%D0%B2%D0%B5%D0%BD%D0%BD%D1%8B%D0%B9_%D0%B8%D0%BD%D1%82%D0%B5%D0%BB%D0%BB%D0%B5%D0%BA%D1%82" class="mention hashtag" rel="tag">#<span>искусственный_интеллект</span></a> <a href="https://zhub.link/tags/%D0%BC%D0%B0%D1%88%D0%B8%D0%BD%D0%BD%D0%BE%D0%B5_%D0%BE%D0%B1%D1%83%D1%87%D0%B5%D0%BD%D0%B8%D0%B5" class="mention hashtag" rel="tag">#<span>машинное_обучение</span></a> <a href="https://zhub.link/tags/%D0%B1%D0%BE%D0%BB%D1%8C%D1%88%D0%B8%D0%B5_%D0%B4%D0%B0%D0%BD%D0%BD%D1%8B%D0%B5" class="mention hashtag" rel="tag">#<span>большие_данные</span></a> <a href="https://zhub.link/tags/%D0%BE%D0%B1%D1%80%D0%B0%D0%B1%D0%BE%D1%82%D0%BA%D0%B0_%D0%B5%D1%81%D1%82%D0%B5%D1%81%D1%82%D0%B2%D0%B5%D0%BD%D0%BD%D0%BE%D0%B3%D0%BE_%D1%8F%D0%B7%D1%8B%D0%BA%D0%B0" class="mention hashtag" rel="tag">#<span>обработка_естественного_языка</span></a> <a href="https://zhub.link/tags/%D1%87%D0%B0%D1%82%D0%B1%D0%BE%D1%82%D1%8B" class="mention hashtag" rel="tag">#<span>чатботы</span></a> <a href="https://zhub.link/tags/gpt4" class="mention hashtag" rel="tag">#<span>gpt4</span></a> <a href="https://zhub.link/tags/whisper" class="mention hashtag" rel="tag">#<span>whisper</span></a> <a href="https://zhub.link/tags/%D1%81%D0%B8%D0%BD%D1%82%D0%B5%D1%82%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B8%D0%B5_%D0%B4%D0%B0%D0%BD%D0%BD%D1%8B%D0%B5" class="mention hashtag" rel="tag">#<span>синтетические_данные</span></a> <a href="https://zhub.link/tags/%D0%B8%D0%B8%D0%BC%D0%BE%D0%B4%D0%B5%D0%BB%D0%B8" class="mention hashtag" rel="tag">#<span>иимодели</span></a> <a href="https://zhub.link/tags/%D1%82%D0%B5%D1%85%D0%BD%D0%BE%D0%BB%D0%BE%D0%B3%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B8%D0%B5_%D0%BA%D0%BE%D0%BC%D0%BF%D0%B0%D0%BD%D0%B8%D0%B8" class="mention hashtag" rel="tag">#<span>технологические_компании</span></a></p>
Habr<p>ChatGPT и отзывы на приложение: Анализ тональности для улучшения пользовательского опыта</p><p>Привет, дорогие читатели Хабра! Сегодня я хочу поделиться с вами своими знаниями и опытом в области анализа данных и машинного обучения, освещая увлекательную и актуальную тему – анализ отзывов на приложения с использованием модели ChatGPT. Этот подход открывает новые горизонты для понимания тональности отзывов, что является ключевым аспектом в изучении общественного мнения. В этой статье я расскажу о том, как можно использовать возможности Natural Language Processing (NLP) для анализа отзывов, собранных из приложения AppStore. Я исследую, как каждый отзыв, содержащий дату, заголовок, текст и оценку пользователя, может быть преобразован в ценные данные для обучения модели анализа тональности. Эта модель будет способна классифицировать отзывы как положительные, негативные или нейтральные, предоставляя нам глубокое понимание эмоциональной окраски пользовательских мнений.</p><p><a href="https://habr.com/ru/companies/otus/articles/802821/" target="_blank" rel="nofollow noopener noreferrer" translate="no"><span class="invisible">https://</span><span class="ellipsis">habr.com/ru/companies/otus/art</span><span class="invisible">icles/802821/</span></a></p><p><a href="https://zhub.link/tags/%D0%BC%D0%B0%D1%88%D0%B8%D0%BD%D0%BD%D0%BE%D0%B5" class="mention hashtag" rel="tag">#<span>машинное</span></a>+обучение <a href="https://zhub.link/tags/nlp" class="mention hashtag" rel="tag">#<span>nlp</span></a> <a href="https://zhub.link/tags/bert" class="mention hashtag" rel="tag">#<span>bert</span></a> <a href="https://zhub.link/tags/roberta" class="mention hashtag" rel="tag">#<span>roberta</span></a> <a href="https://zhub.link/tags/%D0%B8%D1%81%D1%81%D0%BA%D1%83%D1%81%D1%82%D0%B2%D0%B5%D0%BD%D0%BD%D1%8B%D0%B9_%D0%B8%D0%BD%D1%82%D0%B5%D0%BB%D0%BB%D0%B5%D0%BA%D1%82" class="mention hashtag" rel="tag">#<span>исскуственный_интеллект</span></a> <a href="https://zhub.link/tags/%D0%BE%D0%B1%D1%80%D0%B0%D0%B1%D0%BE%D1%82%D0%BA%D0%B0_%D0%B5%D1%81%D1%82%D0%B5%D1%81%D1%82%D0%B2%D0%B5%D0%BD%D0%BD%D0%BE%D0%B3%D0%BE_%D1%8F%D0%B7%D1%8B%D0%BA%D0%B0" class="mention hashtag" rel="tag">#<span>обработка_естественного_языка</span></a> <a href="https://zhub.link/tags/chatgpt" class="mention hashtag" rel="tag">#<span>chatgpt</span></a></p>
Habr<p>Как ускорить LLM-генерацию текста в 20 раз на больших наборах данных</p><p>Всем привет, я Алан, разработчик-исследователь в MTS AI. В команде фундаментальных исследований мы занимаемся исследованием LLM, реализацией DPO и валидацией наших собственных языковых моделей. В рамках этих задач у нас возникла потребность в генерации большого количества данных с помощью LLM. Такая генерация обычно занимает много времени. Однако за последний год, с ростом популярности LLM, стали появляться различные инструменты для развертывания таких моделей. Одной из самых эффективных библиотек для инференса языковых моделей является библиотека vLLM. В статье показывается, как с помощью асинхронных запросов и встроенных особенностей vLLM можно увеличить скорость генерации примерно в 20 раз. Приятного чтения!</p><p><a href="https://habr.com/ru/companies/mts_ai/articles/791594/" target="_blank" rel="nofollow noopener noreferrer" translate="no"><span class="invisible">https://</span><span class="ellipsis">habr.com/ru/companies/mts_ai/a</span><span class="invisible">rticles/791594/</span></a></p><p><a href="https://zhub.link/tags/%D0%B8%D1%81%D0%BA%D1%83%D1%81%D1%81%D1%82%D0%B2%D0%B5%D0%BD%D0%BD%D1%8B%D0%B9_%D0%B8%D0%BD%D1%82%D0%B5%D0%BB%D0%BB%D0%B5%D0%BA%D1%82" class="mention hashtag" rel="tag">#<span>искусственный_интеллект</span></a> <a href="https://zhub.link/tags/nlp" class="mention hashtag" rel="tag">#<span>nlp</span></a> <a href="https://zhub.link/tags/%D1%8F%D0%B7%D1%8B%D0%BA%D0%BE%D0%B2%D1%8B%D0%B5_%D0%BC%D0%BE%D0%B4%D0%B5%D0%BB%D0%B8" class="mention hashtag" rel="tag">#<span>языковые_модели</span></a> <a href="https://zhub.link/tags/vllm" class="mention hashtag" rel="tag">#<span>vllm</span></a> <a href="https://zhub.link/tags/%D0%BE%D0%B1%D1%80%D0%B0%D0%B1%D0%BE%D1%82%D0%BA%D0%B0_%D0%B5%D1%81%D1%82%D0%B5%D1%81%D1%82%D0%B2%D0%B5%D0%BD%D0%BD%D0%BE%D0%B3%D0%BE_%D1%8F%D0%B7%D1%8B%D0%BA%D0%B0" class="mention hashtag" rel="tag">#<span>обработка_естественного_языка</span></a> <a href="https://zhub.link/tags/%D0%BD%D0%B5%D0%B9%D1%80%D0%BE%D1%81%D0%B5%D1%82%D0%B8" class="mention hashtag" rel="tag">#<span>нейросети</span></a> <a href="https://zhub.link/tags/%D0%BD%D0%B5%D0%B9%D1%80%D0%BE%D0%BD%D0%BD%D1%8B%D0%B5_%D1%81%D0%B5%D1%82%D0%B8" class="mention hashtag" rel="tag">#<span>нейронные_сети</span></a> <a href="https://zhub.link/tags/%D0%B8%D0%BD%D1%84%D0%B5%D1%80%D0%B5%D0%BD%D1%81" class="mention hashtag" rel="tag">#<span>инференс</span></a> <a href="https://zhub.link/tags/llm" class="mention hashtag" rel="tag">#<span>llm</span></a></p>
Habr<p>Как перевести игру &#39;The Lamplighters League&#39;</p><p>На данном примере предлагается разобрать перевод .wem файлов аудио одного языка (англ.) на другой язык (русский) с последующей упаковкой в .wem и использования в игре. В качестве инструментов будут использоваться python, нейросети, а также программа Wwise. Из интересного — также будет использоваться сеть, определяющая пол (gender) говорящего, чтобы перевод получился двухголосым.</p><p><a href="https://habr.com/ru/articles/787708/" target="_blank" rel="nofollow noopener noreferrer" translate="no"><span class="invisible">https://</span><span class="">habr.com/ru/articles/787708/</span><span class="invisible"></span></a></p><p><a href="https://zhub.link/tags/%D0%BF%D0%B5%D1%80%D0%B5%D0%B2%D0%BE%D0%B4_%D1%81_%D0%B0%D0%BD%D0%B3%D0%BB%D0%B8%D0%B9%D1%81%D0%BA%D0%BE%D0%B3%D0%BE" class="mention hashtag" rel="tag">#<span>перевод_с_английского</span></a> <a href="https://zhub.link/tags/%D0%BD%D0%B5%D0%B9%D1%80%D0%BE%D1%81%D0%B5%D1%82%D0%B8" class="mention hashtag" rel="tag">#<span>нейросети</span></a> <a href="https://zhub.link/tags/%D0%BF%D0%B5%D1%80%D0%B5%D0%B2%D0%BE%D0%B4_%D0%B8%D0%B3%D1%80" class="mention hashtag" rel="tag">#<span>перевод_игр</span></a> <a href="https://zhub.link/tags/%D0%BE%D0%B1%D1%80%D0%B0%D0%B1%D0%BE%D1%82%D0%BA%D0%B0_%D0%B5%D1%81%D1%82%D0%B5%D1%81%D1%82%D0%B2%D0%B5%D0%BD%D0%BD%D0%BE%D0%B3%D0%BE_%D1%8F%D0%B7%D1%8B%D0%BA%D0%B0" class="mention hashtag" rel="tag">#<span>обработка_естественного_языка</span></a> <a href="https://zhub.link/tags/python" class="mention hashtag" rel="tag">#<span>python</span></a></p>