zhub.link is one of the many independent Mastodon servers you can use to participate in the fediverse.

Administered by:

Server stats:

28
active users

#retrieval

0 posts0 participants0 posts today
Habr<p>Как выбрать embedding модель без датасета и исторических данных</p><p>С появлением больших языковых моделей тема векторного поиска обрела новое дыхание. Компании, которые хотят внедрить архитектуру Retrieval-Augmented Generation (RAG), сталкиваются с вопросом: как выбрать эмбеддинги, которые будут работать эффективно именно с их данными? Выбор эмбеддинг-модели — это стратегически важное и долгосрочное решение, так как оно определяет качество поиска и производительность системы. Но этот выбор особенно сложно сделать на ранних этапах развития вашего проекта, когда данных для анализа ещё нет. При этом замена модели в будущем может оказаться дорогостоящей и ресурсозатратной. На первый взгляд, решение принять несложно — заходим на какой-нибудь популярный бенчмарк и берем модель с топа. Но успех на лидерборде не гарантирует аналогичных результатов в специфичных доменах, таких как финансы, медицина или e-com. Без собственного датасета или пользовательской истории выбор модели становится настоящей проблемой. В этой статье мы представим подходы к качественной оценке эмбеддинг-моделей, применимые даже при отсутствии данных, если вы работаете в специализированной предметной области. Мы рассмотрим несколько способов оценки поведения векторных представлений, которые помогут сделать информированный выбор с опорой на реалии вашего проекта.</p><p><a href="https://habr.com/ru/articles/885196/" target="_blank" rel="nofollow noopener noreferrer" translate="no"><span class="invisible">https://</span><span class="">habr.com/ru/articles/885196/</span><span class="invisible"></span></a></p><p><a href="https://zhub.link/tags/embeddings" class="mention hashtag" rel="tag">#<span>embeddings</span></a> <a href="https://zhub.link/tags/nlp" class="mention hashtag" rel="tag">#<span>nlp</span></a> <a href="https://zhub.link/tags/python" class="mention hashtag" rel="tag">#<span>python</span></a> <a href="https://zhub.link/tags/retrieval" class="mention hashtag" rel="tag">#<span>retrieval</span></a> <a href="https://zhub.link/tags/ai" class="mention hashtag" rel="tag">#<span>ai</span></a> <a href="https://zhub.link/tags/rag" class="mention hashtag" rel="tag">#<span>rag</span></a> <a href="https://zhub.link/tags/retrieval_augmented_generation" class="mention hashtag" rel="tag">#<span>retrieval_augmented_generation</span></a></p>
Habr<p>Hippo-RAG: Долговременная память для LLM, вдохновленная нейробиологией</p><p>Ученые часто вдохновляется нашими или животными биологическими структурами: CNN, MLP, Backprop, и для многих других исследований можно найти сходства в реальном мире. Недавно вышла статья, которая делает то же самое, но для RAG (Retrieval-Augmented Generation). В некотором роде, это недостающая современным LLM долгосрочная память. Это понятно, а причем тут неокортекст, гиппокамп и другие сложные слова? Давайте посмотрим.</p><p><a href="https://habr.com/ru/articles/860426/" target="_blank" rel="nofollow noopener noreferrer" translate="no"><span class="invisible">https://</span><span class="">habr.com/ru/articles/860426/</span><span class="invisible"></span></a></p><p><a href="https://zhub.link/tags/llm" class="mention hashtag" rel="tag">#<span>llm</span></a> <a href="https://zhub.link/tags/rag" class="mention hashtag" rel="tag">#<span>rag</span></a> <a href="https://zhub.link/tags/retrieval_augmented_generation" class="mention hashtag" rel="tag">#<span>retrieval_augmented_generation</span></a> <a href="https://zhub.link/tags/retrieval" class="mention hashtag" rel="tag">#<span>retrieval</span></a> <a href="https://zhub.link/tags/machinelearning" class="mention hashtag" rel="tag">#<span>machinelearning</span></a> <a href="https://zhub.link/tags/machine_learning" class="mention hashtag" rel="tag">#<span>machine_learning</span></a> <a href="https://zhub.link/tags/natural_language_processing" class="mention hashtag" rel="tag">#<span>natural_language_processing</span></a> <a href="https://zhub.link/tags/transformer" class="mention hashtag" rel="tag">#<span>transformer</span></a> <a href="https://zhub.link/tags/transformers" class="mention hashtag" rel="tag">#<span>transformers</span></a></p>
Habr<p>Ускорение и облегчение моделей для поддержания диалога виртуальных ассистентов Салют</p><p>Привет, Хабр! Меня зовут Александр Абрамов и я ML Lead продукта в SberDevices. Эта статья — про обучение core-моделей retrieval-based диалоговых систем, поговорим про хинты для ускорения обучения и сходимости, также затрону тему общей схемы inference и оптимизации её компонентов. Речь пойдёт о ML с позиции пайплайнов и продакшена виртуального ассистента Салют.</p><p><a href="https://habr.com/ru/companies/oleg-bunin/articles/834728/" target="_blank" rel="nofollow noopener noreferrer" translate="no"><span class="invisible">https://</span><span class="ellipsis">habr.com/ru/companies/oleg-bun</span><span class="invisible">in/articles/834728/</span></a></p><p><a href="https://zhub.link/tags/NLP" class="mention hashtag" rel="tag">#<span>NLP</span></a> <a href="https://zhub.link/tags/retrieval" class="mention hashtag" rel="tag">#<span>retrieval</span></a> <a href="https://zhub.link/tags/%D0%B2%D0%B8%D1%80%D1%82%D1%83%D0%B0%D0%BB%D1%8C%D0%BD%D1%8B%D0%B5_%D0%B0%D1%81%D1%81%D0%B8%D1%81%D1%82%D0%B5%D0%BD%D1%82%D1%8B_%D1%81%D0%B0%D0%BB%D1%8E%D1%82" class="mention hashtag" rel="tag">#<span>виртуальные_ассистенты_салют</span></a> <a href="https://zhub.link/tags/machinelearning" class="mention hashtag" rel="tag">#<span>machinelearning</span></a> <a href="https://zhub.link/tags/%D0%B0%D1%80%D1%85%D0%B8%D1%82%D0%B5%D0%BA%D1%82%D1%83%D1%80%D0%B0" class="mention hashtag" rel="tag">#<span>архитектура</span></a> <a href="https://zhub.link/tags/inference" class="mention hashtag" rel="tag">#<span>inference</span></a> <a href="https://zhub.link/tags/faiss" class="mention hashtag" rel="tag">#<span>faiss</span></a> <a href="https://zhub.link/tags/%D0%BA%D0%BE%D0%BD%D1%81%D0%B8%D1%81%D1%82%D0%B5%D0%BD%D1%82%D0%BD%D0%BE%D1%81%D1%82%D1%8C" class="mention hashtag" rel="tag">#<span>консистентность</span></a> <a href="https://zhub.link/tags/bert" class="mention hashtag" rel="tag">#<span>bert</span></a> <a href="https://zhub.link/tags/gpt" class="mention hashtag" rel="tag">#<span>gpt</span></a></p>
Habr<p>Интеграция LLM в корпоративные чат-боты: RAG-подход и эксперименты</p><p>Всем привет! На связи команда AI-Run из X5 Tech, мы занимаемся генеративными сетями в целом и языковыми моделями в частности. В этой статье мы опишем наш опыт работы с большими языковыми моделями (LLM), их внедрение для обработки корпоративных данных, а также поделимся нашими результатами и выводами. Ещё мы расскажем о нашем подходе к использованию LLM, подробно остановимся на методе Retrieval Augmented Generation (RAG) и рассмотрим примеры использования чат-ботов на корпоративных порталах X5. Эта статья будет полезна разработчикам, которые интересуются внедрением LLM для работы с корпоративными данными. Она основана на нашем выступлении на митапе, но не ограничивается им, а, скорее, дополняет его.</p><p><a href="https://habr.com/ru/companies/X5Tech/articles/834832/" target="_blank" rel="nofollow noopener noreferrer" translate="no"><span class="invisible">https://</span><span class="ellipsis">habr.com/ru/companies/X5Tech/a</span><span class="invisible">rticles/834832/</span></a></p><p><a href="https://zhub.link/tags/llm" class="mention hashtag" rel="tag">#<span>llm</span></a> <a href="https://zhub.link/tags/rag" class="mention hashtag" rel="tag">#<span>rag</span></a> <a href="https://zhub.link/tags/ai" class="mention hashtag" rel="tag">#<span>ai</span></a> <a href="https://zhub.link/tags/%D1%87%D0%B0%D1%82%D0%B1%D0%BE%D1%82" class="mention hashtag" rel="tag">#<span>чатбот</span></a> <a href="https://zhub.link/tags/%D0%B8%D1%81%D0%BA%D1%83%D1%81%D1%81%D1%82%D0%B2%D0%B5%D0%BD%D0%BD%D1%8B%D0%B9_%D0%B8%D0%BD%D1%82%D0%B5%D0%BB%D0%BB%D0%B5%D0%BA%D1%82" class="mention hashtag" rel="tag">#<span>искусственный_интеллект</span></a> <a href="https://zhub.link/tags/%D0%B8%D0%B8" class="mention hashtag" rel="tag">#<span>ии</span></a> <a href="https://zhub.link/tags/%D0%B8%D0%B8%D0%B0%D1%81%D1%81%D0%B8%D1%81%D1%82%D0%B5%D0%BD%D1%82" class="mention hashtag" rel="tag">#<span>ииассистент</span></a> <a href="https://zhub.link/tags/python" class="mention hashtag" rel="tag">#<span>python</span></a> <a href="https://zhub.link/tags/retrieval" class="mention hashtag" rel="tag">#<span>retrieval</span></a> <a href="https://zhub.link/tags/retrieval_augmented_generation" class="mention hashtag" rel="tag">#<span>retrieval_augmented_generation</span></a></p>
Habr<p>Поиск без границ: путь к векторному поиску в Uzum Market</p><p>Привет, с вами снова Даша и Uzum Market . В прошлый раз мы глубоко погрузились в пайплайн работы поиска нашего маркетплейса , и я обещала вам вернуться с новостями о его улучшении. Так вот, время пришло, и сегодня мы поговорим про наш опыт внедрения векторного поиска!</p><p><a href="https://habr.com/ru/companies/uzum/articles/816773/" target="_blank" rel="nofollow noopener noreferrer" translate="no"><span class="invisible">https://</span><span class="ellipsis">habr.com/ru/companies/uzum/art</span><span class="invisible">icles/816773/</span></a></p><p><a href="https://zhub.link/tags/ml" class="mention hashtag" rel="tag">#<span>ml</span></a> <a href="https://zhub.link/tags/%D0%B2%D0%B5%D0%BA%D1%82%D0%BE%D1%80%D0%BD%D1%8B%D0%B9_%D0%BF%D0%BE%D0%B8%D1%81%D0%BA" class="mention hashtag" rel="tag">#<span>векторный_поиск</span></a> <a href="https://zhub.link/tags/retrieval" class="mention hashtag" rel="tag">#<span>retrieval</span></a> <a href="https://zhub.link/tags/uzum" class="mention hashtag" rel="tag">#<span>uzum</span></a> <a href="https://zhub.link/tags/uzumtech" class="mention hashtag" rel="tag">#<span>uzumtech</span></a> <a href="https://zhub.link/tags/machine_learning" class="mention hashtag" rel="tag">#<span>machine_learning</span></a></p>
Habr<p>Подключаем умный поиск (GPT) к своей базе документов</p><p>Есть отечественный файрвол (NGFW) и есть документация для пользователей powered by GitBook. В этой документации работает простой поиск — только по словам и словосочетаниям. И это плохо, потому что нет ответов на вопросы: &quot;Какие алгоритмы шифрования ipsec поддерживаются у вас?&quot;, &quot;Как заблокировать ютуб?&quot;, &quot;Как настроить DMZ?&quot;. Хочется, чтобы поиск был “умным” и чтобы пользователи могли обращаться с подобными вопросами именно к поиску, а не к инженерам тех. поддержки. AI или ML внутри — не важно, как это называть. Но на простые вопросы из списка выше поиск должен отвечать. Я решил эту задачу (Retrieval Question Answering), используя OpenAI API. Казалось бы, уже опубликованы сотни похожих инструкций, как это сделать. Но под катом будет не инструкция, а рассказ про сложности, которые пришлось решить на пути от идеи до запуска поиска.</p><p><a href="https://habr.com/ru/articles/778170/" target="_blank" rel="nofollow noopener noreferrer" translate="no"><span class="invisible">https://</span><span class="">habr.com/ru/articles/778170/</span><span class="invisible"></span></a></p><p><a href="https://zhub.link/tags/gpt" class="mention hashtag" rel="tag">#<span>gpt</span></a> <a href="https://zhub.link/tags/retrieval" class="mention hashtag" rel="tag">#<span>retrieval</span></a> <a href="https://zhub.link/tags/openai" class="mention hashtag" rel="tag">#<span>openai</span></a></p>