#машинное_обучениe

2 posts2 participants0 posts today

Habr 25+Модели T-lite и T-pro: training reportПривет! Я Дима Стоянов, MLE в команде разработки фундаментальных моделей. Мы продолжаем рассказывать о наших моделях T-lite и T-pro. Общие характеристики и результаты бенчмарков описывали в предыдущей публикации. В этой статье раскроем детали предобучения: от подготовки данных до финальных экспериментов, а совсем скоро поделимся особенностями этапа post-training.<a href="https://habr.com/ru/companies/tbank/articles/890236/?utm_campaign=890236" target="_blank" rel="nofollow noopener noreferrer" translate="no">https://habr.com/ru/companies/tbank/articles/890236/?utm_campaign=890236</a><a href="https://zhub.link/tags/%D0%BC%D0%B0%D1%88%D0%B8%D0%BD%D0%BD%D0%BE%D0%B5_%D0%BE%D0%B1%D1%83%D1%87%D0%B5%D0%BD%D0%B8e" class="mention hashtag" rel="tag">#машинное_обучениe</a> <a href="https://zhub.link/tags/%D1%80%D0%B0%D1%81%D0%BF%D0%BE%D0%B7%D0%BD%D0%B0%D0%B2%D0%B0%D0%BD%D0%B8%D0%B5_%D1%82%D0%B5%D0%BA%D1%81%D1%82%D0%B0" class="mention hashtag" rel="tag">#распознавание_текста</a> <a href="https://zhub.link/tags/llm%D0%BC%D0%BE%D0%B4%D0%B5%D0%BB%D0%B8" class="mention hashtag" rel="tag">#llmмодели</a> <a href="https://zhub.link/tags/%D1%8F%D0%B7%D1%8B%D0%BA%D0%BE%D0%B2%D1%8B%D0%B5_%D0%BC%D0%BE%D0%B4%D0%B5%D0%BB%D0%B8" class="mention hashtag" rel="tag">#языковые_модели</a>

HabrМодели T-lite и T-pro: training reportПривет! Я Дима Стоянов, MLE в команде разработки фундаментальных моделей. Мы продолжаем рассказывать о наших моделях T-lite и T-pro. Общие характеристики и результаты бенчмарков описывали в предыдущей публикации. В этой статье раскроем детали предобучения: от подготовки данных до финальных экспериментов, а совсем скоро поделимся особенностями этапа post-training.<a href="https://habr.com/ru/companies/tbank/articles/890236/" target="_blank" rel="nofollow noopener noreferrer" translate="no">https://habr.com/ru/companies/tbank/articles/890236/</a><a href="https://zhub.link/tags/%D0%BC%D0%B0%D1%88%D0%B8%D0%BD%D0%BD%D0%BE%D0%B5_%D0%BE%D0%B1%D1%83%D1%87%D0%B5%D0%BD%D0%B8e" class="mention hashtag" rel="tag">#машинное_обучениe</a> <a href="https://zhub.link/tags/%D1%80%D0%B0%D1%81%D0%BF%D0%BE%D0%B7%D0%BD%D0%B0%D0%B2%D0%B0%D0%BD%D0%B8%D0%B5_%D1%82%D0%B5%D0%BA%D1%81%D1%82%D0%B0" class="mention hashtag" rel="tag">#распознавание_текста</a> <a href="https://zhub.link/tags/llm%D0%BC%D0%BE%D0%B4%D0%B5%D0%BB%D0%B8" class="mention hashtag" rel="tag">#llmмодели</a> <a href="https://zhub.link/tags/%D1%8F%D0%B7%D1%8B%D0%BA%D0%BE%D0%B2%D1%8B%D0%B5_%D0%BC%D0%BE%D0%B4%D0%B5%D0%BB%D0%B8" class="mention hashtag" rel="tag">#языковые_модели</a>

HabrЗащита LLM в разработке чат-ботов в корпоративной среде: как избежать утечек данных и других угрозКак компания, которая внедряет прикладные решения, мы хотим знать, насколько они безопасны. Расскажу про основные риски, связанные с использованием LLM в корпоративной среде, и способы от них защититься. Если вы хотите узнать больше об уязвимостях и техниках защиты LLM — можно ознакомиться с моим<a href="https://habr.com/ru/companies/raft/articles/847152/" target="_blank" rel="nofollow noopener noreferrer" translate="no">https://habr.com/ru/companies/raft/articles/847152/</a><a href="https://zhub.link/tags/%D0%BD%D0%B5%D0%B9%D1%80%D0%BE%D1%81%D0%B5%D1%82%D0%B8" class="mention hashtag" rel="tag">#нейросети</a> <a href="https://zhub.link/tags/%D0%BC%D1%83%D0%BB%D1%8C%D1%82%D0%B8%D0%BC%D0%BE%D0%B4%D0%B0%D0%BB%D1%8C%D0%BD%D1%8B%D0%B5_%D0%BC%D0%BE%D0%B4%D0%B5%D0%BB%D0%B8" class="mention hashtag" rel="tag">#мультимодальные_модели</a> <a href="https://zhub.link/tags/%D0%B1%D0%B5%D0%B7%D0%BE%D0%BF%D0%B0%D1%81%D0%BD%D0%BE%D1%81%D1%82%D1%8C_%D0%B4%D0%B0%D0%BD%D0%BD%D1%8B%D1%85" class="mention hashtag" rel="tag">#безопасность_данных</a> <a href="https://zhub.link/tags/%D0%B8%D1%81%D0%BA%D1%83%D1%81%D1%81%D1%82%D0%B2%D0%B5%D0%BD%D0%BD%D1%8B%D0%B9_%D0%B8%D0%BD%D1%82%D0%B5%D0%BB%D0%BB%D0%B5%D0%BA%D1%82" class="mention hashtag" rel="tag">#искусственный_интеллект</a> <a href="https://zhub.link/tags/%D0%BC%D0%B0%D1%88%D0%B8%D0%BD%D0%BD%D0%BE%D0%B5_%D0%BE%D0%B1%D1%83%D1%87%D0%B5%D0%BD%D0%B8e" class="mention hashtag" rel="tag">#машинное_обучениe</a> <a href="https://zhub.link/tags/llmattack" class="mention hashtag" rel="tag">#llmattack</a> <a href="https://zhub.link/tags/%D0%B0%D1%82%D0%B0%D0%BA%D0%B8" class="mention hashtag" rel="tag">#атаки</a> <a href="https://zhub.link/tags/%D1%83%D1%82%D0%B5%D1%87%D0%BA%D0%B8" class="mention hashtag" rel="tag">#утечки</a> <a href="https://zhub.link/tags/%D0%B1%D0%BE%D0%BB%D1%8C%D1%88%D0%B8%D0%B5_%D1%8F%D0%B7%D1%8B%D0%BA%D0%BE%D0%B2%D1%8B%D0%B5_%D0%BC%D0%BE%D0%B4%D0%B5%D0%BB%D0%B8" class="mention hashtag" rel="tag">#большие_языковые_модели</a> <a href="https://zhub.link/tags/%D0%B1%D0%B8%D0%B3%D0%B4%D0%B0%D1%82%D0%B0" class="mention hashtag" rel="tag">#бигдата</a>

HabrВаше лицо кажется знакомым: разведка, анализ и методы атак на ML в системах распознавания лицМы живем в мире, где системы распознавания лиц (далее — CРЛ) используются практически везде: от валидации возраста и биометрической идентификации в режиме онлайн до наблюдения и проведения оплаты в реальном мире. Технологические аспекты таких алгоритмов развиваются на наших глазах: начиная с простых систем, основанных на базовых алгоритмах, мы перешли к системам, использующим алгоритмы машинного обучения, однако и их развитие еще далеко от завершения. В предыдущих исследованиях мы затронули биометрическую идентификацию, и эта работа является логичным продолжением погружения в системы распознавания лиц и эксплуатацию их недостатков. Пораспознаем лица?<a href="https://habr.com/ru/companies/pt/articles/837536/" target="_blank" rel="nofollow noopener noreferrer" translate="no">https://habr.com/ru/companies/pt/articles/837536/</a><a href="https://zhub.link/tags/ml" class="mention hashtag" rel="tag">#ml</a> <a href="https://zhub.link/tags/%D0%91%D0%B8%D0%BE%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D1%8F" class="mention hashtag" rel="tag">#Биометрия</a> <a href="https://zhub.link/tags/%D1%80%D0%B0%D1%81%D0%BF%D0%BE%D0%B7%D0%BD%D0%B0%D0%B2%D0%B0%D0%BD%D0%B8%D0%B5" class="mention hashtag" rel="tag">#распознавание</a> <a href="https://zhub.link/tags/%D1%80%D0%B0%D1%81%D0%BF%D0%BE%D0%B7%D0%BD%D0%B0%D0%B2%D0%B0%D0%BD%D0%B8%D0%B5_%D0%BB%D0%B8%D1%86" class="mention hashtag" rel="tag">#распознавание_лиц</a> <a href="https://zhub.link/tags/%D0%BC%D0%B0%D1%88%D0%B8%D0%BD%D0%BD%D0%BE%D0%B5_%D0%BE%D0%B1%D1%83%D1%87%D0%B5%D0%BD%D0%B8e" class="mention hashtag" rel="tag">#машинное_обучениe</a> <a href="https://zhub.link/tags/%D0%BF%D0%B0%D1%82%D1%87%D0%B8" class="mention hashtag" rel="tag">#патчи</a>

HabrСемантический поиск (homemade)Основой семантического поиска может являться ML задача Sentence Similarity , а если быть еще конкретнее, то это Semantic Textual Similarity . Модели, обученные под эту задачу, способны оценивать насколько близки предложения по своему смыслу. Всё, что нам дальше остается, так это засунуть модель в некоторую поисковую систему... Но тут давайте по порядку<a href="https://habr.com/ru/articles/834356/" target="_blank" rel="nofollow noopener noreferrer" translate="no">https://habr.com/ru/articles/834356/</a><a href="https://zhub.link/tags/%D1%81%D0%B5%D0%BC%D0%B0%D0%BD%D1%82%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B8%D0%B9_%D0%BF%D0%BE%D0%B8%D1%81%D0%BA" class="mention hashtag" rel="tag">#семантический_поиск</a> <a href="https://zhub.link/tags/%D0%BC%D0%B0%D1%88%D0%B8%D0%BD%D0%BD%D0%BE%D0%B5_%D0%BE%D0%B1%D1%83%D1%87%D0%B5%D0%BD%D0%B8e" class="mention hashtag" rel="tag">#машинное_обучениe</a> <a href="https://zhub.link/tags/%D0%BE%D0%B1%D1%80%D0%B0%D0%B1%D0%BE%D1%82%D0%BA%D0%B0_%D0%B5%D1%81%D1%82%D0%B5%D1%81%D1%82%D0%B2%D0%B5%D0%BD%D0%BD%D0%BE%D0%B3%D0%BE_%D1%8F%D0%B7%D1%8B%D0%BA%D0%B0" class="mention hashtag" rel="tag">#обработка_естественного_языка</a> <a href="https://zhub.link/tags/nlp" class="mention hashtag" rel="tag">#nlp</a> <a href="https://zhub.link/tags/bert" class="mention hashtag" rel="tag">#bert</a> <a href="https://zhub.link/tags/machine_learning" class="mention hashtag" rel="tag">#machine_learning</a> <a href="https://zhub.link/tags/sentence_transformer" class="mention hashtag" rel="tag">#sentence_transformer</a> <a href="https://zhub.link/tags/transformers" class="mention hashtag" rel="tag">#transformers</a> <a href="https://zhub.link/tags/deep_learning" class="mention hashtag" rel="tag">#deep_learning</a> <a href="https://zhub.link/tags/ai" class="mention hashtag" rel="tag">#ai</a>

Habr[Перевод] Повышение эффективности ИИ с помощью непрерывного обучения в MLOpsВ динамичном мире MLOps (операций машинного обучения) непрерывное обучение (Continuous Training, CT) выделяется как ключевая практика, позволяющая моделям ИИ сохранять пиковую производительность в производстве. Суть CT заключается в автоматизации повторного обучения моделей, обеспечивая их адаптацию в реальном времени к новым данным и изменяющимся паттернам. Этот превентивный подход не только повышает точность моделей, но и делает их устойчивыми к сдвигам данных, обеспечивая истинную адаптивность и готовность к будущему ИИ-экосистемы.<a href="https://habr.com/ru/articles/793984/" target="_blank" rel="nofollow noopener noreferrer" translate="no">https://habr.com/ru/articles/793984/</a><a href="https://zhub.link/tags/ai" class="mention hashtag" rel="tag">#ai</a> <a href="https://zhub.link/tags/%D0%B8%D1%81%D0%BA%D1%83%D1%81%D1%81%D1%82%D0%B2%D0%B5%D0%BD%D0%BD%D1%8B%D0%B9_%D0%B8%D0%BD%D1%82%D0%B5%D0%BB%D0%BB%D0%B5%D0%BA%D1%82" class="mention hashtag" rel="tag">#искусственный_интеллект</a> <a href="https://zhub.link/tags/%D0%BC%D0%B0%D1%88%D0%B8%D0%BD%D0%BD%D0%BE%D0%B5_%D0%BE%D0%B1%D1%83%D1%87%D0%B5%D0%BD%D0%B8e" class="mention hashtag" rel="tag">#машинное_обучениe</a>

HabrУмная рыбалка: как мы учим ML работать с фишингомВсем привет! Меня зовут Мария Анисимова, я программист-исследователь команды машинного обучения Антиспама Почты Mail.ru В этой статье я хочу рассказать вам о фишинге. И о том, как мы с ним боремся. Фишинговые атаки стали популярны с момента появления электронной почты. Это один из самых распространённых способов, которые хакеры используют для вторжения в учётные записи и социальные сети своих жертв. Только за октябрь 2023 года системы Антиспама Почты Mail.ru заблокировали 2 140 000 фишинговых писем, при том что три года назад за месяц их насчитывалось 1 140 000. Не только количество, но и качество фишинговых писем ежедневно улучшается, растёт и количество потенциальных жертв.<a href="https://habr.com/ru/companies/vk/articles/778428/" target="_blank" rel="nofollow noopener noreferrer" translate="no">https://habr.com/ru/companies/vk/articles/778428/</a><a href="https://zhub.link/tags/ml" class="mention hashtag" rel="tag">#ml</a> <a href="https://zhub.link/tags/antifraud" class="mention hashtag" rel="tag">#antifraud</a> <a href="https://zhub.link/tags/%D1%84%D0%B8%D1%88%D0%B8%D0%BD%D0%B3" class="mention hashtag" rel="tag">#фишинг</a> <a href="https://zhub.link/tags/%D0%B0%D0%BD%D1%82%D0%B8%D1%84%D0%B8%D1%88%D0%B8%D0%BD%D0%B3" class="mention hashtag" rel="tag">#антифишинг</a> <a href="https://zhub.link/tags/%D0%B0%D0%BD%D1%82%D0%B8%D1%81%D0%BF%D0%B0%D0%BC" class="mention hashtag" rel="tag">#антиспам</a> <a href="https://zhub.link/tags/automl" class="mention hashtag" rel="tag">#automl</a> <a href="https://zhub.link/tags/%D0%BC%D0%B0%D1%88%D0%B8%D0%BD%D0%BD%D0%BE%D0%B5_%D0%BE%D0%B1%D1%83%D1%87%D0%B5%D0%BD%D0%B8e" class="mention hashtag" rel="tag">#машинное_обучениe</a>

HabrГенеративный ИИ — это просто «замыленный JPEG интернета», который убедительно косит под интеллектИИ чат-боты любят ловить глюки и выдавать всякую чушь. Так массово, что словом 2023 года признали "галлюционировать". В чем причина такого явления? Является ли генеративный ИИ интеллектом (спойлер - и да, и нет)? И что общего у ChatGPT и копировального аппарата Xerox? Разбираемся, осмысляя неочевидный нюанс в логике работы больших языковых моделей.<a href="https://habr.com/ru/articles/775788/" target="_blank" rel="nofollow noopener noreferrer" translate="no">https://habr.com/ru/articles/775788/</a><a href="https://zhub.link/tags/%D0%B8%D1%81%D0%BA%D1%83%D1%81%D1%81%D1%82%D0%B2%D0%B5%D0%BD%D0%BD%D1%8B%D0%B9_%D0%B8%D0%BD%D1%82%D0%B5%D0%BB%D0%BB%D0%B5%D0%BA%D1%82" class="mention hashtag" rel="tag">#искусственный_интеллект</a> <a href="https://zhub.link/tags/%D0%B8%D0%B8" class="mention hashtag" rel="tag">#ии</a> <a href="https://zhub.link/tags/llm" class="mention hashtag" rel="tag">#llm</a> <a href="https://zhub.link/tags/%D1%8F%D0%B7%D1%8B%D0%BA%D0%BE%D0%B2%D1%8B%D0%B5_%D0%BC%D0%BE%D0%B4%D0%B5%D0%BB%D0%B8" class="mention hashtag" rel="tag">#языковые_модели</a> <a href="https://zhub.link/tags/gpt" class="mention hashtag" rel="tag">#gpt</a> <a href="https://zhub.link/tags/chatgpt" class="mention hashtag" rel="tag">#chatgpt</a> <a href="https://zhub.link/tags/jpeg" class="mention hashtag" rel="tag">#jpeg</a> <a href="https://zhub.link/tags/%D0%BC%D0%B0%D1%88%D0%B8%D0%BD%D0%BD%D0%BE%D0%B5_%D0%BE%D0%B1%D1%83%D1%87%D0%B5%D0%BD%D0%B8e" class="mention hashtag" rel="tag">#машинное_обучениe</a> <a href="https://zhub.link/tags/%D0%B3%D0%B5%D0%BD%D0%B5%D1%80%D0%B0%D1%82%D0%B8%D0%B2%D0%BD%D1%8B%D0%B5_%D0%BC%D0%BE%D0%B4%D0%B5%D0%BB%D0%B8" class="mention hashtag" rel="tag">#генеративные_модели</a> <a href="https://zhub.link/tags/%D0%B3%D0%B0%D0%BB%D0%BB%D1%8E%D1%86%D0%B8%D0%BD%D0%B0%D1%86%D0%B8%D0%B8" class="mention hashtag" rel="tag">#галлюцинации</a>

Recent searches

Search options

Administered by:

Server stats:

#машинное_обучениe