zhub.link is one of the many independent Mastodon servers you can use to participate in the fediverse.

Administered by:

Server stats:

28
active users

#распознавание_текста

3 posts3 participants0 posts today

Решение задач распознавания на Flutter

Задачи распознавания изображений и звука имеют широкий спектр применений в различных приложениях. Используя Flutter, как мощный фреймворк для разработки кроссплатформенных мобильных приложений, вполне возможно реализовать функционал распознавания данных в несколько шагов. В этой статье мы рассмотрим некоторые из задач распознавания, такие как распознавание лиц, текста и звука, и приведем фрагменты кода и рекомендуемые библиотеки для их реализации на Flutter.

habr.com/ru/articles/890700/

ХабрРешение задач распознавания на FlutterЗадачи распознавания изображений и звука имеют широкий спектр применений в различных приложениях. Используя Flutter, как мощный фреймворк для разработки кроссплатформенных мобильных приложений, вполне...

Модели T-lite и T-pro: training report

Привет! Я Дима Стоянов, MLE в команде разработки фундаментальных моделей. Мы продолжаем рассказывать о наших моделях T-lite и T-pro. Общие характеристики и результаты бенчмарков описывали в предыдущей публикации. В этой статье раскроем детали предобучения: от подготовки данных до финальных экспериментов, а совсем скоро поделимся особенностями этапа post-training.

habr.com/ru/companies/tbank/ar

ХабрМодели T-lite и T-pro: training reportПривет! Я Дима Стоянов, MLE в команде разработки фундаментальных моделей. Мы продолжаем рассказывать о наших моделях T-lite и T-pro. Общие характеристики и результаты бенчмарков описывали в предыдущей...

Модели T-lite и T-pro: training report

Привет! Я Дима Стоянов, MLE в команде разработки фундаментальных моделей. Мы продолжаем рассказывать о наших моделях T-lite и T-pro. Общие характеристики и результаты бенчмарков описывали в предыдущей публикации. В этой статье раскроем детали предобучения: от подготовки данных до финальных экспериментов, а совсем скоро поделимся особенностями этапа post-training.

habr.com/ru/companies/tbank/ar

ХабрМодели T-lite и T-pro: training reportПривет! Я Дима Стоянов, MLE в команде разработки фундаментальных моделей. Мы продолжаем рассказывать о наших моделях T-lite и T-pro. Общие характеристики и результаты бенчмарков описывали в предыдущей...

Методы распознавания матерных (и не только) языков

Всем привет! Меня зовут Миша, я работаю Backend-разработчиком в Doubletapp . В одном из проектов появилась фича по добавлению тегов по интересам. Любой пользователь может создать интерес, и он будет виден всем остальным. Неожиданно (!!!) появились интересы с не очень хорошими словами, которые обычно называют матерными. Встала задача по распознаванию языка с матерными словами, чтобы исключить возможность добавления гадости в наш огород!

habr.com/ru/companies/doubleta

ХабрМетоды распознавания матерных (и не только) языковВсем привет! Меня зовут Миша, я работаю Backend-разработчиком в Doubletapp . В одном из проектов появилась фича по добавлению тегов по интересам. Любой пользователь может создать интерес, и он будет...

Адские условия: Самый суровый краш-тест технологии распознавания паспорта

Как вы знаете, в ситуациях, когда необходимо быстро и безопасно обработать данные паспорта и любых других документов, технологии распознавания Smart Engines творят настоящие чудеса. Качеству и надежности нашей технологии доверяют лидеры цифровой трансформации: госведомства, ведущие банки, аэропорты, промышленность и бизнес. Мы ценим доверие наших клиентов, а для вас, дорогие читатели, решили наглядно показать эффективность наших систем. Так сказать, лучше один раз увидеть, чем сто раз услышать. Летс гоу!

habr.com/ru/companies/smarteng

ХабрАдские условия: Самый суровый краш-тест технологии распознавания паспортаКак вы знаете, в ситуациях, когда необходимо быстро и безопасно обработать данные паспорта и любых других документов, технологии распознавания Smart Engines творят настоящие чудеса. Качеству и...

Зачем Густаву Таушеку понадобились свои собственные перфокарты

Перфокарточная система для бухгалтерского и статистического учёта, барабанная магнитная память и машина для распознавания текста — это ключевые изобретения Густава Таушека, самоучки без формального образования. В истории вычислительной техники вообще много недооценённых или позабытых персоналий. Схема магнитной барабанной памяти Таушека из американского патента US2080100A 1937 года Перфокарты в то время были делом совершенно рядовым, но Таушек решил разработать свой формат, потому что под кастомную машину для бухучёта были нужны кастомные перфокарты. Ну и ещё потому что мог.

habr.com/ru/companies/gazpromb

ХабрЗачем Густаву Таушеку понадобились свои собственные перфокартыПерфокарточная система для бухгалтерского и статистического учёта, барабанная магнитная память и машина для распознавания текста — это ключевые изобретения Густава Таушека, самоучки без формального...

Методы предпроцессинга в IDP-системе ITFB EasyDoc

Всем привет! На связи команда Data Science компании ITFB Group. У нашей компании есть собственная разработка ITFB EasyDoc — система распознавания и извлечения данных из любого типа документов. В современном мире автоматизация обработки документов стала неотъемлемой частью множества бизнес-процессов. Предобработка изображений документов является важным шагом для обеспечения точности и надежности дальнейшего распознавания атрибутов. В этой статье мы хотим рассказать о некоторых эффективных методах предпроцессинга документов, позволяющих увеличивать как качество OCR-систем (Optical Character Recognition), так и различные CV и NLP пайплайны. Всем, кому интересна эта тема, — добро пожаловать под кат.

habr.com/ru/companies/itfb/art

ХабрМетоды предпроцессинга в IDP-системе ITFB EasyDocВсем привет! На связи команда Data Science компании ITFB Group. У нашей компании есть собственная разработка ITFB EasyDoc — система распознавания и извлечения данных из любого типа документов. В...

IDP и OCR в вопросах и ответах: Главное, что нужно знать

Когда мы готовили этот материал, долго спорили, с какими персонажами можно было бы для наглядности сравнить OCR и IDP. Предлагались братья Коэны, Тор и Локи, Цезарь и Брут и много кто еще. Как видите, к одному мнению на этот счет мы в Smart Engines так и не пришли. Зато абсолютное единство было достигнуто по другому вопросу - о природе OCR и IDP. И если с культурными сравнениями еще можно поспорить, то в технологическом аспекте мы знаем все по фактам. Опустим высокие метафоры и расскажем, что такое OCR и IDP и на чьей стороне правда. Узнать, где правда 🔍

habr.com/ru/companies/smarteng

ХабрIDP и OCR в вопросах и ответах: Главное, что нужно знатьПривет, Хабр! Сегодня прогоним пару телег про то, что из себя представляют IDP и OCR, в чем их принципиальное различие и на чьей стороне правда (и Smart Engines ). Без долгих вступлений - погнали! Для...

Создание искусственного датасета для обучения модели с использованием Paddle OCR

Привет, коллеги! Продолжаем тему разработки плагина для распознавания иврита с использованием Paddle OCR. В прошлый раз я забыла представиться, сделаю это в этом посте) Меня зовут Алексей, я руковожу компанией, которая занимается разработкой с применением ИИ-технологий. Сам я тоже погружен в разработку, но больше доверяю это своей команде – нам удалось собрать команду классных профи. Истории из нашей совместной работы я и планирую рассказывать в своем блоге. Вернемся к теме статьи. Сегодня остановимся подробнее на создании искусственного датасета для обучения модели с использованием Paddle OCR. Этим занимался мой коллега Александр – экспертв компьютерном зрении. Когда перед нами встала задача распознавания текста на иврите, стало ясно, что найти готовый датасет с нужными характеристиками практически невозможно. Это подтолкнуло нас к созданию собственного датасета, который оказался не только полезным, но и дал возможность потренироваться в генерации синтетических данных. В этом посте мы подробно расскажем, как именно подошли к этому процессу.

habr.com/ru/articles/839326/

ХабрСоздание искусственного датасета для обучения модели с использованием Paddle OCRПривет, коллеги! Продолжаем тему разработки плагина для распознавания иврита с использованием Paddle OCR. В прошлый раз я забыла представиться, сделаю это в этом посте) Меня зовут Алексей, я руковожу...

Автоматизация распознавания и подсчёта транзакций с изображений

Большинство процессов в нашем современном мире стремится к автоматизации. Хотелось бы разместить здесь свою наработку. Надеюсь данный материал найдёт своего читателя. В данной статье рассмотрим автоматизацию введения ежедневных отчетов компании.

habr.com/ru/articles/838328/

ХабрАвтоматизация распознавания и подсчёта транзакций с изображенийБольшинство процессов в нашем современном мире стремится к автоматизации. Хотелось бы разместить здесь свою наработку. Надеюсь данный материал найдёт своего читателя. В данной статье рассмотрим...

Создание плагина для распознавания текста на иврите: мой опыт и решения

Всем привет! Хочу поделиться недавним проектом, в котором я разрабатывал плагин для распознавания текста на иврите. Задача была непростая, особенно учитывая, что клиент уже пытался использовать Tesseract OCR, но точность распознавания оставляла желать лучшего. В этой статье расскажу о том, с какими трудностями я столкнулся и как их преодолел.

habr.com/ru/articles/836714/

ХабрСоздание плагина для распознавания текста на иврите: мой опыт и решенияВсем привет! Хочу поделиться недавним проектом, в котором я разрабатывал плагин для распознавания текста на иврите. Задача была непростая, особенно учитывая, что клиент уже пытался использовать...

Наш опыт применения AI-технологий для классификации документов для подачи в суд

Как мы создали, обучили и выпустили в свет сервис, использующий технологию машинного обучения для распознавания и классификации юридических документов? В этой статье мы расскажем об опыте разработки этого решения для автоматизации труда юристов и взыскателей, и о трудностях на этом пути.

habr.com/ru/articles/830796/

#OCR#NLP#cnn

Российской OCR – 30 лет. Вспоминаем, как появилась первая отечественная технология распознавания (Часть 1. OCR Tiger)

В 2023 году первой российской коммерческой технологии распознавания текста исполнилось ровно 30 лет . В честь этой знаковой даты мы решили подготовить серию материалов о том, когда появились и что из себя представляли первые отечественные OCR. Кто был главными участниками в гонке по созданию систем распознаванию? Как так вышло, что в середине 90-х OCR была признана второй по значимости софтовой разработкой после ОС? Как выглядела первая OCR-ка для Mac? Ответим на эти и многие другие вопросы, присаживайтесь поудобнее. Во время подготовки текстов мы побеседовали с директором по науке и душой нашей компании, доктором технических наук, профессором, членом-корреспондентом РАН Владимиром Львовичем Арлазаровым . Он – как, кстати, и еще несколько членов нашей команды Smart Engines – принимал непосредственное участие в создании первых систем автоматического ввода текста. Сегодня речь пойдет про OCR Tiger и про то, как эта система работает.

habr.com/ru/companies/smarteng

ХабрРоссийской OCR – 30 лет. Вспоминаем, как появилась первая отечественная технология распознавания (Часть 1. OCR Tiger)В 2023 году первой российской коммерческой технологии распознавания текста исполнилось ровно 30 лет . В честь этой знаковой даты мы решили подготовить серию материалов о том, когда появились и что из...