Двач.hk не отвечает.
Вы видите копию треда, сохраненную 15 ноября в 01:07.

Скачать тред: только с превью, с превью и прикрепленными файлами.
Второй вариант может долго скачиваться. Файлы будут только в живых или недавно утонувших тредах. Подробнее

Если вам полезен архив М.Двача, пожертвуйте на оплату сервера.
image192 Кб, 521x343
Проблема распознания 3231945 В конец треда | Веб
Програмач, подскажи. Гугл и ChatGPT не помогли.
Нужно распознавать много картинок с текстом, который может быть на русском, английском или смеси русского и английского. Есть ли решения, которые эффективно понимают что текст на русском или английском и не смешивают два языка, но при этом понимают что слово в русском тексте на английском?
2 3231997
>>31945 (OP)

>Есть ли решения, которые эффективно понимают что текст на русском или английском и не смешивают два языка


Claude 3.5 sonnet
https://familylocket.com/handwritten-text-recognition-by-claude-3-5-sonnet/
3 3232026
>>31997
Нет, мне нужно локальное решение, без привязки к интернету.
4 3232039
>>32026
Мда пиздец ты фрукт конечно. Тогда только на https://huggingface.co/ искать, оттуда качать и локально ставить. Иначе только OCR-библиотеки на гитхабе.
5 3232053
>>32039
Мне нужно распознавальщик типа Tesseract, но чтобы понимал как распозанвать текст на двух языках.
На huggingface я не знаю что искать, где, как это устанавливать...
6 3232063
>>32053
Бля там есть категория мультимодальных моделей, называется "image-text-to-text" https://huggingface.co/models?pipeline_tag=image-text-to-text&sort=trending и там в описании всё написано, они могут таблицы понимать, математические формулы, графики. Там надо искать подробнее. Мне-то это зачем? Мне это нахуй не надо. Я просто дал направление для дальнейшего поиска
7 3232089
>>32063
у меня программа на JS, я испольую tesseract.js
как всё это с huggingface использовать в JavaScript коде? я не понимат
8 3238206
EasyOCR может распознавать нормально мультиязычно только непонятно нужно ли ему нейромодель
9 3263508
>>31945 (OP)
Да, есть решения, которые распознают текст на русском, английском и смешанных языках. Они используют модели машинного обучения, которые обучены на больших наборах данных. Эти решения могут эффективно распознавать языки и не смешивать их, а также понимать слова на английском в русском тексте.
10 3263912
>>63508
Капчу тоже ИИ разгадывал? )
11 3296253
>>32089
Пошёл нахуй
Обновить тред
Двач.hk не отвечает.
Вы видите копию треда, сохраненную 15 ноября в 01:07.

Скачать тред: только с превью, с превью и прикрепленными файлами.
Второй вариант может долго скачиваться. Файлы будут только в живых или недавно утонувших тредах. Подробнее

Если вам полезен архив М.Двача, пожертвуйте на оплату сервера.
« /pr/В начало тредаВеб-версияНастройки
/a//b//mu//s//vg/Все доски