изображение.png1,2 Мб, 1200x628
Вычитка книг при помощи нейросетей - как сделать? # OP 1034613 В конец треда | Веб
Иногда сканирую старые книжки под себя и хочу сделать из сканов их же fb2 варианты, но времени на вычитку и редактуру нет, а нейросети очень неплохо справляются с небольшими блоками текста.
Так вот, хочу найти (или создать) готовый скрипт\программу, короче метод, при котором можно дать нейросети необработанный, голый текст сразу из файнридера, запакованный в фб2 или в докс как вариант, и чтоб в результате нейросеть (желательно, локально) все обработала, сделала вычитку, исправила все ошибки и лажу и выдала в результате готовую книгу с заголовками, с оглавлением, с форматированием, в общем чтоб все по феншую и заебись.
Есть такие варианты?
(я уже попробовал через те же нейросети писать скрипты для питона, но пока ниче толкового не вышло)
2 1034616
Поинтересуйся в /ai
3 1034622
>>4616
уже поинтересовался - пока не ответили
4 1034704
>>4613 (OP)
Я этим и занимаюсь, только в epub. Через deepseek. Промт
"Распознай текст с изображения. Убери нумерацию страниц. Результат выдай на русском языке."

Затем этот текст:

"Проверь текст на наличие неуместных иностранных символов и иероглифов - их не должно быть. Только русский перевод или научные термины. Выдай исправленный текст."

Потом

"Подготовь этот текст к интеграции в epub-книгу, добавив к ней html-теги. Не используй заголовки. Исходный текст не сокращай."
5 1034752
>>4704

>"Проверь текст на наличие неуместных иностранных символов и иероглифов - их не должно быть. Только русский перевод или научные термины. Выдай исправленный текст."


И сразу фейл мгновенный, если книга с цитатами и формулами, а также инфографикой.
image.png155 Кб, 1624x874
6 1034754
>>4704
Только сейчас узнал что FB2 по сути российский и нигде не используемый кроме как здесь формат.
7 1034818
>>4752
Я скинул основные промты, которыми обрабатывал тысячи страниц. Таблицы и формулы делаю отдельно. Изображения рисую в svg-формате.
8 1034857
>>4613 (OP)

> Есть такие варианты?



Я попробовал дать паре нейронок файл, и попросил сделать ёфикацию всего текста (худ.лит. на 300 килобайт, в формате .txt).

Интересовало именно выполнение задачи по обработке текста за один раз на относительно немалый объём.

Потом сел и стал читать-проверять от начала до конца, попутно исправляя промахи нейронки. Так вот - заебался исправлять. Работа сделана через пень-колоду, ошибок слишком дохуя.
Результат их работы нужно постоянно проверять и исправлять, а это ненамного быстрее, чем самому делать.

> (я уже попробовал через те же нейросети писать скрипты для питона, но пока ниче толкового не вышло)


Аналогично. "Что-то, как-то, работающее кое-как и недолго".
9 1037537
>>4613 (OP)
Ты хочешь, чтобы в один присест получилась конфетка. Так не бывает, ты наслушался рекламной хуйни в интернете, наивно жрёшь хайп большой ложкой. А вот встраивать пошагово действия можно. Например, распознавание текста большими универсальными моделями работает лучше традиционных решений, если у нас не сканы, а фото, или нестандартные шрифты и дизайн, или смесь алфавитов. Можно первый шаг отдать им. Дальше идёт проверка орфографии (традиционная), удаление лишних переносов, проверка пунктуации (лишних пробелов, заглавных букв после точек). Тут можно дополнительно прикрутить нейросеточку и проверить её жалобы на странные запятые и прочие сложные ситуации. Решения для «нормализации» в предложения каши из мелкобуквенного распознанного, например, по аудио, текста есть, вопрос в том, насколько они подходят к твоему материалу.

Вообще, надо понимать, что если твоя задача сделать точную копию оригинала до каждой буквы, то тебе не подойдут средства, выдающие усреднённый «гладкий» результат. Возможно, придётся тренировать какое-то решение на заготовленных идеальных образцах, а то и учить сравнивать со сканом. Это вероятно, домашнему пользователю не осилить.

А так распознаванием документов, и даже сложных форм, и даже заполненных от руки, занимается куча фирм. За деньги можно получить готовое решение, которое тебе страничку вместе со всем дизайном переведёт в любой формат и проверит.
Обновить тред
« /bo/В начало тредаВеб-версияНастройки
/a//b//mu//s//vg/Все доски

Скачать тред только с превьюс превью и прикрепленными файлами

Второй вариант может долго скачиваться. Файлы будут только в живых или недавно утонувших тредах.Подробнее