Хочу поменять максимум болтов на Магне на оцинкованные или из нержавейки,
в связи с этим есть потребность собрать все размеры и количества.
Есть такая идея:
Могу написать программу - парсер, которая будет собирать по настраиваемым ключевым словам(болт, гайка, винт, шайба) строки из которых можно будет получить партнамбер, размеры...
Парсить желательно конечно из пдф документа, но нужны тогда пдф в хорошем качестве, где эти строки читаются посимвольно.
Для примера вот страница для предполагаемого парсинга
https://supermagna.ru/book/vf750c-v45-1988-carburetor-components
и строка:
19 SCREW-WASHER (4X16) 93892-04016-00 016 - 16 это штуки
Какие ваши мысли по этому поводу, вопросы, предложения может?
Поставьте плюсики если прога интересна, но сказать нечего, чтобы мне видеть есть ли интерес вообще в этом. Ато меня может залениветь и просто выпишу себе на бумажку под свою Магну.
UPD: Проблема .pdf файлов в том что старые файлы это картинка а не файл с текстом, определить это у конкретного файла можно попробовав выделить текст мышкой, если выделяется и можно скопировать то файл - скорее всего "хороший".