Способ 1: Convertio
Распознавание текста из PDF-документа с дальнейшим сохранением в формате Word обычно не является чем-то сложным, за исключением ситуаций, когда страницы оформлены в виде рукописного ввода. В любом случае стоит попробовать онлайн-сервис Convertio, OCR-алгоритмы которого должны справиться с поставленной задачей.
- Обратите внимание на то, что незарегистрированным пользователям доступно только 10 страниц для расшифровки. Если хотите получить больше, создайте аккаунт, после чего переходите к следующему шагу.
- Нажмите кнопку «Выберите файлы» или перетащите PDF прямо на вкладку.
- Отыщите документ через «Проводник» и дважды кликните по нему ЛКМ.
- Ожидайте завершения его подготовки, поскольку только после этого список настроек станет активным.
- Выберите основной и дополнительные языки, использующиеся в документе. Сделать это нужно обязательно, чтобы их распознавание прошло корректно.
- Затем решите, хотите вы получить расшифровку всех страниц или некоторые нужно пропустить. Используйте подсказку на сайте (кнопка со знаком вопроса в этом же блоке), чтобы разобраться в правильном вводе последовательности.
- Затем убедитесь в том, что в качестве формата вывода установлен DOCX. По необходимости разверните список и вручную задайте формат.
- Нажмите кнопку «Распознать», запуская тем самым процесс обработки.
- Следите за прогрессом в отдельном поле, дожидаясь отображения результатов.
- Скачайте файл, щелкнув по кнопке с соответствующим названием.
- Откройте его через любой удобный текстовый редактор и прочитайте хотя бы несколько страниц, чтобы исключить возможные опечатки, которые чаще всего появляются при расшифровке рукописного ввода.
Способ 2: Soda PDF
Сразу отметим, что процесс расшифровки в Soda PDF происходит бесплатно, но для конвертирования в Word придется приобрести подписку на сайт. Связано это с тем, что онлайн-сервис предоставляет практически уникальные функции для редактирования PDF, которые отсутствуют в других веб-ресурсах. Предлагаем сначала ознакомиться с инструкцией и самостоятельно попробовать распознать блоки с текстом.
- Нажмите по ссылке выше для перехода на страницу с необходимым инструментом. На ней щелкните по «Выберите файл».
- Отыщите его через появившееся окно «Проводника» и дважды щелкните по нему ЛКМ.
- Ожидайте окончания выполнения, что может занять несколько минут в зависимости от количества страниц документа.
- Прочитайте распознанные надписи, убедившись в том, что это выполнено правильно.
- Если нужно изменить их, удалив лишнее или добавив буквы, активируйте функцию «Edit» и внесите требуемые корректировки. Как раз эта возможность и не присуща другим сайтам для работы с PDF, но для сохранения файла в исходном формате редактирование доступно бесплатно.
- Это же относится и к другим инструментам, выбор которых осуществляется через панель вверху.
- Для открытия параметров экспорта вызовите меню «Convert».
- Нажмите по кнопке «Export».
- Выберите вариант вывода в формате Word.
- Подтвердите конвертирование и следуйте появившимся на экране инструкциям. В них вы увидите предложение о покупке подписки с разными тарифными планами.
Способ 3: 2PDF
В качестве завершающего примера рассмотрим еще один бесплатный вариант с названием 2PDF, если предыдущие онлайн-сервисы вам не подходят. Перед процессом подготовки к распознаванию нужно учитывать тот факт, что не всегда алгоритмы сайта способны справиться с задачей корректно и без ошибок.
- Откройте требуемую страницу сайта и перетащите файл на вкладку. Можно нажать по области для выбора объекта через «Проводник». Учитывайте, что на сайте есть ограничение по обработке до 10 страниц.
- В «Проводнике» найдите PDF-файл для распознавания текста и выберите его.
- Укажите основной язык, выбрав подходящий из выпадающего списка.
- Если их несколько, щелкните по ссылке «Добавить язык» и снова выберите его из списка.
- Формат вывода по умолчанию должен быть установлен правильно, но если это не так, откройте список и отыщите там «Microsoft Word Document (.docx)».
- Остается только запустить распознавание, щелкнув по «Распознавать».
- Обработка займет некоторое время — не закрывайте вкладку до ее завершения, иначе прогресс будет сброшен. Вы увидите кнопку для скачивания, по которой и следует нажать.
- Обязательно откройте файл через текстовый редактор и прочитайте весь текст. По необходимости исправьте опечатки, удалите лишние абзацы и пробелы.