PDF в текст

Локально

Извлеките текстовый слой из PDF в TXT локально в браузере — без OCR.

Перетащите PDF сюда или нажмите для выбора

Только PDF, не более 100 МБ

Файл не уходит на сервер — обработка в вашем браузере

Извлекаем только уже существующий текстовый слой PDF. Сканированные страницы и картинки без OCR не распознаются.

Получите обычный TXT из PDF-документа с текстовым слоем: удобно для копирования, поиска, черновой обработки и переноса текста в редактор.

Файл обрабатывается локально, в вашем браузере — PDF не загружается на сервер. Инструмент честно не обещает OCR: если документ состоит из сканов или картинок, вы увидите понятное сообщение вместо пустого “успеха”.

Как это работает

  1. Загрузите PDF

    Выберите PDF-файл или перетащите его в область загрузки.

  2. Нажмите «Извлечь текст»

    Браузер прочитает текстовый слой локально, без отправки файла на сервер.

  3. Проверьте предпросмотр

    Если текста нет или его очень мало, инструмент объяснит, что PDF может быть сканом или картинкой.

  4. Скачайте TXT

    Скачайте извлечённый текст как обычный .txt-файл.

Частые вопросы

Файл отправляется на сервер?
Нет. PDF читается прямо в браузере через pdf.js, файл не загружается на сервер. Проверить это можно в DevTools → Network.
Работает ли инструмент со сканами?
Нет. MVP извлекает только существующий текстовый слой. Для сканов и картинок нужен OCR, он может появиться отдельной задачей после проверки спроса и стоимости вычислений.
Почему результат может быть пустым?
Если PDF выглядит как текст, но внутри это изображение страницы, текстового слоя нет. В таком случае инструмент покажет объяснение про скан/картинку.
Сохраняются ли таблицы и форматирование?
Нет. На выходе простой .txt. Порядок строк зависит от структуры PDF и возможностей pdf.js; сложная вёрстка, колонки и таблицы могут переноситься неидеально.
Поддерживаются ли PDF с паролем?
Нет. Сначала снимите пароль или шифрование, затем извлекайте текст.

Другие инструменты pdfy

Нужен другой инструмент?Все PDF-инструменты →