Как вытащить таблицу из PDF в Excel
price_list_2026.pdf: 9 страниц, таблица с артикулами, ценами и остатками. Руками перебивать скучно, копировать из просмотрщика в Excel получается кашей, потому что PDF хранит не таблицу, а текстовые блоки на странице. Визуально это сетка. Внутри - не всегда.
Ниже встроен конвертер PDF → Excel. Он отправляет PDF на серверный LibreOffice и возвращает .xlsx. Лимит - 50 МБ. Если в PDF есть живой текст, шанс на полезный результат нормальный. Если это скан, магии не будет.
Перетащите PDF сюда или нажмите для выбора
Только PDF, не более 50 МБ
Файл удаляется сразу после обработки · HTTPS
Почему PDF не любит таблицы
Excel хранит ячейки: A1, B1, формулы, типы данных, ширину колонок. PDF хранит страницу. Он знает, где на листе нарисовать слово Итого, где поставить линию, где вывести число 12 480. Связи "это одна строка таблицы" внутри может вообще не быть.
Поэтому конвертация PDF в Excel почти всегда является восстановлением, а не простым сохранением в другой формат. Конвертер смотрит на текстовые координаты и пытается угадать структуру. Иногда угадывает хорошо: простая таблица, одинаковые колонки, нормальные отступы. Иногда нет: многострочные названия товаров, объединённые ячейки, подписи мелким шрифтом, две таблицы рядом.
Сканы - отдельная история. Если PDF состоит из картинок, там нет текста, который можно положить в Excel. Нужен OCR: Tesseract, Acrobat, ABBYY или другой распознаватель. Текущий инструмент OCR не делает. Он честно пытается конвертировать то, что уже является текстовым PDF.
Что получается на практике
В хороших случаях вы получаете XLSX, который можно быстро почистить: переименовать лист, подтянуть ширину колонок, проверить суммы, удалить пустые строки. Это уже сильно быстрее, чем набирать 300 позиций руками.
В плохих случаях Excel открывается, но таблица выглядит как после аварийного копипаста. Заголовки съехали, числа стали текстом, часть строк разбилась на две. Такой файл всё равно может быть полезен, если нужно вытащить сырой текст. Но если потом по нему считать деньги, проверка обязательна.
Мне нравится простое правило: автоматике можно доверить черновик, но не финальные цифры. После конвертации смотрите первую страницу, последнюю страницу и пару строк в середине. Если в PDF была колонка НДС, она должна остаться отдельной колонкой, а не приклеиться к сумме.
Когда лучше не мучить PDF
Если источник у вас под контролем, попросите нормальный .xlsx или экспорт CSV. PDF хорош для отправки и печати, но плох как контейнер данных. Особенно для прайсов, актов сверки, банковских выписок и всего, где одна потерянная строка стоит дороже пяти минут переписки.
Если другого источника нет, конвертер экономит первый грубый проход. Дальше нужна взрослая проверка: суммы, разделители, пустые строки, переносы в названиях. PDF в Excel - это не кнопка "сделать бухгалтерию", а способ не начинать с пустого листа.
Частые вопросы
- Можно ли превратить любой PDF в Excel?
- Нет. Лучше всего работают PDF с текстовым слоем и простой таблицей. Скан без OCR, сложная верстка, многострочные ячейки и объединённые колонки часто дают слабой результат.
- Сервис делает OCR?
- Нет. Текущий конвертер использует LibreOffice и не распознаёт текст на изображениях. Если PDF является сканом, сначала нужен OCR.
- Файл обрабатывается локально?
- Нет. PDF в Excel отправляется на серверный LibreOffice, потому что браузерный парсинг таблиц из PDF даёт слишком много случайных результатов.
- Что проверить в готовом XLSX?
- Сверьте заголовки, суммы, десятичные разделители и строки с переносами. Автоматическая конвертация экономит набор руками, но не заменяет проверку данных.