Сообщение от MoKa
У нас была подобная задача, нужно было из pdf вытянуть данные с таблицы.
Сделал так:
1. Конвертируешь PDF в excel (в твоём случае таблицу в excel).
2. Сохраняешь excel как html.
3. Грузишь страницу ajax'ом и вытягиваешь данные автономно из элементов по шаблону используя jquery.
4. Сразу пихаешь куда нужно.
Звучит громоздко, но когда у меня было 70 разных pdf, пару часов на такую тулзу - стоили чтобы автоматизировать процесс работы с данными.
Вариантов куча.
Если из excela работать, будет проще, чем из дока.
|
А где автор говорил, что у него именно таблица?
Олсо вместо сохранения excel как html можно схоронять excel как csv, его парсить в десяток раз удобней. А на PHP (если автор юзает его) есть уже и готовые решения.