Тема: парсить DOC
Показать сообщение отдельно
Старый 10.06.2012, 17:59   #5
ABTOMAT
Ференька
 
Аватар для ABTOMAT
 
Регистрация: 26.01.2007
Адрес: улица Пушкина дом Колотушкина
Сообщений: 10,743
Написано 5,461 полезных сообщений
(для 15,676 пользователей)
Ответ: парсить DOC

Сообщение от MoKa Посмотреть сообщение
У нас была подобная задача, нужно было из pdf вытянуть данные с таблицы.
Сделал так:
1. Конвертируешь PDF в excel (в твоём случае таблицу в excel).
2. Сохраняешь excel как html.
3. Грузишь страницу ajax'ом и вытягиваешь данные автономно из элементов по шаблону используя jquery.
4. Сразу пихаешь куда нужно.

Звучит громоздко, но когда у меня было 70 разных pdf, пару часов на такую тулзу - стоили чтобы автоматизировать процесс работы с данными.

Вариантов куча.
Если из excela работать, будет проще, чем из дока.
А где автор говорил, что у него именно таблица?
Олсо вместо сохранения excel как html можно схоронять excel как csv, его парсить в десяток раз удобней. А на PHP (если автор юзает его) есть уже и готовые решения.
__________________
Мои проекты:
Анальное Рабство
Зелёный Слоник
Дмитрий Маслов*
Различие**
Клюква**

* — в стадии разработки
** — в стадии проектирования
Для проектов в стадии проектирования приведены кодовые имена

(Offline)
 
Ответить с цитированием
Сообщение было полезно следующим пользователям:
moka (10.06.2012)