Вот я неоднократно слышал, что *.docx = zip-архив с xml, описывающем структуру объектов внутри архива. Так же читал, что в *.doc архивация не используется, а структуру сложно назвать как-то обобщённо упорядоченной.
И вот сегодня я случайно обнаружил, что 7zip (
http://ru.wikipedia.org/wiki/7-Zip), открывает *.doc как контейнер, содержащий несколько файлов.
Так всё-таки: word уже давно сохранят doc как контейнер (с архивацией?), содержащий в себе несколько объектов, или это "происки" 7zip, который как-то парсит файл, выделяя в нём логические объекты, и представляет их как отдельные item-ы внутри контейнера.