Фиоретти М. Обработка документов [Текст] : ODF: Вытянем данные из OOo / Марко Фиоретти // Linux Format. — 2009. — № 9 (122), сент.. — С. 60-63. — (Анализ документов. Учебник) (Обработка документов. Учебник). — Прил.: "ODF: что внутри?" : [Документ ODF являет собой zip-архив с картинками и макросами в собственных каталогах, а сам текст – записанный в формате XML – находится в файле с именем content.xml, а отсюда следует, что можно очень просто найти или изменить те части содержимого, которые интересуют пользователя, открыв архив, изменив текст в content.xml, поместив новые картинки в их каталог и запаковав вновь]. — С. 60 ; "Как извлечь и обработать изображения из ODF-файлов" : [Изображение] : [Схема]. — С. 61 ; "Взаимодействие с ODF" : [MS Office, проприетарные форматы и ODF]. — С. 63.
Аннотация
Мы уже научились генерировать электронные таблицы, текст и презентации ODF. Теперь рассмотрим другую проблему: как работать с уже существующими ODF-файлами? А именно, как извлечь и использовать содержащуюся в них информацию? Cитуаций, когда нужно открыть ODF-файл и поработать с его содержимым, множество. Три самые типичные из них – обработка изображений, поиск или анализ текста и извлечение метаданных. Все эти ситуации подробно рассмотрены.