1、word 文档
我们用WPS创建一个简单的 word 文档如下:
一个 docx 文档是一个 zip 文件
,我们改其后缀名,再解压缩:
我们先看 word 目录中的document.xml
文件:
可以看到这个 document.xml 文件中有我们之前写的文本“测试文档”。还有很多 xml 标签:<w:body>
、<w:p>
、<w:r>
、<w:bookmarkStart>
等。
现在我们将 **“测试文档”**四个字改成“Hello Word”,保存,再将刚刚解压出来的所有目录再压缩成zip
文件,最后改后缀名为docx
,用 WPS 打开文档:
2、压缩包结构
这部分内容大家了解就可以了,我们操作 word 文档,主要是操作前面的 document.xml 文件。
前面的 test.zip 解压后的目录:
_rels目录:定义各部分间的引用关系。
docProps目录:该目录中记录的都是文档的属性信息,比如 word 文件最后修改时间、修改人等。这些信息应该是由 WPS 这些软件做写入读取。
[Content_Types].xml文件:定义样式文件、资源文件的路径。
word 目录:
这部分内容主要与文档内容相关。
theme 目录:定义当前文档的主题。
fontTable.xml:当前文档所使用的字体。
document.xml:文档内容。
media 目录:用于保存文档中的图片等。