内容一模一样的两份文档,为什么会有格式的区别?同样是Word,发给了对方,但对方打不开。原来,即使同样是Word,有的结尾是doc,有的却是docx,前者是二进制,后者是XML格式,在内部结构、功能支持及兼容性等方面都存在着显著差异。
doc是Microsoft Word 97-2003版本所使用的默认文件格式,以二进制形式存储,包括文本、图像、格式设置等信息。虽然具有较强的稳定性和兼容性,但是在编辑和保存时容易出现乱码、格式丢失等问题,也不利于文件内容的检索和修改。而docx作为2007版以后的默认文件格式,采用了基于XML的开放文件格式,实际上是一个压缩文件,其中包含了多个文件和文件夹,以XML和ZIP格式存储文本、图像、样式等信息。相比doc的体积更小,访问速度更快。
同理,Excel表格的xls和xlsx也是二进制形式和XML的开放文件区别,xls最大支持65,536行、256列,而xlsx格式的文件最大支持1048576行、16384列,支持更多的函数和公式,更多的条件格式、数据验证、图标类型等,且采用了新加密算法,相比xls更加安全,格式的体积也较xls更小。
再分享一个Word文档如何一键提取图片的方法,当把docx格式改成rar后,它会自动变成一个“压缩文件”,点击提取压缩包后,找到“media”文件夹,即可获得Word文档内所有的图片和音频素材,还不会影响图片的质感,更能加快提取速度。如果不追求图片质量,那么,可以直接将Word文档另存为网页格式,也能“一键”获得所有图片素材。
领取专属 10元无门槛券
私享最新 技术干货