提取PPT与Word里的所有图片

2020/04/13
共 510 字
约 1 分钟
归档: 技术
标签: office

你可能会用上的技巧


简短的教程

如果有一天,你需要提取一个PPT或者word里面的所有图片,你可以这么做,以PPT为例:

  1. 复制一份,修改后缀为zip(不显示后缀的自己去百度)

  2. 解压这个压缩包

  3. 解压后可以看到类似以下的目录,图片在PPT/media中

同理,如果是word则在word/media中

如果是2003版本的office文件,解压后将会是没有后缀的文件:

这是因为新版才使用了xml与zip技术

判断文件是旧版还是新版

97-03的是旧版,后缀如doc、ppt、xls

2007-现在的是新版,后准如docx、pptx、xlsx

没关系,只要电脑上的office是2007以及以上的版本,都可以把旧版转换为新版

打开文档,点击菜单栏的文件,可以看到有一个兼容模式的转换,点击转换,弹出提示,点击是,再ctrl+s保存一下,这时候文件就转换成了新版本,便可以接着改后缀解压的操作。

一个延伸

新版的office文档有着诸多看得到的好处,比方说

  • 同样内容的文件,因为采用了压缩技术,新版的体积更小

  • 最新版的PPT可以直接嵌套音频与视频,复制的时候不用复制文件夹

  • 刚刚的提取media的内容

其实epub也是一个压缩包,解压后基基本都是这样的目录结构

images中包含整本书的图片,text中包所有文字。

点进去text可以看到,其实每一个html就是一个章节,直接用浏览器打开即可查看,具体样式可以在两个css里面调整。懂前端的是不是瞬间就明白了。照这个思路写一个网页端的epub阅读器并没有多难,字体大小背景颜色,一系列调整完全可以用javascript实现。

我给自己挖了个巨坑。

留言

本站已运行
© 2024 Jack  由 Hexo 驱动
复制成功