有时候看到好看的图表想做slides使用,或者写综述需要用到别人的图,如何将图片提取出来。万能的截图肯定可以,但是会损失清晰度,那么有没有什么方法可以将图片完美地提取出来。

首先,如果插入的图片是png,jpeg等格式,它嵌入pdf时应该是整个二进制文件放进去,所以也可以再提取出来,这里我们使用poppler的pdfimages命令

1
pdfimages -f [start page number] -l [last page number] -png file.pdf ./prefix

这个命令表示将file.pdf的从[start page number]到[last page number]中的图片提取出来并且保存为png格式,文件名以prefix开始编号,如prefix-000.png,prefix-001.png.

如果图片是pdf格式,那么只能通过pdf裁剪,第一步提取出要裁剪的页面,这里用pdftk命令

1
pdftk file.pdf cat [page number] output out.pdf

这个命令表示将file.pdf的第[page number]页提取出来并且保存为out.pdf. pdf裁剪暂时没找到好用的cli工具,不过cli工具也要设置裁剪的坐标,所以可能还是GUI程序更适合这种工作,那么我们可以用adobe acrobat或者foxit pdf editor来做,以foxit为例(因为学校买了这个授权),点击菜单栏organize->crop pages,然后拖动裁剪框保存即可。