Python判断图片真实类型
仅仅根据文件后缀判断文件类型显然不准,在python有一个内置模块imghdr可以用来判断图片的真实类型。代码如下:
1import imghdr
2imgType = imghdr.what(imageFile)
将会输出gif,png,jpeg等图片类型 。其原理是通过读取文件的开头的一段字符进行类型匹配 。具体查看了下代码,imageFile只能是本地文件,不可以是url 远程文件。具体可以个修改下该模块,使其支持远程文件。
使用场景:
经常在抓取一些站点上的图片时,有些站点上的图片直接是不带文件类型的,如:http://segmentfault.com/img/bVksck ,可以通过该模块进行抓取后,为文件增加相应的后缀名,而如果发现抓取的文件不是图片类型文件时进行删除(避免抓到别人修改过的图片木马),以下是一个简单的判断删除示例:
1import imghdr,os
2#filename = 'img.py'
3filename = 'bVksck'
4imgType = imghdr.what(filename)
5if imgType:
6 print imgType
7 newName = (filename + '.' + imgType)
8 os.rename(filename,newName)
9else:
10 print 'the file is not a pic,rm it now'
11 os.remove(filename)
捐赠本站(Donate)
如您感觉文章有用,可扫码捐赠本站!(If the article useful, you can scan the QR code to donate))
- Author: shisekong
- Link: https://blog.361way.com/python-judge-imgtype/4017.html
- License: This work is under a 知识共享署名-非商业性使用-禁止演绎 4.0 国际许可协议. Kindly fulfill the requirements of the aforementioned License when adapting or creating a derivative of this work.