各位用户为了找寻关于Python简单检测文本类型的2种方法【基于文件头及cchardet库】的资料费劲了很多周折。这里教程网为您整理了关于Python简单检测文本类型的2种方法【基于文件头及cchardet库】的相关资料,仅供查阅,以下为您介绍关于Python简单检测文本类型的2种方法【基于文件头及cchardet库】的详细内容
本文实例讲述了Python简单检测文本类型的方法。分享给大家供大家参考,具体如下:
1、根据文件头。
? 1 2 3 4 5#是否为带BOM头的UTF8文件
def
IsUtf8BomFile(pathfile):
if
b
'xefxbbxbf'
=
=
open
(pathfile, mode
=
'rb'
).read(
3
)):
return
True
return
False
2、用cchardet库。
? 1 2 3>>>
import
cchardet
>>> cchardet.detect(
open
(pathfile,
'rb'
).read())
{
'encoding'
:
'UTF-8'
,
'confidence'
:
0.9900000095367432
}
希望本文所述对大家Python程序设计有所帮助。