由于文件编码检测准确性没有100%,所以转换之前会对源文件生成备份,后缀为.bak,如果发现转换失败,可以手动恢复。
MD5:F83DC829C6718B389BF0CB1193A1400E。
批量转换文件编码命令行版实用性很强,工具用Python写成,使用了开源框架chardet,欢迎下载体验。
软件特点:
1.用Kindle原版系统的童鞋会知道,国内的txt大部分都是gb2312编码,在Kindle上识别不是太好,一些文本编辑工具,比如Notepad++,也可以转换文本文件格式,但是只能一个一个转换不太方便。有了toolbox_detector,就方便多了,把所有要转换的文件放在一起,一下子全部就转换成需要的格式了,很方便。
2.编译过网上开源代码的童鞋,尤其是编译过UltimateToolbox的童鞋更加清楚,下载下来的源代码,总是因为codepage问题,无法编译,并且源文件动辄就是几十上百个,用Notepad++一个一个转换格式,非疯掉不可。
使用说明:
ToolBox系列工具之文件编码转换
语法如下:
path-etarget_encoding
路径-e目标文件编码
输入根目录(文件夹或者文件),会自动遍历子文件夹。
本工具使用Python完成,用到了
chardet http://pypi.python.org/pypi/chardet
upx压缩http://sourceforge.net/projects/upx/
时间有限,比较简陋,以后有时间慢慢完善。
本软件主要用于:
1.使用Kindle原版系统的用户。国内txt基本都是清一色的gb2312编码,放在Kindle里面兼容性不太好,有时候下载了好多书籍,需要一本一本转换,比较麻烦。
2.喜欢开源的同行们。网上开源的源码很大一部分都是国外的,下载下来编译总是出现各种问题,编译过UltimateToolbox的童鞋肯定深有体会。
支持的格式有:
Big5, GB2312/GB18030, EUC-TW, HZ-GB-2312, and ISO-2022-CN (Traditional and Simplified Chinese)
EUC-JP, SHIFT_JIS, and ISO-2022-JP (Japanese)
EUC-KR and ISO-2022-KR (Korean)
KOI8-R, MacCyrillic, IBM855, IBM866, ISO-8859-5, and windows-1251 (Russian)
ISO-8859-2 and windows-1250 (Hungarian)
ISO-8859-5 and windows-1251 (Bulgarian)
windows-1252
ISO-8859-7 and windows-1253 (Greek)
ISO-8859-8 and windows-1255 (Visual and Logical Hebrew)
TIS-620 (Thai)
UTF-32 BE, LE, 3412-ordered, or 2143-ordered (with a BOM)
UTF-16 BE or LE (with a BOM)
UTF-8 (with or without a BOM)
ASCII