加入收藏 | 设为首页 | 会员中心 | 我要投稿 我爱制作网_沈阳站长网 (https://www.024zz.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 服务器 > 搭建环境 > Linux > 正文

linux下文件编码的查看与转换 分享

发布时间:2023-01-13 12:46:10 所属栏目:Linux 来源:
导读:  通常来说,Windows中默认的文件格式是GBK(gb2312)linux编码,而Linux一般都是UTF-8,所以Linux下打开windows的文件会有乱码的情况。另外,有时要将文件进行编码转换,如将简体中文转换为繁体中文。

  基于
  通常来说,Windows中默认的文件格式是GBK(gb2312)linux编码,而Linux一般都是UTF-8,所以Linux下打开windows的文件会有乱码的情况。另外,有时要将文件进行编码转换,如将简体中文转换为繁体中文。
 
  基于以上情况,本文将就在linux下查看和转换文件的编码进行说明。
 
  1.查看文件的编码
 
  1)在Vim中可以直接查看文件编码
 
  :set fileencoding 即可显示文件编码格式。
 
  2)enca查看文件编码
 
  # enca filename 直接用enca加文件名查看
 
  # enca -L zh_CN filename
 
  注:enca对某些GBK编码的文件识别不是很好,识别时会出现:unrecognized encoding.
 
  2.转换文件的编码
 
  1)在Vim中直接进行转换文件编码,比如将一个文件转换成utf-8格式
 
  :set fileencoding=utf-8
 
  2)enconv 转换文件编码,比如要将一个GBK编码的文件转换成UTF-8编码,如:
 
  # enconv -L zh_CN -x UTF-8 filename
 
  # enca -L zh_CN -x UTF-8 < file1 > file2 不覆盖原文件
 
  3)iconv 转换,iconv的命令格式如下:
 
  # iconv -f encoding -t encoding inputfile
 
  # iconv -l 查询可用编码
 
  # for i in `find ./ -name *.html`;do echo $i;iconv -f gb2312 -t big5 $i -o /tmp/iconv.tmp;mv /tmp/iconv.tmp $i;done
 
  批量转换文件编码实例之一
 
  3.文件名编码转换
 
  Linux与windows间拷贝文件,有时文件名会出现乱码,是因为Windows的文件名中文编码默认为GBK,而Linux默认的文件名为UTF8。在Linux中有个工具,convmv,可以对文件名进行GBK和UTF的相互转换。
 
  用法:
 
  Convmv -f 源编码 -t 新编码 [option] filename
 
  安装enca
 
  下载相关rpm包。地址( )
 
  我下载的是:enca-1.10-1.el5.rf.i386.rpm和enca-devel-1.10-1.el5.rf.i386.rpm
 
  安装:
 
  # rpm -ivh enca-1.10-1.el5.rf.i386.rpm
 
  # rpm -ivh enca-devel-1.10-1.el5.rf.i386.rpm
 

(编辑:我爱制作网_沈阳站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!