java 编解码

2021-06-20 02:04

阅读:359

标签:表示   世界   encode   出现   bsp   sci   繁体中文   ansi   info   

decoder:解码--> 将文件内容转换为字符对象;

encoder:编码-->将字符对象转换为字节或者字节数组;

 

ASCII  (American Standard for Information Tnterchange )  使用7 bit 表示一个字符,共计表示128字符

ISO-8859-1 :八bit 表示一个字符 ,即用一个字节表示一个字符 ,表示256个字符

gb2312:  中华人民共和国制定, 两个字节表示一个汉字,没有考虑生僻字,表示汉字不全(中国制定)

gbk :  gb2312 扩展,表示汉字数量超过gb2312(中国制定)

gb18030  :对gbk 扩展;(中国制定)

big5 :繁体中文

unicode :表示全世界的所有字符,统一的采用两个字节表示一个字符; 问题出现:存储容量问题出现,原来一个字节表示的字符,现在用两个,容量堪忧

      UTF(unicode Transiation Format 即unicode 转换格式),是一种存储格式

 

    unicode 是一个编码方式,而UTF 是存储方式,UTF-8 是unicode的实现方式之一

UTF-8 :变长的字节表示形式,意思就是,一个英文我就占用1个字节,汉字就三个字节方式存储

    

java 编解码

标签:表示   世界   encode   出现   bsp   sci   繁体中文   ansi   info   

原文地址:https://www.cnblogs.com/iscys/p/9689676.html


评论


亲,登录后才可以留言!