java 编解码
2021-06-20 02:04
标签:表示 世界 encode 出现 bsp sci 繁体中文 ansi info decoder:解码--> 将文件内容转换为字符对象; encoder:编码-->将字符对象转换为字节或者字节数组; ASCII (American Standard for Information Tnterchange ) 使用7 bit 表示一个字符,共计表示128字符 ISO-8859-1 :八bit 表示一个字符 ,即用一个字节表示一个字符 ,表示256个字符 gb2312: 中华人民共和国制定, 两个字节表示一个汉字,没有考虑生僻字,表示汉字不全(中国制定) gbk : gb2312 扩展,表示汉字数量超过gb2312(中国制定) gb18030 :对gbk 扩展;(中国制定) big5 :繁体中文 unicode :表示全世界的所有字符,统一的采用两个字节表示一个字符; 问题出现:存储容量问题出现,原来一个字节表示的字符,现在用两个,容量堪忧 UTF(unicode Transiation Format 即unicode 转换格式),是一种存储格式 unicode 是一个编码方式,而UTF 是存储方式,UTF-8 是unicode的实现方式之一 UTF-8 :变长的字节表示形式,意思就是,一个英文我就占用1个字节,汉字就三个字节方式存储 java 编解码 标签:表示 世界 encode 出现 bsp sci 繁体中文 ansi info 原文地址:https://www.cnblogs.com/iscys/p/9689676.html