常见乱码产生原因
2023年8月13日...大约 1 分钟
常见乱码产生原因
常见乱码产生原因
名称 | 示例 | 特点 | 原因 |
---|---|---|---|
古文码 | 浜屽紶涓夋潕鍥旇档鍏 | 大多为不认识的古文,夹杂日韩文 | 以GBK方式读取UTF-8编码的中文 |
方块码 | ������� | 大部分字符为方块问号 | 以UTF-8方式读取GBK编码的中文 |
符号码 | å¼ä¸æåçäºèµµèä¸ | 大部分字符为各种符号 | 以ISO8859-1方式读取UTF-8编码的中文 |
拼音码 | ÕÅÈýÀîËÄÍõÎåÕÔÁ | 大部分字符为带着声调的字母 | 以ISO8859-1方式读取GBK编码的中文 |
问句码 | 犱笁鏉庡洓鐜嬩簲叚鑰? | 基本和古文码一致,字符串为偶数时正常,长度为奇数时结尾会带上问号 | 以GBK方式读取UTF-8编码的中文,然后又用GBK的格式再次读取 |
锟拷码 | 锟斤拷锟斤拷锟斤拷 | 基本都是锟斤拷三个字符 | 以GBK方式读取UTF-8编码的�� |
方块码的产生原因
下面我们来看一下方块码具体是怎么来的 首先需要知道方块码‘�’的产生原因,由上图可知,方块码是以UTF-8方式读取GBK编码的中文,而UTF-8和GBK编码的区别在于:
- UTF-8会将中文转化成三个字节进行存储
- GBK会将中文转化成两个字节进行存储
锟拷码的产生原因
由上表可知,锟拷码是由于以GBK方式读取UTF-8编码的��得到,而如果产生了方块码,就有可能会产生锟拷码
你认为这篇文章怎么样?
- 0
- 0
- 0
- 0
- 0
- 0
Powered by Waline v3.4.2