知识坝 > unicode是两个字节，2^16=65536，为什么能编码所以汉字呢？

unicode是两个字节，2^16=65536，为什么能编码所以汉字呢？

2025-12-24 22:15:06

推荐回答（1个）

回答1：

之所以能编码全世界的语言是因为unicode码没有把所有语言的全部组成部分收入编码，对于一些语言，如汉字，只是收录了一步分常用的汉字罢了。或许汉字真的有6万多，但是，因为常用的汉字没有6万多，貌似只有几千个，以前有做过统计（貌似是从报纸上一个一个算，大概算了2万多个汉字），大概5000个常用的汉字就占了所有汉字的使用量的90%（具体是多少我也不清楚了）。
况且，我国本身的GB码（国标码）都没有把全部汉字收录，更何况unicode码。
其实书上说的话多少有些夸张了，顶多是基本上把全部语言收录了，只要不误解就行了。。。
话说，语言是不断变化的，2个字节也迟早不够用的了。