utf-8是unicode字符集的一种编码方式 unicode字符集可收录的字符个数为65536-2*1024+1024*1024=1112064 一百多万个,但目前世界上所有文字符号加起来也没这么多,所以unicode字符集还有很多位置是没有用上的。
中文字符在utf8的编码位置是4e00-9fa5, 一共可收录 20901个中文字符。