UTF-16编码转换
UTF-16 是 Unicode 字符集的一种转换格式,使用二字节编码 BMP 平面字符,使用四字节编码其它平面字符,所以 UTF-16 编码只有2字节和4字节两种长度。对于 Unicode 的 BMP 字符编码,UTF-16 直接采用而不转换,即编码一致;其它平面字符的编码则进行转换变成 UTF-16 特有的四字节编码。另外,UTF-16 编码的字节顺序还有大小尾序之别,即 UTF-16 BE 和 UTF-16 LE,默认是 big-endian(大尾序)。
UTF-16 是 Unicode 字符集的一种转换格式,使用二字节编码 BMP 平面字符,使用四字节编码其它平面字符,所以 UTF-16 编码只有2字节和4字节两种长度。对于 Unicode 的 BMP 字符编码,UTF-16 直接采用而不转换,即编码一致;其它平面字符的编码则进行转换变成 UTF-16 特有的四字节编码。另外,UTF-16 编码的字节顺序还有大小尾序之别,即 UTF-16 BE 和 UTF-16 LE,默认是 big-endian(大尾序)。