Skip to content

BOM

大端序、小端序

BOM 分为两个顺序,大端序、小端序,下面拿一个例子来解释,“我”的码点为 25105,转为 16 进制为 0x6211

大端序:高位字节在前,0x62 在前,0x11 在后,0x6211。比较符合人类识别,例如阿拉伯数字 100,我们习惯高位在前

小端序:高位字节在后,0x11 在前,0x62 在后,0x1162

计算机在读取数据的时候,是按照一个字节一个字节读取,假设存储顺序为 [0x62, 0x11],此时如果计算机按照大端序解析,则得到 “我”,反之得得到 “ᅢ”

以下是常用的 BOM

编码          BOM 表示
UTF-8      EF BB BF
UTF-16(大端序)FE FF
UTF-16(小端序)FF FE
UTF-32(大端序)00 00 FE FF
UTF-32(小端序)FF FE 00 00