BOM
大端序、小端序
BOM 分为两个顺序,大端序、小端序,下面拿一个例子来解释,“我”的码点为 25105,转为 16 进制为 0x6211
大端序:高位字节在前,0x62 在前,0x11 在后,0x6211。比较符合人类识别,例如阿拉伯数字 100,我们习惯高位在前
小端序:高位字节在后,0x11 在前,0x62 在后,0x1162
计算机在读取数据的时候,是按照一个字节一个字节读取,假设存储顺序为 [0x62, 0x11],此时如果计算机按照大端序解析,则得到 “我”,反之得得到 “ᅢ”
以下是常用的 BOM
| 编码 | BOM 表示 |
|---|---|
| UTF-8 | EF BB BF |
| UTF-16(大端序) | FE FF |
| UTF-16(小端序) | FF FE |
| UTF-32(大端序) | 00 00 FE FF |
| UTF-32(小端序) | FF FE 00 00 |