长风破浪会有时，直挂云帆济沧海。 —— 李白《行路难》

UTF-32编码规则

固定4字节 / Unicode码点 / 编码示例

共 3 条

编码规则

U+0000-U+10FFFF固定4字节

直接存储Unicode码点值，分大端和小端

U+4E2D -> 00 00 4E 2D

BOMFE FF或FF FE相关

可通过字节序标记判断大小端

UTF-32BE / UTF-32LE

字符	名称	Unicode码位	字节	说明
A	拉丁字母A	U+0041	00 00 00 41	UTF-32BE表示
中	汉字中	U+4E2D	00 00 4E 2D	UTF-32BE表示
😀	笑脸Emoji	U+1F600	00 01 F6 00	UTF-32BE表示

UTF-32使用固定4字节表示一个Unicode码点，规则简单但空间占用较大，常用于需要固定宽度处理字符的场景说明。如需做实际文本转换，可继续使用编码转换工具、Unicode转换工具。

UTF-32每个字符固定4字节，空间占用大，Web通常使用更紧凑的UTF-8。

UTF-32基本直接以固定4字节保存Unicode码点值。

UTF-32用固定32位空间直接表示Unicode码点，因此每个字符占4字节。

UTF-32BE和UTF-32LE的区别是字节序不同，大端把高位字节放前面，小端把低位字节放前面。