Unicode等价性(Unicode equivalence)是为和许多现存的标准能够相容,Unicode(统一码)包含了许多特殊字符。在这些字符中,有些在功能上会和其它字符或字符序列等价。因此,Unicode将一些码位序列定义成相等的。Unicode提供了两种等价概念:标准等价和相容等价。前者是后者的一个子集。例如,字符n后接著组合字符~会(标准和相容)等价于Unicode字符ñ。而合字ff则只有相容等价于两个f字符。
Unicode正规化是文字正规化的一种形式,是指将彼此等价的序列转成同一列序。此序列在Unicode标准中称作正规形式。对于每种等价概念,Unicode又定义两种形式,一种是完全合成的,一种是完全分解的。因此,最后会有四种形式,其缩写分别为:NFC、NFD、NFKC、NFKD。对于Unicode的文字处理程式而言,正规化是很重要的。因为它影响了比较、搜寻和排序的意义。