Класс Normalizer
(PHP 5 >= 5.3.0, PHP 7, PECL intl >= 1.0.0)
Введение
Нормализация - это процесс преобразования символов и их последовательностей в формальное представление более низкого уровня. Данный процесс крайне важен при сравнении строк при сортировке или при поиске, но также используется при сохранении текста, чтобы быть уверенным в том, что он сохранился корректно.
Консорциум Unicode определил несколько форм нормализации, отражающих разные потребности приложений:
- Normalization Form D (NFD) - Каноническое разложение
- Normalization Form C (NFC) - Каноническое разложение с последующей канонической сборкой
- Normalization Form KD (NFKD) - Совместимое разложение
- Normalization Form KC (NFKC) - Совместимое разложение с последующей канонической сборкой
Обзор классов
Normalizer
{
/* Методы */
}Предопределенные константы
Данные константы задают форму нормализации, используемую нормализатором:
-
Normalizer::FORM_C
(int) - Форма нормализации C (NFC) - Каноническое разложение, после которого каноническая сборка
-
Normalizer::FORM_D
(int) - Форма нормализации D (NFD) - Каноническое разложение
-
Normalizer::FORM_KC
(int) - Форма нормализации KC (NFKC) - Совместимое разложение, после которого каноническая сборка
-
Normalizer::FORM_KD
(int) - Форма нормализации KD (NFKD) - Совместимое разложение
-
Normalizer::NONE
(int) - Без разложения/сборки
-
Normalizer::OPTION_DEFAULT
(int) - Обычные настройки нормализации
Содержание
- Normalizer::getRawDecomposition — Извлекает свойство Decomposition_Mapping для заданного символа UTF-8
- Normalizer::isNormalized — Проверить, соответствует ли переданная строка заданной форме нормализации
- Normalizer::normalize — Нормализация строки