html_entity_decode
(PHP 4 >= 4.3.0, PHP 5, PHP 7)
html_entity_decode — Преобразует HTML-сущности в соответствующие им символы
Описание
$string
, int $flags
= ENT_COMPAT
, string|null $encoding
= null
) : string
html_entity_decode() является противоположностью функции
htmlentities(). Она преобразует HTML-сущности в строке
string
в соответствующие им символы.
Если быть точнее, то эта функция преобразует все сущности (в том числе все числовые сущности), которые а) обязательно верны для выбранного типа документа - то есть, для XML эта функция не преобразует именованные сущности, которые могут быть определены в каком-нибудь DTD - и б) их символы находятся в кодировке, соответствующей выбранной и разрешены в выбранном типе документа. Все другие сущности остаются без изменений.
Список параметров
-
string
-
Входная строка.
-
flags
-
Битовая маска, состоящая из одного или более флагов, которые указывают, как обращаться с кавычками и какой тип документа использовать. По умолчанию маска принимает значение
ENT_COMPAT | ENT_HTML401
.Константы flags
Имя константы Описание ENT_COMPAT
Преобразуются двойные кавычки, одинарные остаются без изменений. ENT_QUOTES
Преобразуются и двойные, и одинарные кавычки. ENT_NOQUOTES
Оставить как двойные, так и одинарные кавычки без изменений. ENT_HTML401
Обрабатывать код как HTML 4.01. ENT_XML1
Обрабатывать код как XML 1. ENT_XHTML
Обрабатывать код как XHTML. ENT_HTML5
Обрабатывать код как HTML 5. -
encoding
-
Необязательный аргумент, определяющий кодировку, используемую при конвертации симоволов.
Если не указан, то значение по умолчанию для
encoding
зависит от конфигурационной опции default_charset.Хотя этот аргумент является технически необязательным, настоятельно рекомендуется указать правильное значение для вашего кода, опция конфигурации default_charset может быть задана неверно для входных данных.
Поддерживаются следующие кодировки:
Поддерживаемые кодировки Кодировка Псевдонимы Описание ISO-8859-1 ISO8859-1 Западно-европейская Latin-1. ISO-8859-5 ISO8859-5 Редко используемая кириллическая кодировка (Latin/Cyrillic). ISO-8859-15 ISO8859-15 Западно-европейская Latin-9. Добавляет знак евро, французские и финские буквы к кодировке Latin-1 (ISO-8859-1). UTF-8 8-битная Unicode, совместимая с ASCII. cp866 ibm866, 866 Кириллическая кодировка, применяемая в DOS. cp1251 Windows-1251, win-1251, 1251 Кириллическая кодировка, применяемая в Windows. cp1252 Windows-1252, 1252 Западно-европейская кодировка, применяемая в Windows. KOI8-R koi8-ru, koi8r Русская кодировка. BIG5 950 Традиционный китайский, применяется в основном на Тайване. GB2312 936 Упрощенный китайский, стандартная национальная кодировка. BIG5-HKSCS Расширенная Big5, применяемая в Гонконге. Shift_JIS SJIS, SJIS-win, cp932, 932 Японская кодировка. EUC-JP EUCJP, eucJP-win Японская кодировка. MacRoman Кодировка, используемая в Mac OS. ''
Пустая строка активирует режим определения кодировки из файла скрипта (Zend multibyte), default_charset и текущей локали (см. nl_langinfo() и setlocale()) в указанном порядке. Не рекомендуется к использованию. Замечание: Остальные кодировки не поддерживаются, вместо них будет применена кодировка по умолчанию и сгенерировано предупреждение.
Возвращаемые значения
Возвращает раскодированную строку.
Список изменений
Версия | Описание |
---|---|
8.0.0 |
encoding теперь допускает значение null.
|
Примеры
Пример #1 Декодирование HTML-сущностей
<?php
$orig = "I'll \"walk\" the <b>dog</b> now";
$a = htmlentities($orig);
$b = html_entity_decode($a);
echo $a; // I'll "walk" the <b>dog</b> now
echo $b; // I'll "walk" the <b>dog</b> now
?>
Примечания
Замечание:
Может показаться странным, что результатом вызова trim(html_entity_decode(' ')); не является пустая строка. Причина том, что ' ' преобразуется не в символ с ASCII-кодом 32 (который удаляется функцией trim()), а в символ с ASCII-кодом 160 (0xa0) в принимаемой по умолчанию кодировке ISO-8859-1.
Смотрите также
- htmlentities() - Преобразует все возможные символы в соответствующие HTML-сущности
- htmlspecialchars() - Преобразует специальные символы в HTML-сущности
- get_html_translation_table() - Возвращает таблицу преобразований, используемую функциями htmlspecialchars и htmlentities
- urldecode() - Декодирование URL-кодированной строки