Кодовые таблицы character sets

Кодовые таблицы character sets. HTTP использует то же самое определение термина кодовая таблица, которое определено для MIME Термин кодовая таблица используется, чтобы сослаться на метод, использующий одну или несколько таблиц для преобразования последовательности октетов в последовательность символов.

Стоит отметить, что однозначное преобразование в обратном направлении не требуется, и что не все символы могут быть доступны в данной кодовой таблице, и что кодовая таблица может обеспечивать более чем одну последовательность октетов для представления специфических символов.

Это определение допускает различные виды кодирования символов, от простых однотабличных отображений типа US-ASCII до сложных методов, переключающих таблицы, наподобие тех, которые используют методики ISO 2022. Однако определение, связанное с именем кодовой таблицы MIME должно полностью определять отображение, которое преобразует октеты в символы. В частности использование внешней информации профилирования для определения точного отображения не разрешается.

Кодовые таблицы HTTP идентифицируются лексемами, не чувствительными к регистру.

Полный набор лексем определен реестром кодовых таблиц IANA 19 . charset token Хотя HTTP позволяет использовать в качестве значения charset произвольную лексему, любая лексема, которая имеет предопределенное значение в реестре кодовых таблиц IANA, должна представлять набор символов, определенный в данном реестре.

Приложениям следует ограничить использование символьных наборов теми, которые определены в реестре IANA. 3.5