Как использовать мета-теги для кодировки символов в HTML5

Перед введением HTML5 установка кодировки символов в документе с элементом требовала написать несколько многословную строку, показанную ниже. Это элементы Meta Charset, если вы использовали HTML4 на своей веб-странице:


В этом коде важно отметить кавычки, которые вы видите вокруг содержание атрибут: content = «text / html; charset = iso-8859-1». Как и все атрибуты HTML, эти кавычки определяют значение атрибута, указывая, что вся строка текст / html; кодировка = изо-8959-1 это содержание этого элемента. Это правильный HTML, и именно так должна была быть написана эта строка. Это также громоздко долго и безобразно! Это также не то, что вы, вероятно, помните с макушки головы!

В большинстве случаев веб-разработчикам приходилось бы копировать и вставлять этот код с одного сайта в любой новый, который они разрабатывали, потому что писать это с нуля требовало много усилий.

HTML5 исключает лишние «вещи»

HTML5 не только добавил некоторые новые элементы в язык, но также значительно упростил большую часть синтаксиса HTML, включая элемент Meta Charset. С HTML5 вы можете добавить свою кодировку символов с гораздо более простым для запоминания синтаксисом для МЕТА элемент, который вы видите ниже:


Сравните этот упрощенный синтаксис с тем, что мы написали в начале этой статьи, со старым синтаксисом, используемым для HTML4, и вы увидите, насколько проще писать и запоминать версию HTML5. Вместо того, чтобы копировать и вставлять это из существующего сайта в любой новый, над которым вы работали, это абсолютно то, что вы, как интерфейсный веб-разработчик, могли бы вспомнить. Эта экономия времени может быть небольшой, но, если учесть другие синтаксические области, упрощенные HTML5, экономия действительно складывается!

Всегда включайте кодировку символов

Вы всегда должны включать кодировку символов для своих веб-страниц, даже если вы не собираетесь использовать какие-либо специальные символы. Если вы не включите кодировку символов, ваш сайт станет уязвимым для атаки межсайтового скриптинга с использованием UTF-7.

В этом сценарии злоумышленник видит, что на вашем сайте не определена кодировка символов, поэтому он заставляет браузер думать, что кодировка символов страницы — UTF-7. Затем злоумышленник внедряет в веб-страницу сценарии в кодировке UTF-7, и ваш сайт взламывается. Это проблематично для всех, от вашей компании до ваших посетителей. Хорошей новостью является то, что это простая проблема, которую следует избегать — обязательно добавьте кодировку символов на все свои веб-страницы.

Где добавить кодировку символов

Кодировка символов для веб-страницы должна быть первой строкой вашего HTML-элемента. Это гарантирует, что браузер знает, что такое кодировка символов, прежде чем он сделает что-либо еще на странице, кроме определения типа документа и определения, что это HTML-страница. Ваш HTML должен читать:





...

Использование заголовков HTTP для дополнительной безопасности

Вы также можете указать кодировку символов в заголовках HTTP. Это даже более безопасно, чем добавление его на HTML-страницу, но вам понадобится доступ к настройкам сервера или файлам .htaccess, а это значит, что вам может потребоваться работать с хостинг-провайдером вашего веб-сайта, чтобы получить такой доступ или иметь их. внести изменения для вас. Доступ является проблемой здесь. Само изменение простое, поэтому любой хостинг-провайдер должен сделать это для вас относительно легко.

Если вы используете Apache, вы можете установить набор символов по умолчанию для всего сайта, добавив: AddDefaultCharset UTF-8 к твоему корню .Htaccess файл. Набор символов Apache по умолчанию ISO-8859-1.

Ссылка на основную публикацию