• • •
Apache - httpd.conf - Log
 
• • •
Options - Order - Auth
 
• • •
ErrorDocument
 
• • •
AddType - MIME types
 
• • •
CharsetDefault - CharsetSourceEnc
 
• • •
Redirect - RedirectMatch
 
• • •
Mod_rewrite - RewriteCond
 
• • •
AddHandler - Pass(Set)Env
 
• • •
PHP - .htaccess
 
• • •
Дополнительный материал
 
Рекомендуем

 
Кодировка кириллицы - русского языка

Кодировка кириллицы - русского языка

Хостинг! У меня виртуальный хостинг держит 10 000 посетителей со стандартным кэшем Joomla (Host-1). А у Вас?

Полная поддержка директив .htaccess прилагается...


Нужен хостинг для сайта с БД с минимальными тратами? Хостинг на 12 мес. - 1188-00 (Простор 1)

Пролонгации домена 139-00 (регистрация бесплатно!)

Реклама - рекомендация от администрации сайта

Кодировка представляет собой таблицу символов, где каждой букве алфавита (а также цифрам и специальным знакам) присвоен свой уникальный номер - код символа.

Стандартизирована только половина таблицы, т.н. ASCII-код - первые 128 символов, которые включают в себя буквы латинского алфавита. И с ними никогда не бывает проблем. Вторая же половина таблицы (а всего в ней 256 символов - по количеству состояний, который может принять один байт) отдана под национальные символы, и в каждой стране эта часть различна. Но только в России умудрились придумать целых 5 различных кодировок. Термин "различные" обозначает то, что одному и тому же символу соответствует разный цифровой код. Т.е. если мы неправильно определим кодировку текста, то нашему вниманию предстанет абсолютно нечитаемый текст.

Кодировки появились исторически. Первая широко используемая российская кодировка называлась KOI-8. Ее придумали, когда адаптировали к русскому языку систему UNIX. Это было еще в семидесятых - до появления персоналок. И до сих пор в UNIX это считается основной кодировкой.

Потом появились первые персональные компьютеры, и началось победное шествие DOS. Вместо того чтобы воспользоваться уже придуманной кодировкой, Microsoft решила сделать свою, ни с чем не совместимую. Так появилась DOS-кодировка (или 866 кодовая страница). В ней, кстати, были введены спецсимволы для рисования рамок, что широко использовалось в программах написанных под DOS. Например, в том же Norton Commander-е.

Параллельно с IBM-совместимыми развивались и Macintosh-компьютеры. Несмотря на то, что их доля в России очень мала, тем не менее, потребность в русификации существовала и, разумеется, была придумана еще одна кодировка - MAC.

Время шло, и 1990 году Microsoft явила на свет первую успешную версию Windows 3.0-3.11. А вместе с ней и поддержку национальных языков. И снова был проделан такой же фокус, как и с DOS. По непонятным причинам они не поддержали ни одну, из уже существовавших ранее (как это сделала OS/2, принявшая за стандарт DOS-кодировку), а предложили новую Win-кодировку (или кодовая страница 1251). Де-факто, она стала самой распространенной в России.

И, наконец, пятый вариант кодировки связан уже не с конкретной фирмой, а с попытками стандартизации кодировок на уровне всей планеты. Занималась этим ISO - международная организация по стандартам. И, догадайтесь, что они сделали с русским языком? Вместо того, чтобы принять за "стандартную русскую" какую-нибудь из вышеописанных, они придумали еще одну (!) и назвали ее длинным неудобоваримым сочетанием ISO-8859-5. Разумеется, она тоже оказалась ни с чем не совместимой. И в настоящий момент эта кодировка практически нигде не применяется. Кажется, ее используют только в базе данных Oracle. По крайней мере, я ни разу не видел текст в этой кодировке. Тем не менее, ее поддержка присутствует во всех броузерах.

Сейчас идет работа над созданием новой универсальной кодировки (UNICODE), в которой предполагается в одну кодовую таблицу запихнуть все языки мира. Тогда точно проблем не будет. Для этого на каждый символ отвели 2 байта. Таким образом, максимальное количество знаков в таблице расширилось до 65535. Но до момента, когда все перейдут на UNICODE, остается еще слишком много времени.


Здесь немного отвлекемся и расмотрим для целостного восприятия мета тег - Content-Type.

Мета теги используются для описания свойств HTML документа и должны находится в рамках тега HEAD. Мета теги типа NAME содержат текстовую информацию о документе, его авторе и некоторые рекомендации для поисковых машин. Например: Robots, Description, Keywords, Author, Copyright.

Мета теги типа HTTP-EQUIV влияют на формирование заголовка документа и определяют режим его обработки.

Content-Type

Мета тег Content-Type - Отвечает за указание типа документа и кодировки символов.

Использовать мета тег Content-Type надо только с учетом некоторых нюансов:

  • Во - первых, кодировка символов текста должна соответствовать кодировке, указанной в теге.

  • Во - вторых, сервер не должен менять кодировку текста при обработке запроса броузера.

  • В - третьих, если сервер меняет кодировку текста, он должен скорректировать или удалить мета тег Content-Type.

Несоблюдение этих требований может привести к следующему: web-сервер автоматически определит кодировку запроса клиента и отдаст страничку web-броузеру перекодированной. Броузер, в свою очередь, будет читать документ в соответствии с мета тегом Content-Type. И если кодировки не совпадут, то прочитать документ можно будет только после ряда замысловатых манипуляций. Особенно это характерно для старых броузеров.

Внимание! Мета тег Content-Type очень часто вставляется генераторами HTML кода.

Наиболее часто встречаются типы кодировки:

  • Windows-1251 - Кириллица (Windows).

  • KOI8-r - Кириллица (КОИ8-Р)

  • cp866 - Кириллица (DOS).

  • Windows-1252 - Западная Европа (Windows).

  • Windows-1250 - Центральная Европа (Windows).

Наверняка всем известен мета тег -

<meta http-equiv="content-type" content="text/html; charset=Windows-1251">

В данном материале использовались выдержки из статьи с сайта http://cherry-design.ru/

Рекламная информация

Недавно освободившиеся домены с PR и ТИЦ:

Сервис http://reg.ru - крупнейшего хостинга и регистратора доменов позволяет подать заявку на регистрацию доменного имени, которое недавно было освобождено прежним Администратором. Освобожденные домены часто имеют высокие показатили ТИЦ и PR и могут быть интересны к приобретению.

Обычный хостинг:
VPS - виртуальный - сервер:
Освобожденные домены .RU c ТИЦ:
Свободные премиум-домены:

Объем информации: 7659 bytes
Россия • admin@htaccess.net.ru 2005 - 2014 • Рекомендуем хостинг: Reg.ru (крупнейший), Hostland.ru (по-дешевле) - договора, счета, акты.


 
  In Partnership with AOL Search    службы мониторинга серверов