Что такое Unicode? Как он работает и как его использовать?
Автор: Erik Wilde
Загружено: 2023-03-23
Просмотров: 9186
Описание:
Unicode — это кодировка, используемая для использования диакритических знаков и специальных символов. Она также используется для эмодзи — символов, которые теперь стали универсальным языком. Но как работает Unicode, и как мы пришли к тому, что можем использовать все эти символы и доверять им работу во многих приложениях и на многих устройствах?
Начнём с истории. ASCII был первым широко распространённым стандартом представления символов на компьютерах. Он был создан в 1963 году и использует всего 7 бит. Это означает, что максимальное количество символов, которое он может представить, составляет 128, из которых только 95 являются печатными. ASCII ориентирован на английский язык и не поддерживает символы, используемые во многих других языках.
С ростом доступности компьютеров следующий соответствующий стандарт появился в 1987 году — ISO 8859. Этот стандарт использует 8 бит, что позволяет кодировать 256 символов. Но этого недостаточно для охвата всех языков мира, поэтому было создано несколько его вариаций. Например, ISO 8859-1 использует расширения, выходящие за рамки 7-битных символов ASCII, для представления символов с диакритическими знаками западноевропейских языков, таких как немецкий, французский и итальянский.
Разработчику, работающему с Unicode, следует помнить, что Unicode имеет несколько кодировок разной длины. При чтении Unicode ваша среда разработки, скорее всего, поможет вам читать файлы, содержащие текст в Unicode. При написании Unicode наиболее разумным выбором по умолчанию является UTF-8, в некоторых языках по умолчанию используется UTF-16, и, вероятно, вам следует избегать UTF-32.
Вкратце: Unicode хорош тем, что решает большинство проблем с представлением символов. Это развивающийся стандарт, в который постоянно добавляются новые символы. Работа с Unicode подразумевает необходимость работы с различными кодировками, но в большинстве случаев ваша среда разработки поддерживает как чтение, так и запись файлов в Unicode.
Дополнительные ресурсы:
🎥 Что такое UTF-8 и UTF-16? Работа с кодировками Unicode - • What are UTF-8 and UTF-16? Working with Un...
👉 Википедия: Unicode - https://en.wikipedia.org/wiki/Unicode
👉 Консорциум Unicode - https://home.unicode.org/
00:00 Введение
00:23 История Unicode: ASCII
01:14 История Unicode: ISO 8859
02:32 Создание Unicode
03:16 Unicode 15
03:51 Кодировки Unicode: UTF-8, UTF-16, UTF-32
04:35 Чтение текста Unicode
05:19 Написание текста Unicode
05:56 Краткое содержание
07:02 Подведение итогов
Повторяем попытку...
Доступные форматы для скачивания:
Скачать видео
-
Информация по загрузке: