Конвертер Unicode онлайн
Unicode — универсальный стандарт кодирования символов, который охватывает практически все современные письменности, математические обозначения, эмодзи и технические символы. Каждому символу присвоен уникальный числовой код (code point), например U+0041 для латинской «A» или U+041F для кириллической «П».
Конвертер поддерживает три формата вывода при кодировании:
- U+ — стандартная нотация Unicode Consortium (U+0041). Используется в спецификациях, документации и таблицах символов.
- \u — JavaScript/JSON escape-последовательность (\u0041). Применяется в исходном коде, конфигурационных файлах и при работе с API.
- HTML entity — числовая ссылка HTML (A). Используется в HTML-документах для отображения символов, недоступных в текущей кодировке.
При декодировании формат определяется автоматически: инструмент распознаёт U+XXXX, \uXXXX, &#DDD; и &#xXXX; нотации, включая их смешанное использование в одной строке. Символы за пределами базовой многоязычной плоскости (BMP), такие как эмодзи, обрабатываются корректно через code points.
Разделитель между кодами настраивается: пробел (для удобства чтения), без разделителя (для компактного копирования HTML entity) или новая строка (для построчного формата). Конвертация выполняется полностью в браузере — данные не отправляются на сервер.
Часто задаваемые вопросы
- Что такое Unicode и зачем нужна конвертация?
- Unicode — стандарт, который присваивает каждому символу (буквы, цифры, эмодзи, иероглифы) уникальный числовой код. Конвертация нужна разработчикам для вставки спецсимволов в код (\u-escapes), веб-разработчикам для HTML-сущностей (&#-нотация) и при работе с документацией Unicode (U+-нотация).
- Какой формат вывода выбрать?
- U+ — для документации и спецификаций, когда нужна стандартная Unicode-нотация. \u — для JavaScript, JSON и TypeScript, когда нужно вставить символ через escape-последовательность. HTML entity — для HTML-документов, email-шаблонов и случаев, когда кодировка страницы может не поддерживать нужный символ.
- Как работает автоопределение формата при декодировании?
- Инструмент анализирует ввод регулярным выражением и распознаёт четыре формата одновременно: U+XXXX, \uXXXX, &#DDD; (десятичный) и &#xXXX; (шестнадцатеричный). Можно смешивать форматы в одной строке — каждый код будет корректно распознан и преобразован в символ. Фрагменты текста, не соответствующие ни одному формату, проходят без изменений.
- Корректно ли обрабатываются эмодзи и другие символы за пределами BMP?
- Да. Символы с code point выше U+FFFF (эмодзи, редкие иероглифы, математические символы) обрабатываются через String.codePointAt и String.fromCodePoint. В формате U+ и HTML entity они представляются одним code point (например, U+1F600), а в формате \u — суррогатной парой (😀), как того требует спецификация JavaScript.
- Безопасно ли использовать конвертер?
- Да. Конвертация выполняется полностью на стороне клиента в вашем браузере. Никакие данные не отправляются на сервер — это можно проверить во вкладке Network в DevTools.
- Какой разделитель выбрать между кодами?
- Пробел — для удобства чтения, подходит в большинстве случаев. Без разделителя — для HTML entity (Привет), когда нужно вставить результат прямо в HTML-код. Новая строка — для длинных текстов, когда нужен построчный формат для каждого символа.