Конвертер Unicode онлайн

Конвертируйте текст в Unicode-коды и обратно. Поддержка форматов U+, \u и HTML entity.

Unicode — универсальный стандарт кодирования символов, который охватывает практически все современные письменности, математические обозначения, эмодзи и технические символы. Каждому символу присвоен уникальный числовой код (code point), например U+0041 для латинской «A» или U+041F для кириллической «П».

Конвертер поддерживает три формата вывода при кодировании:

  • U+ — стандартная нотация Unicode Consortium (U+0041). Используется в спецификациях, документации и таблицах символов.
  • \u — JavaScript/JSON escape-последовательность (\u0041). Применяется в исходном коде, конфигурационных файлах и при работе с API.
  • HTML entity — числовая ссылка HTML (A). Используется в HTML-документах для отображения символов, недоступных в текущей кодировке.

При декодировании формат определяется автоматически: инструмент распознаёт U+XXXX, \uXXXX, &#DDD; и &#xXXX; нотации, включая их смешанное использование в одной строке. Символы за пределами базовой многоязычной плоскости (BMP), такие как эмодзи, обрабатываются корректно через code points.

Разделитель между кодами настраивается: пробел (для удобства чтения), без разделителя (для компактного копирования HTML entity) или новая строка (для построчного формата). Конвертация выполняется полностью в браузере — данные не отправляются на сервер.


Часто задаваемые вопросы

Что такое Unicode и зачем нужна конвертация?
Unicode — стандарт, который присваивает каждому символу (буквы, цифры, эмодзи, иероглифы) уникальный числовой код. Конвертация нужна разработчикам для вставки спецсимволов в код (\u-escapes), веб-разработчикам для HTML-сущностей (&#-нотация) и при работе с документацией Unicode (U+-нотация).
Какой формат вывода выбрать?
U+ — для документации и спецификаций, когда нужна стандартная Unicode-нотация. \u — для JavaScript, JSON и TypeScript, когда нужно вставить символ через escape-последовательность. HTML entity — для HTML-документов, email-шаблонов и случаев, когда кодировка страницы может не поддерживать нужный символ.
Как работает автоопределение формата при декодировании?
Инструмент анализирует ввод регулярным выражением и распознаёт четыре формата одновременно: U+XXXX, \uXXXX, &#DDD; (десятичный) и &#xXXX; (шестнадцатеричный). Можно смешивать форматы в одной строке — каждый код будет корректно распознан и преобразован в символ. Фрагменты текста, не соответствующие ни одному формату, проходят без изменений.
Корректно ли обрабатываются эмодзи и другие символы за пределами BMP?
Да. Символы с code point выше U+FFFF (эмодзи, редкие иероглифы, математические символы) обрабатываются через String.codePointAt и String.fromCodePoint. В формате U+ и HTML entity они представляются одним code point (например, U+1F600), а в формате \u — суррогатной парой (😀), как того требует спецификация JavaScript.
Безопасно ли использовать конвертер?
Да. Конвертация выполняется полностью на стороне клиента в вашем браузере. Никакие данные не отправляются на сервер — это можно проверить во вкладке Network в DevTools.
Какой разделитель выбрать между кодами?
Пробел — для удобства чтения, подходит в большинстве случаев. Без разделителя — для HTML entity (Привет), когда нужно вставить результат прямо в HTML-код. Новая строка — для длинных текстов, когда нужен построчный формат для каждого символа.