Статья Автор: Деникина Н.В., Деникин А.В.

Кодирование текста

✨ Кодирование текста - это просто! ✨

01001000 01101001 00100001

🔤 Что такое кодирование текста?

Когда ты пишешь сообщение другу, компьютер не понимает буквы так, как мы. Он работает только с числами! Поэтому каждой букве, цифре и даже смайлику присваивается специальный числовой код.

ASCII Коды первых букв алфавита
Символ Код ASCII Двоичный код
A 65 01000001
B 66 01000010
C 67 01000011
D 68 01000100
E 69 01000101
Интересный факт: В ASCII кодах заглавные буквы A-Z идут последовательно от 65 до 90, а строчные a-z — от 97 до 122.
 

📝 Основные кодировки

Кодировка Размер символа Что поддерживает Пример
ASCII 1 байт (8 бит) Английские буквы, цифры, основные знаки A → 65
UTF-8 (Unicode) 1-4 байта Все языки, эмодзи, специальные символы Привет → 2 байта на букву

Пример: Слово "Cat" в ASCII:

  • C → 67 → 01000011
  • a → 97 → 01100001
  • t → 116 → 01110100
 

🧮 Как измерить размер текста?

I = K × i

Где:

  • I - размер информации (в битах)
  • K - количество символов в тексте
  • i - информационный вес одного символа (количество бит на 1 символ, зависит от используемой кодировки)

Задача: Сколько байт занимает слово "Привет" в UTF-8?

Решение:

  1. Количество символов (K): 6
  2. В UTF-8 русские буквы занимают 2 байта (i = 2)
  3. I = 6 × 2 = 12 байт
 

🔍 Интересные факты

  • Смайлик 😊 в UTF-8 занимает 4 байта!
  • Одна страница текста (примерно 2000 символов) занимает около 2 КБ.
  • Первая кодировка ASCII была создана в 1963 году.
Пропустить Навигационные Ссылки.
Чтобы оставить комментарий нужна авторизация
Печать