✨ Кодирование текста - это просто! ✨
01001000 01101001 00100001
🔤 Что такое кодирование текста?
Когда ты пишешь сообщение другу, компьютер не понимает буквы так, как мы. Он работает только с числами! Поэтому каждой букве, цифре и даже смайлику присваивается специальный числовой код.
ASCII Коды первых букв алфавита
Символ |
Код ASCII |
Двоичный код |
A |
65 |
01000001 |
B |
66 |
01000010 |
C |
67 |
01000011 |
D |
68 |
01000100 |
E |
69 |
01000101 |
Интересный факт: В ASCII кодах заглавные буквы A-Z идут последовательно от 65 до 90, а строчные a-z — от 97 до 122.
📝 Основные кодировки
Кодировка |
Размер символа |
Что поддерживает |
Пример |
ASCII |
1 байт (8 бит) |
Английские буквы, цифры, основные знаки |
A → 65 |
UTF-8 (Unicode) |
1-4 байта |
Все языки, эмодзи, специальные символы |
Привет → 2 байта на букву |
Пример: Слово "Cat" в ASCII:
- C → 67 → 01000011
- a → 97 → 01100001
- t → 116 → 01110100
🧮 Как измерить размер текста?
I = K × i
Где:
- I - размер информации (в битах)
- K - количество символов в тексте
- i - информационный вес одного символа (количество бит на 1 символ, зависит от используемой кодировки)
Задача: Сколько байт занимает слово "Привет" в UTF-8?
Решение:
- Количество символов (K): 6
- В UTF-8 русские буквы занимают 2 байта (i = 2)
- I = 6 × 2 = 12 байт
🔍 Интересные факты
- Смайлик 😊 в UTF-8 занимает 4 байта!
- Одна страница текста (примерно 2000 символов) занимает около 2 КБ.
- Первая кодировка ASCII была создана в 1963 году.