Статья Автор: Деникина Н.В., Деникин А.В.

Кодирование текста

Кодирование текста

Кодирование текста

кодировки, таблицы символов, формула I = K × i — разбираемся раз и навсегда

 

Зачем нужно кодирование

Компьютер умеет работать только с числами — точнее, с нулями и единицами. Буквы, цифры, знаки препинания сами по себе ему непонятны. Поэтому люди договорились: каждому символу назначить число. Такая договорённость называется кодировкой.

 
Аналогия: представь тайный алфавит, где А = 1, Б = 2, В = 3… Кодировка — это именно такая таблица «символ → число», только стандартная, чтобы все программы понимали друг друга.

Кодировка ASCII

Первая широко распространённая кодировка — ASCII (1963 год). Содержит 128 символов: латинские буквы, цифры, знаки препинания и управляющие символы. Каждый символ занимает 1 байт = 8 бит.

Символ Десятичный код Двоичный код Пояснение
A 65 0100 0001 Начало заглавных букв
B 66 0100 0010 Каждая следующая +1
Z 90 0101 1010 Конец заглавных букв
a 97 0110 0001 Начало строчных букв
0 48 0011 0000 Цифра ноль
пробел 32 0010 0000 Тоже символ!
Запомни: заглавные A–Z — коды 65–90, строчные a–z — коды 97–122. Разница между «A» и «a» всегда равна 32. Зная код одной буквы, легко найти любую соседнюю.

Основные кодировки

ASCII подходит только для английского языка. Для других языков и символов придумали расширенные кодировки:

ASCII
1 байт / символ
Английский, цифры, знаки препинания. 128 символов.
Windows-1251
1 байт / символ
Русский + английский. 256 символов. Стандарт для старых русских файлов.
UTF-8
1–4 байта / символ
Все языки мира. Английские — 1 байт, русские — 2 байта.
UTF-16
2 байта / символ
Все языки мира. Фиксированные 2 байта на большинство символов.
Важно для ОГЭ: в условии задачи всегда указана кодировка — от этого зависит, сколько байт занимает один символ. Внимательно читай условие!

Формула размера текста

Чтобы найти размер текстового файла, используется одна формула:

I = K × i
I — размер информации (в битах или байтах, зависит от единиц i)
K — количество символов в тексте
i — информационный вес одного символа (бит или байт на символ)
Перевод единиц: 1 байт = 8 бит  ·  1 Кбайт = 1024 байт  ·  1 Мбайт = 1024 Кбайт

Пример 1. Файл содержит 400 символов, кодировка Windows-1251 (1 байт/символ). Каков размер?

I = 400 × 1 = 400 байт
K = 400, i = 1 байт → I = 400 байт

Пример 2. Слово «ПРИВЕТ» (6 букв) в UTF-8, русские буквы = 2 байта. Каков размер?

I = 6 × 2 = 12 байт
K = 6, i = 2 байта (UTF-8, русский) → I = 12 байт

Обратная задача. Файл занимает 2048 байт, кодировка ASCII (1 байт/символ). Сколько символов?

K = I ÷ i = 2048 ÷ 1 = 2048 символов
Из формулы I = K × i выражаем K = I ÷ i

Тренажёр 1 — Исследователь ASCII

Введи текст (английские буквы и цифры) — увидишь десятичный код и двоичную запись каждого символа.

 
 

Тренажёр 2 — Калькулятор размера файла

Задай параметры — получи пошаговое решение по формуле I = K × i.

Решение
 

Тренажёр 3 — Задачи в стиле ОГЭ

12 типовых заданий, в том числе задачи из реального ОГЭ. Выбери правильный ответ — получи объяснение.

ОЧКИ: 0 / 0
 
 
 
 
 

Тренажёр 4 — Реши сам

Вычисли ответ самостоятельно и введи число — тренажёр покажет верное решение.

 
 

Шпаргалка

Вопрос Ответ
Что такое кодировка? Таблица «символ → число», стандарт для хранения текста
Сколько бит в байте? 8 бит = 1 байт
ASCII / Windows-1251 — байт/символ? 1 байт (8 бит)
UTF-8, русская буква — байт? 2 байта
UTF-8, английская буква — байт? 1 байт
UTF-16 — байт/символ? 2 байта (16 бит)
Формула размера текста I = K × i
Как найти количество символов? K = I ÷ i
1 Кбайт = ? 1024 байт
Загрузка...
Чтобы оставить комментарий, необходимо авторизоваться
💬
Пока нет комментариев. Будьте первым!
Печать