Зачем нужно кодирование
Компьютер умеет работать только с числами — точнее, с нулями и единицами. Буквы, цифры, знаки препинания сами по себе ему непонятны. Поэтому люди договорились: каждому символу назначить число. Такая договорённость называется кодировкой.
Аналогия: представь тайный алфавит, где А = 1, Б = 2, В = 3… Кодировка — это именно такая таблица «символ → число», только стандартная, чтобы все программы понимали друг друга.
Кодировка ASCII
Первая широко распространённая кодировка — ASCII (1963 год). Содержит 128 символов: латинские буквы, цифры, знаки препинания и управляющие символы. Каждый символ занимает 1 байт = 8 бит.
| Символ |
Десятичный код |
Двоичный код |
Пояснение |
A |
65 |
0100 0001 |
Начало заглавных букв |
B |
66 |
0100 0010 |
Каждая следующая +1 |
Z |
90 |
0101 1010 |
Конец заглавных букв |
a |
97 |
0110 0001 |
Начало строчных букв |
0 |
48 |
0011 0000 |
Цифра ноль |
пробел |
32 |
0010 0000 |
Тоже символ! |
Запомни: заглавные A–Z — коды 65–90, строчные a–z — коды 97–122. Разница между «A» и «a» всегда равна 32. Зная код одной буквы, легко найти любую соседнюю.
Основные кодировки
ASCII подходит только для английского языка. Для других языков и символов придумали расширенные кодировки:
ASCII
1 байт / символ
Английский, цифры, знаки препинания. 128 символов.
Windows-1251
1 байт / символ
Русский + английский. 256 символов. Стандарт для старых русских файлов.
UTF-8
1–4 байта / символ
Все языки мира. Английские — 1 байт, русские — 2 байта.
UTF-16
2 байта / символ
Все языки мира. Фиксированные 2 байта на большинство символов.
Важно для ОГЭ: в условии задачи всегда указана кодировка — от этого зависит, сколько байт занимает один символ. Внимательно читай условие!
Формула размера текста
Чтобы найти размер текстового файла, используется одна формула:
Перевод единиц: 1 байт = 8 бит · 1 Кбайт = 1024 байт · 1 Мбайт = 1024 Кбайт
Пример 1. Файл содержит 400 символов, кодировка Windows-1251 (1 байт/символ). Каков размер?
Пример 2. Слово «ПРИВЕТ» (6 букв) в UTF-8, русские буквы = 2 байта. Каков размер?
Обратная задача. Файл занимает 2048 байт, кодировка ASCII (1 байт/символ). Сколько символов?
Тренажёр 1 — Исследователь ASCII
Введи текст (английские буквы и цифры) — увидишь десятичный код и двоичную запись каждого символа.
Тренажёр 2 — Калькулятор размера файла
Задай параметры — получи пошаговое решение по формуле I = K × i.
Тренажёр 3 — Задачи в стиле ОГЭ
12 типовых заданий, в том числе задачи из реального ОГЭ. Выбери правильный ответ — получи объяснение.
Тренажёр 4 — Реши сам
Вычисли ответ самостоятельно и введи число — тренажёр покажет верное решение.
Шпаргалка
| Вопрос |
Ответ |
| Что такое кодировка? |
Таблица «символ → число», стандарт для хранения текста |
| Сколько бит в байте? |
8 бит = 1 байт |
| ASCII / Windows-1251 — байт/символ? |
1 байт (8 бит) |
| UTF-8, русская буква — байт? |
2 байта |
| UTF-8, английская буква — байт? |
1 байт |
| UTF-16 — байт/символ? |
2 байта (16 бит) |
| Формула размера текста |
I = K × i |
| Как найти количество символов? |
K = I ÷ i |
| 1 Кбайт = ? |
1024 байт |