Пошаговая инструкция: Как создать базу данных SQLite из датасета в DB Browser
1. Установка DB Browser for SQLite
-
Скачайте программу с официального сайта: https://sqlitebrowser.org/
-
Установите (выберите версию для вашей ОС: Windows/macOS/Linux).
2. Подготовка датасета
-
Скачайте датасет в формате CSV (например, Students Performance in Exams).
-
Откройте файл в блокноте (или другом простом текстовом редакторе), проверьте данные:
-
Убедитесь, что в заголовках столбцов (первая строка датасета) нет пробелов (замените на _
, например, math score
→ math_score
).
-
Удалите пустые строки (если они есть).
3. Создание новой базы данных
-
Запустите DB Browser for SQLite.
-
Нажмите New Database (Ctrl+N).
-
Выберите место сохранения и имя файла (например, students.db
).
4. Импорт данных из CSV
-
Перейдите во вкладку File → Import → Table from CSV file.
-
Выберите ваш файл (например, StudentsPerformance.csv
).
-
В окне Import CSV file:
-
Table name: Введите название таблицы (например, students
).
-
Убедитесь, что галочки Column names in first line и Trim fields отмечены.
-
Нажмите OK.
→ Данные автоматически загрузятся в таблицу.
5. Проверка и редактирование таблицы
-
Перейдите во вкладку Browse Data → выберите вашу таблицу (students
).
-
Убедитесь, что данные загружены корректно (нет ошибок в типах данных).
-
При необходимости измените структуру таблицы:
-
Вкладка Database Structure → кликните правой кнопкой на таблице → Modify Table.
-
Можно изменить типы данных (например, TEXT
для текста, INTEGER
для чисел).
6. Сохранение базы данных
-
Нажмите File → Save (Ctrl+S), чтобы сохранить изменения.
-
Готово! Теперь можно выполнять SQL-запросы.
Пример: Как выполнить SQL-запрос
-
Перейдите во вкладку Execute SQL.
-
Введите запрос, например:
SELECT gender, AVG(math_score) as avg_math
FROM students
GROUP BY gender;
-
Нажмите ▶ Execute (F5).
-
Результат отобразится в нижней части окна.
Советы
-
Если в CSV есть ошибки (например, кавычки в числах), DB Browser может не загрузить данные. Исправьте их в Excel перед импортом.
-
Для сложных датасетов с несколькими таблицами создавайте связи через Foreign Keys (вкладка Database Structure).
-
Экспорт данных: File → Export → Table(s) to CSV.
Теперь вы можете анализировать данные через SQL-запросы и визуализировать результаты!