Статья Автор: Деникина Н.В., Деникин А.В.

чтение данных из CSV файла

read_csv в Pandas - это функция, которая позволяет загружать данные из файлов CSV (Comma Separated Values) в объект DataFrame. Файл CSV представляет собой текстовый файл, в котором данные разделены запятыми или другими разделителями.

Вот подробнее о функции read_csv:

  1. Чтение данных из CSV файла (если разделитель запятая!):



2. Задание разделителя: Если данные разделены не запятыми, то нужно явно указать разделитель с помощью параметра sep и также для данного файла зададим соответвующую кодировку:


3. Заголовок: По умолчанию read_csv считает первую строку файла CSV заголовком, но это можно изменить с помощью параметра header:


4. Индексация: При чтении CSV файла можно указать столбец, который будет использоваться в качестве индекса DataFrame:


5. Преобразование дат
При наличии столбцов с датами, их можно интерпретировать с помощью параметра parse_dates.
По умолчанию Pandas воспринимает формат: 
yyyy-mm-dd HH:MM:SS, поэтому при сипользовании  можно либо явно указать параметр dayfirst=True, если день идет перед месяцем в строке с датой, либо указать формат даты, чтобы Pandas мог правильно интерпретировать даты.

Явное указание dayfirst=True:


Указание формата даты:

Прикрепленные файлы
data.csv
data_no_header.csv
data_with_id.csv
moscow_2024_March.csv
Пропустить Навигационные Ссылки.
Чтобы оставить комментарий нужна авторизация
Печать