4. DataFrame


DataFrame — это основная структура данных в библиотеке Pandas, представляющая собой двумерную таблицу с метками строк и столбцов. Каждый столбец в DataFrame является объектом Series (одномерный массив с метками), и все столбцы хранят данные одного типа внутри себя (но разные столбцы могут иметь разные типы данных).
 

Создать DataFrame можно из разных структур данных: словарь списков/массивов, список списков, другой DataFrame, NumPy array. Для создания Dataframe используется контруктор DataFrame()

В примере ниже создается DataFrame из списка списков data:



Индексация: Каждая строка и каждый столбец в DataFrame имеют свой уникальный индекс (метку). Индексы строк по умолчанию начинаются с 0, а индексы столбцов (columns) могут быть заданы пользователем или созданы автоматически (также как и строки с нуля).

Пример создания DataFrame с использованием индекса, где каждая строка представляет собой данные о различных странах мира:



пример задания индекса для столбцов при создании DataFrame из словаря:


или с использованием атрибута columns


Использование индекса
Использование индекса в DataFrame позволяет обращаться к строкам данных по их уникальному идентификатору. Вот несколько способов использования индекса:
Выборка по индексу: Вы можете выбирать строки DataFrame по их индексу с помощью метода .loc[]. Например:


Итерация по строкам: Можно итерироваться по строкам DataFrame и получать доступ к данным в каждой строке. Например:


Получение значения по индексу: Можно получать значения определенного столбца для конкретной строки, используя индекс. Например:

time 4000 ms
memory 256 Mb

Комментарий учителя