Pandas — это библиотека для анализа и обработки данных. Она предоставляет инструменты для управления и анализа структурированных данных.
Установка:
pip install pandas
Пример чтения данных:
import pandas as pd # импорт
df = pd.read_csv("data.csv") # загрузка данных из csv файла
print(df.head()) # отображение первых строк таблицы- Используя данные и аннотацию из второй лабораторной работы, сформировать DataFrame, который будет содержать 2 колонки - абсолютный и относительный пути к файлу.
- Произвести именование колонок сформированного DataFrame. Названия колонок должны отражать содержимое данных.
- Добавить новую колонку согласно варианту.
- Реализовать функцию сортировки по добавленной колонке.
- Реализовать функцию фильтрации по добавленной колонке.
- Отобразить график по добавленной колонке с помощью matplotlib для всех отсортированных данных (графики и оси должны иметь соответствующие подписи).
- Сохранить датафрейм и график в файлы.
Пояснения к вариантам:
- Варианты без гистограммы: колонка содержит обычные данные по варианту, на графике по оси x - номер изображения/аудио в отсортированном списке, по оси y - значение величины.
- Варианты с гистограммой: колонка содержит диапазоны значений (в любом формате), под которые подходит конкретный файл, например "1-100", "101-200", "201-300" и т.д. Значения диапазонов и их количество выбирать самостоятельно в зависимости от ваших данных. На графике отображать гистограмму, где ось x - значение диапазона, ось y - количество файлов, подходящих под этот диапазон.
-
Добавить колонку с длиной каждого изображения.
-
Добавить колонку с шириной каждого изображения.
-
Добавить колонку с площадью для каждого изображения.
-
Добавить колонку со значениями для гистограммы распределения площадей изображений.
-
Добавить колонку со средними значениями яркости по всем каналам изображения.
-
Добавить колонки со средними значениями яркости по каждому каналу (r, g, b) изображения. На графике отобразить 3 кривые.
-
Добавить колонку со значениями для гистограммы распределения яркости по всем каналам изображения.
-
Добавить колонки со значениями для гистограмм распределения яркости по каждому каналу (r, g, b) изображения. На графике отобразить 3 гистограммы.
-
Добавить колонку со значением доминирующего цвета (r, g, b) изображения (на основе среднего значения яркости). На графике отобразить гистограмму распределения доминирующего цвета.
-
Добавить колонку со значением ориентации изображения (вертикальное, горизонтальное или квадратное). На графике отобразить гистограмму распределения ориентаций.
-
Добавить колонку со значениями диапазона яркости (range=max-min) изображения по всем каналам.
-
Добавить колонки со значениями диапазона яркости (range=max-min) изображения по каждому каналу (r, g, b). На графике отобразить 3 кривые.
-
Добавить колонку со значениями для гистограммы распределения диапазонов яркости (range=max-min) изображения по всем каналам.
-
Добавить колонки со значениями для гистограмм распределения диапазонов яркости (range=max-min) изображения по каждому каналу (r, g, b). На графике отобразить 3 гистограммы.
-
Добавить колонку со значениями отношения сторон изображения (длина к ширине или ширина к длине).
-
Добавить колонку со значениями для гистограммы распределения отношения сторон изображения (длина к ширине или ширина к длине).
-
Добавить колонку с длительности (длина массива/частота дискретизации) каждого аудиофайла.
-
Добавить колонку со значениями для гистограммы распределения длительности (длина массива/частота дискретизации) аудиофайлов.
-
Добавить колонку со значениями минимальной амплитуды (по модулю) для каждого аудиофайла.
-
Добавить колонку со значениями для гистограммы распределения минимальной амплитуды (по модулю).
-
Добавить колонку со значениями максимальной амплитуды (по модулю) для каждого аудиофайла.
-
Добавить колонку со значениями для гистограммы распределения максимальной амплитуды (по модулю).
-
Добавить колонку со значениями средней амплитуды (по модулю) для каждого аудиофайла.
-
Добавить колонку со значениями для гистограммы распределения средней амплитуды (по модулю).
-
Добавить колонку со значениями диапазона амплитуды (range=max-min) для каждого аудиофайла.
-
Добавить колонку со значениями для гистограммы распределения диапазона амплитуды (range=max-min).
-
Добавить колонку с отношением количества сэмплов с амплитудой выше заданного порога к общему количеству сэмплов для каждого аудиофайла.
-
Добавить колонку со значениями для гистограммы распределения отношения количества сэмплов с амплитудой выше заданного порога к общему количеству сэмплов для каждого аудиофайла.
-
Добавить колонку с отношением количества сэмплов с амплитудой ниже заданного порога к общему количеству сэмплов для каждого аудиофайла.
-
Добавить колонку со значениями для гистограммы распределения отношения количества сэмплов с амплитудой ниже заданного порога к общему количеству сэмплов для каждого аудиофайла.