Skip to content

Latest commit

 

History

History
83 lines (65 loc) · 9.22 KB

File metadata and controls

83 lines (65 loc) · 9.22 KB

Лабораторная работа № 4

Анализ и визуализация данных

Теория

pandas

Pandas — это библиотека для анализа и обработки данных. Она предоставляет инструменты для управления и анализа структурированных данных.

Установка:

pip install pandas

Пример чтения данных:

import pandas as pd  # импорт

df = pd.read_csv("data.csv")  # загрузка данных из csv файла
print(df.head())  # отображение первых строк таблицы

Полезные ссылки

Задание

Общее задание

  1. Используя данные и аннотацию из второй лабораторной работы, сформировать DataFrame, который будет содержать 2 колонки - абсолютный и относительный пути к файлу.
  2. Произвести именование колонок сформированного DataFrame. Названия колонок должны отражать содержимое данных.
  3. Добавить новую колонку согласно варианту.
  4. Реализовать функцию сортировки по добавленной колонке.
  5. Реализовать функцию фильтрации по добавленной колонке.
  6. Отобразить график по добавленной колонке с помощью matplotlib для всех отсортированных данных (графики и оси должны иметь соответствующие подписи).
  7. Сохранить датафрейм и график в файлы.


Пояснения к вариантам:

  • Варианты без гистограммы: колонка содержит обычные данные по варианту, на графике по оси x - номер изображения/аудио в отсортированном списке, по оси y - значение величины.
  • Варианты с гистограммой: колонка содержит диапазоны значений (в любом формате), под которые подходит конкретный файл, например "1-100", "101-200", "201-300" и т.д. Значения диапазонов и их количество выбирать самостоятельно в зависимости от ваших данных. На графике отображать гистограмму, где ось x - значение диапазона, ось y - количество файлов, подходящих под этот диапазон.

Варианты

  1. Добавить колонку с длиной каждого изображения.

  2. Добавить колонку с шириной каждого изображения.

  3. Добавить колонку с площадью для каждого изображения.

  4. Добавить колонку со значениями для гистограммы распределения площадей изображений.

  5. Добавить колонку со средними значениями яркости по всем каналам изображения.

  6. Добавить колонки со средними значениями яркости по каждому каналу (r, g, b) изображения. На графике отобразить 3 кривые.

  7. Добавить колонку со значениями для гистограммы распределения яркости по всем каналам изображения.

  8. Добавить колонки со значениями для гистограмм распределения яркости по каждому каналу (r, g, b) изображения. На графике отобразить 3 гистограммы.

  9. Добавить колонку со значением доминирующего цвета (r, g, b) изображения (на основе среднего значения яркости). На графике отобразить гистограмму распределения доминирующего цвета.

  10. Добавить колонку со значением ориентации изображения (вертикальное, горизонтальное или квадратное). На графике отобразить гистограмму распределения ориентаций.

  11. Добавить колонку со значениями диапазона яркости (range=max-min) изображения по всем каналам.

  12. Добавить колонки со значениями диапазона яркости (range=max-min) изображения по каждому каналу (r, g, b). На графике отобразить 3 кривые.

  13. Добавить колонку со значениями для гистограммы распределения диапазонов яркости (range=max-min) изображения по всем каналам.

  14. Добавить колонки со значениями для гистограмм распределения диапазонов яркости (range=max-min) изображения по каждому каналу (r, g, b). На графике отобразить 3 гистограммы.

  15. Добавить колонку со значениями отношения сторон изображения (длина к ширине или ширина к длине).

  16. Добавить колонку со значениями для гистограммы распределения отношения сторон изображения (длина к ширине или ширина к длине).

  17. Добавить колонку с длительности (длина массива/частота дискретизации) каждого аудиофайла.

  18. Добавить колонку со значениями для гистограммы распределения длительности (длина массива/частота дискретизации) аудиофайлов.

  19. Добавить колонку со значениями минимальной амплитуды (по модулю) для каждого аудиофайла.

  20. Добавить колонку со значениями для гистограммы распределения минимальной амплитуды (по модулю).

  21. Добавить колонку со значениями максимальной амплитуды (по модулю) для каждого аудиофайла.

  22. Добавить колонку со значениями для гистограммы распределения максимальной амплитуды (по модулю).

  23. Добавить колонку со значениями средней амплитуды (по модулю) для каждого аудиофайла.

  24. Добавить колонку со значениями для гистограммы распределения средней амплитуды (по модулю).

  25. Добавить колонку со значениями диапазона амплитуды (range=max-min) для каждого аудиофайла.

  26. Добавить колонку со значениями для гистограммы распределения диапазона амплитуды (range=max-min).

  27. Добавить колонку с отношением количества сэмплов с амплитудой выше заданного порога к общему количеству сэмплов для каждого аудиофайла.

  28. Добавить колонку со значениями для гистограммы распределения отношения количества сэмплов с амплитудой выше заданного порога к общему количеству сэмплов для каждого аудиофайла.

  29. Добавить колонку с отношением количества сэмплов с амплитудой ниже заданного порога к общему количеству сэмплов для каждого аудиофайла.

  30. Добавить колонку со значениями для гистограммы распределения отношения количества сэмплов с амплитудой ниже заданного порога к общему количеству сэмплов для каждого аудиофайла.