Skip to content

Latest commit

 

History

History
44 lines (31 loc) · 3.09 KB

File metadata and controls

44 lines (31 loc) · 3.09 KB

Лабораторная работа № 4

Анализ и визуализация данных

Теория

pandas

Pandas — это библиотека для анализа и обработки данных. Она предоставляет инструменты для управления и анализа структурированных данных.

Установка:

pip install pandas

Пример чтения данных:

import pandas as pd  # импорт

df = pd.read_csv("data.csv")  # загрузка данных из csv файла
print(df.head())  # отображение первых строк таблицы

Полезные ссылки

Задание

Использовать данные и аннотацию из второй лабораторной работы.

  • Сформировать DataFrame, который будет содержать 2 колонки - абсолютный и относительный пути к файлу.
  • Произвести именование колонок сформированного DataFrame. Названия колонок должны отражать содержимое данных.
  • Добавить в DataFrame три столбца, первый из которых содержит информацию о высоте изображения, второй о ширине, а третий о глубине (количество каналов).
  • С использованием Pandas вычислить статистическую информацию для столбцов, содержащих информацию о размерах изображения (ширина, высота, глубина).
  • Написать функцию, которая на вход принимает максимальное значение ширины и максимальное значение высоты изображения, а возвращает отфильтрованный по заданным параметрам DataFrame. Условие фильтрации - в новый DataFrame включаются те строки, для которых размеры удовлетворяют следующему условию: height <= max_height и width <= max_width.
  • Создать новый столбец, который будет содержать площадь изображения (длина * ширина).
  • Отсортировать данные таблицы по площади изображений (от меньшего к большему).
  • Создать гистограмму распределения площадей изображений. Выполнить отрисовку гистограммы с помощью библиотеки matplotlib. График и оси должны иметь соответствующие подписи.