Skip to content

mtsz-thiago/MovieLens

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

28 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

MovieLens

Projeto 01 da disciplina CPS833 do PESC da Coppe. O objetivo do projeto é achar regras associativas na base do projeto Movie Lens que faz sugestões de de filmes aos seus usuários a partir de filmees por eles já vistos.

Prerequisites

Neste projeto utilizei bibliotecas em Python para fazer a exploração e limpeza dos dados. o arquivo proj-environment.yml tem a definição de um ambiente Anaconda utilizado no projeto.

Installing

Setup do ambiente utilizando Anaconda

No Anaconda Prompt na raiz do projeto

REM create conda environment from Yaml file
conda env create -f proj-environment.yml

REM activate environment
conda activate movielens_env

Download dos dados

Por hora manual. No futuro podemos adicionar um script para fazer o dowload.

Rodando os códigos

Para rodar os notebooks jupyter (.ipynb)

jupyter lab

Para rodar os ().py)

python

Sobre a Estrutura do Projeto

O projeto segue a ideia, na medida do possível do procesos MicrosoftTDSP para projetos de ciencia de dados. As pastas do projeto seguem as fases do projeto

  • DataUnderstanding - visualização e limpeza de dados
  • Modeling - Aplicaçãpo de ML
  • RawData - local para os dados originais, não versionados para diminuir o peso do repositório.

Objetivos do estudo

  • Encontre 100+/-5 regras de associação, variando o suporte e a confiança, de modo que tanto o lift quanto o chi-square sejam utilizados para avaliar as melhores regras.
  • Gere uma tabela comparando as regras como seguinte formato: Regra | suporte | confiança | lift (B,C) e (B,!C) | chi-square...
  • A regra deve ter os nomes dos filmes: Toy Story => Richard III. Regras com apenas dois itens.
  • Aplique os mesmos parâmetros no conjunto de 1M e gere a tabela acima. Discuta brevemente se os parâmetros produziram um resultado semelhante ou se seria necessário adaptá-los, e como.
  • Gerar um PDF e entregar.

Authors

  • Thiago S.

See also the list of contributors who participated in this project.

License

Meu desejp é que possa servir a outros. Aproveite.

LICENSE.md file for details

About

No description, website, or topics provided.

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors