Projeto 01 da disciplina CPS833 do PESC da Coppe. O objetivo do projeto é achar regras associativas na base do projeto Movie Lens que faz sugestões de de filmes aos seus usuários a partir de filmees por eles já vistos.
Neste projeto utilizei bibliotecas em Python para fazer a exploração e limpeza dos dados. o arquivo proj-environment.yml tem a definição de um ambiente Anaconda utilizado no projeto.
No Anaconda Prompt na raiz do projeto
REM create conda environment from Yaml file
conda env create -f proj-environment.yml
REM activate environment
conda activate movielens_envPor hora manual. No futuro podemos adicionar um script para fazer o dowload.
Para rodar os notebooks jupyter (.ipynb)
jupyter labPara rodar os ().py)
pythonO projeto segue a ideia, na medida do possível do procesos MicrosoftTDSP para projetos de ciencia de dados. As pastas do projeto seguem as fases do projeto
- DataUnderstanding - visualização e limpeza de dados
- Modeling - Aplicaçãpo de ML
- RawData - local para os dados originais, não versionados para diminuir o peso do repositório.
- Encontre 100+/-5 regras de associação, variando o suporte e a confiança, de modo que tanto o lift quanto o chi-square sejam utilizados para avaliar as melhores regras.
- Gere uma tabela comparando as regras como seguinte formato: Regra | suporte | confiança | lift (B,C) e (B,!C) | chi-square...
- A regra deve ter os nomes dos filmes: Toy Story => Richard III. Regras com apenas dois itens.
- Aplique os mesmos parâmetros no conjunto de 1M e gere a tabela acima. Discuta brevemente se os parâmetros produziram um resultado semelhante ou se seria necessário adaptá-los, e como.
- Gerar um PDF e entregar.
- Thiago S.
See also the list of contributors who participated in this project.
Meu desejp é que possa servir a outros. Aproveite.
LICENSE.md file for details