Skip to content

rafaels100/TPFinal_NaiveBayes_laboDatosUBA

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

7 Commits
 
 
 
 
 
 

Repository files navigation

TP Final Laboratorio de Datos: Análisis de tweets sobre películas

En este trabajo final para la materia Laboratorio de Datos dictada para la carrera Lic. en Ciencias de Datos de la UBA entrenamos un modelo de clasificación
utilizando Naive Bayes para clasificar Tweets basados en las palabras utilizadas en éstos. El modelo se entrenó con una base de datos de reviews de peliculas obtenidas
en el sitio https://www.imdb.com/, donde aprendió a clasificar (de manera supervisada) comentarios positivos o negativos, según las palabras utilizadas en los mismos.

Luego, utilizamos el modelo entrenado para clasificar una base de datos de tweets sobre peliculas, en 'reviews' positivas o negativas, según las palabras utilizadas en el
tweet.
Observamos luego las distribuciones de comentarios positivos y negativos en ambos sitios, Twitter e IMBD, y pudimos comprobar que las opiniones de las personas
en ambos sitios eran muy similares: el modelo clasificó similares porcentajes de reviews positivas y negativas para las peliculas que analizamos en IMDB.

About

Clasificación de tweets sobre películas utilizando Naive Bayes

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors