rafaels100/TPFinal_NaiveBayes_laboDatosUBA
Folders and files
| Name | Name | Last commit date | ||
|---|---|---|---|---|
Repository files navigation
TP Final Laboratorio de Datos: Análisis de tweets sobre películas En este trabajo final para la materia Laboratorio de Datos dictada para la carrera Lic. en Ciencias de Datos de la UBA entrenamos un modelo de clasificación utilizando Naive Bayes para clasificar Tweets basados en las palabras utilizadas en éstos. El modelo se entrenó con una base de datos de reviews de peliculas obtenidas en el sitio https://www.imdb.com/, donde aprendió a clasificar (de manera supervisada) comentarios positivos o negativos, según las palabras utilizadas en los mismos. Luego, utilizamos el modelo entrenado para clasificar una base de datos de tweets sobre peliculas, en 'reviews' positivas o negativas, según las palabras utilizadas en el tweet. Observamos luego las distribuciones de comentarios positivos y negativos en ambos sitios, Twitter e IMBD, y pudimos comprobar que las opiniones de las personas en ambos sitios eran muy similares: el modelo clasificó similares porcentajes de reviews positivas y negativas para las peliculas que analizamos en IMDB.