Este repositorio contiene una colección de notebooks y recursos para el curso de Introducción al Procesamiento del Lenguaje Natural. El curso está diseñado para estudiantes y profesionales que desean adentrarse en el mundo del PLN, comenzando desde conceptos básicos hasta técnicas más avanzadas.
- Comprender los fundamentos del Procesamiento del Lenguaje Natural
- Aprender a trabajar con diferentes tipos de corpus lingüísticos
- Desarrollar habilidades prácticas en el preprocesamiento de texto
- Implementar modelos básicos de PLN
- Familiarizarse con las principales bibliotecas y herramientas del ecosistema PLN
- Expresiones Regulares
- Análisis de Valoraciones
- Modelos N-gramas - Implementación de modelos de lenguaje basados en n-gramas utilizando el corpus Reuters
- Valoraciones de Restaurantes - Este dataset contiene reseñas de restaurantes en español, ideal para practicar análisis de texto y expresiones regulares.
- Python 3.7+
- Jupyter Notebook o JupyterLab
- Bibliotecas principales:
- nltk
- pandas
- numpy
- matplotlib
- scikit-learn
- Clona este repositorio:
git clone https://github.com/cbadenes/curso-pln.git- Instala las dependencias necesarias:
pip install -r requirements.txt- Descarga los recursos necesarios de NLTK:
import nltk
nltk.download('reuters')
nltk.download('punkt')- Abre los notebooks en Jupyter:
jupyter notebookCada notebook sigue una estructura similar:
- Introducción teórica al concepto
- Implementación práctica
- Ejercicios y ejemplos
- Referencias adicionales
Las contribuciones son bienvenidas. Si deseas contribuir:
- Haz fork del repositorio
- Crea una nueva rama para tu funcionalidad
- Envía un pull request
Este proyecto está bajo la Licencia MIT - ver el archivo LICENSE para más detalles.
Para dudas, sugerencias o colaboraciones, no dudes en:
- Abrir un issue en este repositorio
- Contactar a través de carlos.badenes
- A la comunidad NLTK por sus excelentes recursos y documentación
- A todos los contribuidores y estudiantes que ayudan a mejorar este material
⭐️ Si este curso te resulta útil, no dudes en darle una estrella al repositorio.