Streaming-data-twitter

Project ini tentang implementasi dari Streaming Data yang bersumber dari Twitter. Data tersebut berupa Tweet, user id serta tangggal tweet tersebut dibuat. Dalam streaming data dari twitter tersebut, digunakan library Apache Kafka menyimpan nya dalam database phpmyadmin

Twitter data stream.py berisikan program untuk terhubung dengan twitter api dan melakukan streaming menggunakan kafka

ETL proses.py berikan program untuk melakukan proses ekstraksi dari consumer kafka, transform untuk merubah data agar sesuai dengan skema yang telah ditentukan sehingga dapat dilakukan load kedalam phpmyadmin

Dump data.py berisikan program untuk mengambil seluruh data yang telah di load untuk dijadikan sebagai file csv

Contoh evaluasi Machine learning yang digunakan adalah Clustering yang dapat di lihat pada https://colab.research.google.com/drive/1mkUqC8y_iAIVnMvELVOez5cvRBvWEvTH?usp=sharing

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Streaming-data-twitter

FilesExpand file tree

README.md

Latest commit

History

README.md

File metadata and controls

Streaming-data-twitter