Bộ dữ liệu ảnh Captcha ngân hàng Việt Nam do Vani Studio thu thập và chuẩn hoá, phục vụ cho việc huấn luyện mô hình OCR / AI nhận diện Captcha thực tế từ các hệ thống Internet Banking.
Hiện tại dataset đã có: Vietcombank (VCB) và MBBank (MBB).
Dữ liệu được gán nhãn chính xác và kiểm tra ngẫu nhiên để đảm bảo độ tin cậy.
Ảnh minh hoạ, không đại diện toàn bộ tập dữ liệu. Dataset đầy đủ chứa hàng nghìn mẫu Captcha thật, đã được xử lý và đặt tên theo nhãn tương ứng.
git clone https://github.com/vanistudio/dataset-images-captcha-banking.git
cd dataset-images-captcha-bankingBộ dữ liệu này chỉ phục vụ:
- Nghiên cứu và phát triển trí tuệ nhân tạo (AI / OCR)
- Mục đích học thuật, huấn luyện mô hình nhận dạng ký tự
Không sử dụng để vượt qua hoặc can thiệp hệ thống bảo mật của ngân hàng.
© 2025 Vani Studio — Dự án mã nguồn mở phục vụ cộng đồng AI Việt Nam
https://github.com/vanistudio/dataset-images-captcha-banking
Mọi đóng góp, ý tưởng hoặc bổ sung dataset ngân hàng mới đều được hoan nghênh.
Bạn có thể:
- Mở Pull Request để thêm dữ liệu mới (BIDV, ACB, Techcombank, TPBank,…)
- Báo lỗi hoặc gợi ý qua Issues
- Đóng góp tool crawler / converter / trainer
“Data is the soul of every AI.”
Dự án này hướng tới việc chuẩn hoá và chia sẻ nguồn dữ liệu Captcha ngân hàng Việt Nam
giúp cộng đồng nghiên cứu AI OCR có cơ sở dữ liệu minh bạch, phong phú và dễ mở rộng. 🚀

