GitHub - TinyMightyByte/banking-datastack

TODO:

DEBAZIUM: ❌ Set up monitoring on your Postgres pg_replication_slots size ❌ If your transaction table is massive (billions of rows), you need to configure snapshot.mode carefully.

KAFKA: ❌ Handle schema evolution explicitly ❌ Handle deletes (ignored) ❌ Deduplicate records ❌ Enforce exactly-once semantics

use Kafka Connect S3 Sink Connector
use In-Memory Buffers
the sudden exit data flush is not working.

group_id

Multiple consumers with same group split the workload, If one dies, Kafka rebalances partitions

If your use case needs:

Audit trails
Slowly Changing Dimensions (SCD)
Time travel

Parquet: Columnar Storage Choice, Not ideal for row-based OLTP reads

############################################

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
banking_dbt		banking_dbt
cicd_template		cicd_template
consumer		consumer
data-generator		data-generator
docker/dags		docker/dags
docs		docs
kafka-debazium		kafka-debazium
postgres		postgres
.gitignore		.gitignore
.venv		.venv
README.md		README.md
docker-compose.yaml		docker-compose.yaml
dockerfile-airflow.dockerfile		dockerfile-airflow.dockerfile
requirements.txt		requirements.txt
tdocker-compose.yml1		tdocker-compose.yml1

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages