Deep Learning Projects

A collection of deep learning implementations covering transformer architectures, multimodal systems, and retrieval-augmented generation.

Projects

Qwen3 Language Model from Scratch

Building a modern Transformer-based language model from the ground up. This project implements all core components of the Qwen3 architecture including:

Grouped Query Attention mechanism
Root Mean Square Layer Normalization
Feed Forward networks
Key-Value caching for efficient inference
Complete Transformer blocks

View Project →

Multimodal RAG System

An end-to-end Retrieval-Augmented Generation pipeline that processes PDF documents containing both text and images. Features:

Multimodal embeddings with Jina-CLIP
Vector database storage with ChromaDB
Image and text extraction from PDFs
Question-answering with Phi-3-Vision
Interactive chat interface

View Project →

Vision Transformer Fine-Tuning with LoRA

Parameter-efficient fine-tuning of Vision Transformer models using Low-Rank Adaptation for food image classification. Features:

LoRA integration reducing trainable parameters by 98.56%
Vision Transformer (ViT) architecture
Food101 dataset with 101 food categories
Data augmentation pipeline
Mixed precision training
Experiment tracking with Weights & Biases

View Project →

Jeopardy Dataset Curation for NER Validation

A pipeline for curating validation datasets from 216,930 Jeopardy questions to evaluate Named Entity Recognition (NER) algorithms. Features:

LLM-based classification using Qwen3-4B-Instruct
Stratified sampling maintaining category distribution
Three linguistic challenge categories (numbers, non-English words, unusual proper nouns)
GPU-accelerated batch processing with checkpointing
Statistical analysis across the full dataset

View Project →

Name		Name	Last commit message	Last commit date
Latest commit History 31 Commits
data-curation		data-curation
insurance-claim-language-model		insurance-claim-language-model
qwen-from-scratch		qwen-from-scratch
retrieval-augmented		retrieval-augmented
vit-semantic-segmentation		vit-semantic-segmentation
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Deep Learning Projects

Projects

Qwen3 Language Model from Scratch

Multimodal RAG System

Vision Transformer Fine-Tuning with LoRA

Jeopardy Dataset Curation for NER Validation

About

Uh oh!

Languages

yvesemmanuel/deep-learning

Folders and files

Latest commit

History

Repository files navigation

Deep Learning Projects

Projects

Qwen3 Language Model from Scratch

Multimodal RAG System

Vision Transformer Fine-Tuning with LoRA

Jeopardy Dataset Curation for NER Validation

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Languages