Skip to content

zimingttkx/AI-Practices

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

547 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

🚀 AI-Practices

系统化人工智能学习与实践平台

Python PyTorch TensorFlow License

Stars Forks

English | 快速开始 | 项目路线图


从数学原理到工程实践,构建完整的AI知识体系


项目概览

500+ Python文件 280+ Notebooks 14大核心模块 100+ 单元测试 2枚Kaggle金牌
生产级代码实现 可交互式学习 系统化知识体系 代码质量保证 竞赛实战验证

核心特点

  • 系统化学习路径 — 从基础数学到前沿技术,14个模块循序渐进
  • 理论与实践结合 — 每个概念都有数学推导和代码实现
  • 工程化标准 — 遵循工业级代码规范,包含完整测试
  • 竞赛级方案 — 包含Kaggle Top 1%金牌解决方案

模块架构

AI-Practices/
│
├── 第一阶段:机器学习基础
│   └── 01-foundations/              # 线性模型、SVM、决策树、集成学习、降维、聚类
│
├── 第二阶段:深度学习核心
│   ├── 02-neural-networks/          # 神经网络基础、优化器、正则化
│   ├── 03-computer-vision/          # CNN架构、迁移学习、目标检测
│   └── 04-sequence-models/          # RNN/LSTM、Attention、Transformer
│
├── 第三阶段:高级专题
│   ├── 05-advanced-topics/          # 函数式API、回调函数、模型优化
│   ├── 06-generative-models/        # VAE、GAN、Diffusion Models
│   └── 07-reinforcement-learning/   # DQN、PPO、SAC、Actor-Critic
│
├── 第四阶段:大模型与多模态
│   ├── 10-large-language-models/    # Transformer、GPT/LLaMA、LoRA、RAG、Agent
│   └── 11-multimodal-learning/      # CLIP、Stable Diffusion、Whisper、TTS
│
├── 第五阶段:工程化部署
│   ├── 12-deployment-optimization/  # 量化剪枝、TensorRT、FastAPI、MLOps
│   └── 13-distributed-training/     # DDP、FSDP、ZeRO、混合精度训练
│
├── 第六阶段:智能体系统
│   └── 14-agents-reasoning/         # 工具调用、推理策略、多智能体、自主Agent
│
├── 理论参考
│   └── 08-theory-notes/             # 激活函数、损失函数、架构速查
│
└── 实战项目
    └── 09-practical-projects/       # Kaggle竞赛、游戏AI、跨模块集成系统

详细模块说明

01-foundations | 机器学习基础

子模块 核心内容 关键算法
01-training-models 模型训练基础 线性回归、梯度下降、正则化
02-classification 分类算法 逻辑回归、MNIST实战
03-support-vector-machines 支持向量机 核技巧、软间隔、SVM回归
04-decision-trees 决策树 CART、剪枝策略
05-ensemble-learning 集成学习 Bagging、Boosting、XGBoost、Stacking
06-dimensionality-reduction 降维技术 PCA、t-SNE、LLE、UMAP
07-unsupervised-learning 无监督学习 K-Means、DBSCAN、GMM
08-end-to-end-project 完整ML项目 加州房价预测

02-neural-networks | 神经网络

子模块 核心内容
01-keras-introduction Keras入门、Sequential/Functional API
02-training-deep-networks BatchNorm、Dropout、初始化策略
03-custom-models-training 自定义层、训练循环、TensorFlow底层
04-data-loading-preprocessing 数据管道、TFRecord、预处理

03-computer-vision | 计算机视觉

子模块 核心内容
01-cnn-basics CNN基础、池化层、ResNet实现
02-classic-architectures 经典架构演进
03-transfer-learning 迁移学习、猫狗分类实战
04-visualization 特征可视化、中间层激活

04-sequence-models | 序列模型

子模块 核心内容
01-rnn-basics RNN基础、LSTM、时间序列预测
02-lstm-gru LSTM/GRU高级用法
03-text-processing 词嵌入、One-hot编码
04-cnn-for-sequences 一维卷积处理序列
05-transformer Self-Attention、Multi-Head、BERT/GPT基础

05-advanced-topics | 高级专题

子模块 核心内容
01-functional-api 多输入多输出、残差连接、Inception
02-callbacks-tensorboard 回调函数、TensorBoard可视化
03-model-optimization 量化、剪枝、知识蒸馏、部署

06-generative-models | 生成模型

子模块 核心内容
01-vae Vanilla AE、VAE、VQ-VAE
02-gans GAN、DCGAN、WGAN-GP
03-diffusion DDPM原理与实现
04-text-generation 字符级LSTM文本生成
05-deepdream DeepDream艺术生成

07-reinforcement-learning | 强化学习

子模块 核心内容 测试覆盖
01-mdp-basics MDP、值迭代、策略迭代
02-temporal-difference TD学习、SARSA
03-q-learning Q-Learning、探索策略
04-deep-q-learning DQN、Double DQN、Dueling DQN、Rainbow
05-policy-gradient REINFORCE、基线方法
06-actor-critic A2C、PPO
07-advanced-algorithms SAC、TD3、DDPG
08-reward-optimization 奖励塑形、好奇心驱动、逆强化学习

08-theory-notes | 理论笔记

快速参考手册,包含:

  • 激活函数对比与选择
  • 损失函数详解
  • 网络架构速查(CNN、RNN、Dense)

09-practical-projects | 实战项目

子模块 项目内容
01-ml-basics Titanic生存预测、Otto分类、SVM文本分类、XGBoost进阶
02-computer-vision MNIST CNN分类
03-nlp 情感分析LSTM、Transformer文本分类、NER、机器翻译
04-time-series 温度预测、股票预测LSTM
05-kaggle-competitions 4个Kaggle竞赛方案(含2个金牌)
06-reinforcement-learning Flappy Bird DQN、Dino Run、股票交易RL
07-integrated-systems 多模态检索、视觉问答Agent、代码助手(109个测试)

Kaggle竞赛成绩

竞赛 排名 奖牌
Feedback Prize - ELL Top 1% 🥇 金牌
RSNA Abdominal Trauma Top 1% 🥇 金牌
American Express Default Top 5% 🥈 银牌
RSNA Lumbar Spine Top 10% 🥉 铜牌

10-large-language-models | 大语言模型

子模块 核心内容 测试覆盖
01-llm-fundamentals Transformer架构、Tokenizer
02-pretrained-models GPT、LLaMA从零实现
03-fine-tuning LoRA、QLoRA高效微调
04-prompt-engineering Few-shot、Chain-of-Thought
05-rag 向量数据库、检索增强生成
06-agents 工具调用、记忆管理
07-alignment RLHF、DPO对齐训练

11-multimodal-learning | 多模态学习

子模块 核心内容 测试覆盖
01-vision-language CLIP、BLIP、LLaVA
02-image-generation VAE、Diffusion、ControlNet
03-audio-models Whisper语音识别、TTS语音合成

12-deployment-optimization | 部署优化

子模块 核心内容 测试覆盖
01-model-optimization 量化、剪枝、蒸馏、ONNX导出
02-inference-engines TensorRT、vLLM、ONNX Runtime
03-serving-systems FastAPI、Triton、负载均衡
04-mlops 实验追踪、模型注册、监控告警

13-distributed-training | 分布式训练

子模块 核心内容 测试覆盖
01-data-parallel DDP、FSDP、ZeRO
02-model-parallel 张量并行、流水线并行、序列并行
03-mixed-precision AMP、BF16、梯度缩放
04-large-scale-training DeepSpeed、Megatron-LM

14-agents-reasoning | 智能体与推理

子模块 核心内容 测试覆盖
01-tool-use Function Calling、工具注册、结构化输出
02-reasoning CoT、ReAct、ToT、自一致性、反思
03-memory-systems 短期记忆、长期记忆、向量检索
04-planning 任务分解、计划生成、动态重规划
05-multi-agent 辩论式推理、协作式推理、共识达成
06-autonomous-agent 目标管理、行动执行、自主循环

核心算法覆盖

机器学习

线性模型: OLS, Ridge, Lasso, ElasticNet
分类算法: Logistic Regression, SVM, KNN
树模型: Decision Tree, Random Forest, GBDT
集成学习: Bagging, Boosting, Stacking, XGBoost, LightGBM
降维聚类: PCA, t-SNE, UMAP, K-Means, DBSCAN

深度学习

优化器: SGD, Momentum, Adam, AdamW, LAMB
正则化: Dropout, BatchNorm, LayerNorm, Weight Decay
CNN架构: LeNet → AlexNet → VGG → ResNet → EfficientNet → ViT
序列模型: RNN → LSTM → GRU → Transformer → BERT → GPT

强化学习

值函数方法: Q-Learning, DQN, Double DQN, Dueling DQN, Rainbow
策略梯度: REINFORCE, PPO, TRPO
Actor-Critic: A2C, A3C, SAC, TD3

生成模型

自编码器: AE, VAE, VQ-VAE
对抗网络: GAN, DCGAN, WGAN-GP, StyleGAN
扩散模型: DDPM, Stable Diffusion

大模型技术

架构: Transformer, GPT, LLaMA
微调: LoRA, QLoRA, Adapter
推理: RAG, CoT, ReAct, ToT
对齐: RLHF, DPO

技术栈

深度学习框架 数据科学 开发工具
PyTorch 2.x NumPy Python 3.10+
TensorFlow 2.13+ Pandas Jupyter Lab
Keras 3.x Scikit-Learn Docker

快速开始

# 克隆仓库
git clone https://github.com/zimingttkx/AI-Practices.git
cd AI-Practices

# 创建环境
conda create -n ai-practices python=3.10 -y
conda activate ai-practices

# 安装依赖
pip install -r requirements.txt

# 启动Jupyter
jupyter lab

硬件要求

组件 最低配置 推荐配置
CPU 4核 8核+
内存 8 GB 32 GB
GPU GTX 1060 RTX 3080+
存储 50 GB 200 GB SSD

学习路径建议

入门阶段 (1-2个月)
├── 01-foundations          # 机器学习基础
├── 02-neural-networks      # 神经网络入门
└── 08-theory-notes         # 理论参考

进阶阶段 (2-3个月)
├── 03-computer-vision      # 计算机视觉
├── 04-sequence-models      # 序列模型
├── 05-advanced-topics      # 高级专题
└── 06-generative-models    # 生成模型

高级阶段 (2-3个月)
├── 07-reinforcement-learning  # 强化学习
├── 10-large-language-models   # 大语言模型
└── 11-multimodal-learning     # 多模态学习

工程化阶段 (1-2个月)
├── 12-deployment-optimization # 部署优化
├── 13-distributed-training    # 分布式训练
└── 14-agents-reasoning        # 智能体系统

实战阶段 (持续)
└── 09-practical-projects      # 项目实战

引用

@misc{ai-practices2024,
  author       = {zimingttkx},
  title        = {AI-Practices: 系统化人工智能学习与实践平台},
  year         = {2024},
  publisher    = {GitHub},
  howpublished = {\url{https://github.com/zimingttkx/AI-Practices}}
}

许可证

本项目采用 MIT License 开源协议 - 详见 LICENSE


如果这个项目对你有帮助,请给一个 ⭐ Star!

Report Bug Request Feature

About

🎓 机器学习与深度学习实战教程 | Comprehensive ML & DL Tutorial with Jupyter Notebooks | 包含线性回归、神经网络、CNN、RNN等完整教程

Topics

Resources

License

Code of conduct

Contributing

Security policy

Stars

Watchers

Forks

Releases

No releases published

Sponsor this project

Packages

 
 
 

Contributors