2024-01-27

整站

算法学习概述

本章节系统梳理AI领域的核心知识体系，从传统ML到前沿的 AI Agent 与大模型应用，涵盖理论基础、工程实践与行业应用。
区别于纯理论推导，本 wiki 更侧重算法工程化与生产环境实践，记录在实际业务场景中落地 AI 技术的经验总结、踩坑记录与最佳实践。

知识图谱

本章的核心内容以 AI 为主线，近期重点关注 AI Agent 架构设计与大语言模型（LLM）工程化。以下是完整的知识体系结构：

六大核心模块

1. 机器学习（Machine Learning）

涵盖机器学习基础概念、经典算法原理与实战应用：

监督学习：线性回归、逻辑回归、决策树、随机森林、SVM、朴素贝叶斯
无监督学习：聚类算法（K-Means、DBSCAN）、降维（PCA、t-SNE）
集成学习：Bagging、Boosting、XGBoost、LightGBM
模型评估：交叉验证、ROC-AUC、过拟合与正则化

2. 深度学习（Deep Learning）

神经网络架构设计与训练技巧：

基础网络：全连接网络、CNN卷积神经网络、RNN循环神经网络
现代架构：ResNet、DenseNet、EfficientNet、Vision Transformer
训练技术：梯度下降优化器、学习率调度、批归一化、Dropout
框架实战：TensorFlow 2.x / PyTorch 项目实践

3. 计算机视觉（Computer Vision）

深度学习在图像领域的应用：

目标检测：YOLO系列、Faster R-CNN、SSD、CenterNet
图像分类：图像识别、细粒度分类、零样本学习
OCR文字识别：文本检测（PSENet、DBNet）、文本识别（CRNN、SVTR）
图像分割：语义分割、实例分割、全景分割

4. 自然语言处理（NLP）

文本理解与生成技术：

基础技术：分词、命名实体识别、句法分析、文本分类
预训练模型：BERT、RoBERTa、GPT系列、T5
应用任务：机器翻译、文本摘要、情感分析、问答系统

5. 大语言模型（LLM）

从入门到精通的完整路径：

基础入门：Prompt Engineering、上下文学习、Chain-of-Thought
应用开发：RAG检索增强生成、向量数据库、Embedding模型
模型微调：LoRA、QLoRA、Prefix Tuning、P-Tuning
原理探究：Transformer架构、注意力机制、位置编码、解码策略

6. 算法工程（MLOps）

将算法从实验室部署到生产环境：

基础设施：GPU集群管理、模型服务化（Triton、TorchServe）
特征工程：特征存储（Feature Store）、实时特征计算
模型管理：版本控制（MLflow）、A/B测试、模型监控
性能优化：模型量化、剪枝、蒸馏、TensorRT加速

职业发展路径

掌握本章知识体系，可胜任以下岗位：

岗位	核心能力	技术栈
数据分析师	数据清洗、统计分析、可视化	Python、Pandas、SQL、Matplotlib
机器学习工程师	特征工程、模型训练与优化	Scikit-Learn、XGBoost、特征平台
深度学习工程师	神经网络设计、模型部署	PyTorch/TensorFlow、CUDA、模型优化
AI工程师	全栈AI系统开发	LLM、RAG、Agent、多模态
算法架构师	大规模算法系统设计	分布式训练、模型服务、性能优化

学习路线图

阶段一：Python编程基础

Python基本语法与数据结构
面向对象编程与函数式编程
常用标准库与第三方库

阶段二：数据处理与分析

NumPy：数值计算与矩阵运算
Pandas：数据清洗、处理与分析
Matplotlib/Seaborn：数据可视化与报表

阶段三：机器学习实战

机器学习基本概念与算法原理
使用 Scikit-Learn 完成端到端项目
模型调参与超参数优化

阶段四：深度学习进阶

神经网络与反向传播原理
TensorFlow/PyTorch 框架实战
计算机视觉或NLP专项深入

阶段五：AI工程化与前沿

大模型应用开发（RAG、Agent）
模型部署与性能优化
参与开源项目或实际业务落地