课程内容¶
头条投满分:工业级文本分类实战¶
本课程围绕"头条新闻分类"真实场景,从0到1打造高精度文本分类系统,覆盖传统机器学习、深度学习到最前沿的预训练模型的全栈技术栈,并深入模型压缩部署优化。学员将通过完整项目实战掌握NLP工业级开发全流程。
核心亮点¶
🔥 全技术链覆盖:贯穿特征工程→经典算法→前沿模型→模型压缩全流程
📱 工业级优化:特别包含量化/蒸馏/剪枝等部署必备压缩技术
📊 多方案对比:同一数据集下对比随机森林/FastText/BERT性能差异
🛠 即学即用:提供可快速迁移到舆情分析/客服分类等场景的代码模板
技术栈¶
| 技术方向 | 具体内容 |
|---|---|
| 基础模型 | 随机森林(Scikit-learn)、FastText(字符级CNN)、BERT(HuggingFace) |
| 模型压缩 | 量化(PTQ/QAT)、知识蒸馏(Teacher-Student)、剪枝(权重/神经元/层剪枝) |
| 辅助工具 | Flask服务化框架、Streamlit服务化框架、可视化(Netron)、Gradio服务化框架 |
学习收获¶
✅ 获得可复用的文本分类完整项目经验
✅ 掌握工业界主流的模型压缩方法论
✅ 建立不同场景下的模型选型判断能力