基于 Oliver Theobald 《Machine Learning For Absolute Beginners》的交互式学习课程
点击任意章节卡片进入详细教程。每章包含概念理解、算法原理、工程应用、例题和 Python 代码实践。
什么是ML、与传统编程的区别、Arthur Samuel定义、学习类型概览、应用场景
标签数据、回归与分类、训练流程、模型评估基础、损失函数
聚类、降维、关联规则、Q-learning、探索与利用、环境交互
缺失值处理、异常值、独热编码、特征缩放、特征选择、数据转换
训练/测试/验证集、交叉验证、随机化、分层抽样、数据泄露防范
线性回归、最小二乘、逻辑回归、sigmoid函数、多项式回归、正则化
K-近邻、朴素贝叶斯、SVM、评估指标、混淆矩阵、ROC曲线
决策树、信息增益、随机森林、AdaBoost、梯度提升、XGBoost
建议按以下进度完成学习,每周投入 5-7 小时。理解算法原理优先于调包,配合 Python 代码动手实践。
理解机器学习与传统编程的本质区别;掌握监督学习的回归与分类框架;建立数据驱动的思维模式。
探索无监督与强化学习的世界;掌握数据清洗与特征工程——这是ML中最耗时但最关键的步骤。
学会正确划分数据与验证模型;深入理解线性回归与逻辑回归的原理,而非仅仅调用函数。
掌握KNN、朴素贝叶斯、SVM等分类器;理解决策树的可解释性与集成方法的强大威力。
用聚类发现数据中隐藏的分组;揭开神经网络的神秘面纱,理解反向传播的本质。
掌握偏差-方差权衡与模型调优;将所学知识应用于完整的端到端机器学习项目。