🤖

图解机器学习算法

通过互动模拟,探索 KNN、感知器、线性回归与聚类算法的工作原理

🎯 分类问题 📈 回归问题 🔵 聚类问题
🎯

K近邻算法(KNN)

小强的哥哥该加入哪个社团?

🤔 探索问题

小强的哥哥身高183cm,肺活量3.5L。他应该加入游泳社团还是篮球社团?
改变 K值小强哥哥的数据,看看结果会怎么变化!

3
183
3.5

计算中...

🏀 篮球社团成员

身高偏高(185-192cm),肺活量偏低(3.0-3.4L)

🏊 游泳社团成员

身高偏低(170-182cm),肺活量偏高(3.5-4.0L)
🧒
这个算法有点像"墙头草",根据K值画个圈,圈内哪边人多就分到哪边!
对!K是你们定义的参数,NN是 Nearest Neighbor(最近邻居)。看周围邻居来做决定!
🤖
✏️

感知器(Perceptron)

用一条线把两个社团分开

🤔 探索问题

感知器的核心是找到一条分界线,把两类数据分开。
拖动滑块调整分界线的位置和角度,看看能否完美分类!

1.5
-27

调整分界线...

⚠️ 感知器的局限性:只有当两类数据可以被一条直线完全分开时(线性可分),感知器才能正确工作。如果数据混在一起,就需要更复杂的神经网络了。
📈

线性回归

根据年龄预测身高

🤔 探索问题

一个孩子5-11岁的身高数据已知,12岁时她的身高会是多少?
调整预测年龄,观察线性回归如何做出预测!

12

预测身高

-- cm

自变量:年龄(输入)
因变量:身高(输出/预测)
回归 = 预测:根据已知数据找规律,预测未知数据的值(通常是连续数值)

分类 vs 回归:有什么区别?

🎯 分类问题

预测结果是类别(离散值)
例:是否是垃圾邮件(0或1)
例:加入哪个社团

📈 回归问题

预测结果是数值(连续值)
例:预测身高(155.3cm)
例:预测购物金额

🔵

K-平均分群法(K-means)

学校校车停靠点怎么安排?

🤔 探索问题

学校要安排校车接送点,图中每个点代表一个学生小区。
改变 K值(校车数量),观察分群结果如何变化!

校车数量 K = 2

📍 地图视图

📋 分群结果

K-means 算法步骤

1

预先设定要分成几个群(K值),即派出几辆校车

2

随机设定K个点作为初始停靠点(质心)

3

每个学生小区归入距离最近的停靠点所在群

4

将停靠点移动到各群的中心位置

重复步骤3和4,直到停靠点不再移动为止

聚类 vs 分类:分类问题事先知道类别(游泳/篮球),聚类问题事先不知道要分成什么,完全根据数据相似性自动分群。这就是无监督学习
🗺️

机器学习知识地图

点击各节点,查看详细说明

机器学习 监督学习 无监督学习 强化学习 分类问题 回归问题 聚类问题 序贯决策问题 KNN 感知器 线性回归 阶层式分群 K-means 擅长解决的问题 ↑ 学习方式 常见算法