🧠

无监督学习

爸妈上班,我自学!

探索 AI 如何在没有"老师"的情况下,自己发现数据中的规律

🤔

思考一下……

如果你是一个刚来地球的外星人,从没见过水果,没有人告诉你它们叫什么名字—— 你能自己把它们分成几组吗? 你会用什么标准来分?

🍌 香蕉 🍇 葡萄 🍎 苹果 🍈 榴莲 🍓 草莓 🥭 芒果
🍎
第一站
水果分类游戏
体验聚类思维
🐾
第二站
AI 动物分群
模拟 K-Means
⚔️
第三站
监督 vs 无监督
终极对比
1

水果分类游戏

你是外星人,没人告诉你名字——但你可以观察!

💡

任务说明

观察下面的水果,根据「能不能带皮吃」把它们分成两组。点击水果卡片,选择它属于哪一组!

🟣 A 组:可以带皮吃
🔴 B 组:只能吃果肉
2

AI 动物分群模拟

选择特征维度,看 AI 如何自动把动物分成两群

🤖

我是一个什么都不会的 AI!人类给了我一些动物的特征数据,要求我把它们分成 2 群。 但没有告诉我按什么标准分——我需要自己决定!
你来帮我选择用哪些特征来分群吧?

📊 动物特征数据 12 种动物
动物 生殖方式 食性 有毛? 用肺呼吸?

🎛️ 选择分群特征(可多选)

提示:不同特征组合会产生不同的分群结果——这正是无监督学习的特点!
3

K-Means 聚类沙盒

亲手在画布上放置数据点,看 AI 如何一步步找到聚类中心

👆 在画布上点击添加数据点,或点击「随机生成点」,然后开始聚类!
迭代步骤:
第 0 步

🔍 K-Means 算法步骤

1
随机初始化中心点
在数据空间中随机选择 K 个点作为初始聚类中心
2
分配数据点
计算每个数据点到各中心的距离,分配到最近的中心
3
更新中心点
计算每个群组的平均位置,作为新的中心点
4
重复直到收敛
重复步骤 2-3,直到中心点不再移动
4

监督 vs 无监督学习

两种学习方式的核心区别

👩‍🏫 监督学习 有老师
📌数据有标签 + 特征
📌任务:分类(已知类别)
📌答案唯一
📌需要分训练集和测试集
📌例:判断是不是猫
就像妈妈教宝宝认苹果:
「这是苹果,红色的,圆圆的,甜甜的」
🧒 无监督学习 自学
📌数据只有特征,无标签
📌任务:聚类(未知类别)
📌答案不唯一,有依据即可
📌无需分训练集和测试集
📌例:把动物分成两群
就像外星人自己观察水果:
没人告诉你名字,但你能发现规律

⚠️ 数据质量的重要性:海葵的故事

🌊

如果 AI 只看到了海洋里的鱼和海草,当它遇到海葵时—— 海葵看起来像植物,AI 会把它分到植物群!

❌ 错误:海葵其实是动物,有神经系统和消化系统,还会用触手捕猎!
📚

这说明:训练数据必须尽可能全面、充足,才能让 AI 学得准确。

✅ 就像人类「读万卷书、行万里路」——数据越丰富,学习效果越好!

📊 数据量 vs 准确率模拟

模拟数据:展示训练数据量对模型准确率的影响趋势

5

知识检验

测试一下你学到了什么!

🎓 本节总结

无监督学习 = 没有标签,AI 自己发现规律
聚类 是无监督学习的核心任务,答案不唯一
K-Means 是最经典的聚类算法:随机初始化→分配→更新→收敛
数据质量至关重要:全面、充足的数据才能训练出好模型
监督学习处理分类,无监督学习处理聚类