1830年之前,没有人知道番茄能不能吃。
一个人的勇敢探索,改变了所有人的认知。
AI 和人类一样,通过"试错"来学习
| 学习方式 | 需要示例? | 需要标签? | 学习来源 |
|---|---|---|---|
| 监督学习 | ✅ 需要 | ✅ 需要 | 标注好的数据集 |
| 无监督学习 | ✅ 需要 | ❌ 不需要 | 数据内在规律 |
| 强化学习 ⭐ | ❌ 不需要 | ❌ 不需要 | 奖励与惩罚信号 |
像 AI 一样,通过试错找到安全出口!
观察 AI 如何通过数千次试错,学会最优路径
实验任务:保持默认参数(α=0.5, γ=0.9, ε=0.3),点击下方按钮快速训练,观察 AI 学习过程中的关键指标变化。
AI不是一次成功就永远记住,而是逐渐提高成功概率。在不断试错中,AI 发现出口的几率会越来越大,最终形成稳定的避障能力。
用强化学习的思维,找到最优的日程安排!
从番茄到 AI,探索是最好的老师