中等单选题全国青少年信息素养大赛2026学习信号机制的本质区别

下列关于强化学习与监督学习的说法中，正确的是

正确率: -已完成: 0人

题目描述

A.

强化学习需要工作人员提前准备大量已标注完毕的训练数据来开展学习

B.

监督学习通过智能体与环境互动、依靠试错的方式积累学习经验

C.

强化学习与监督学习的原理和应用场景并没有区别

D.

强化学习依靠“奖励”反馈信号进行学习，监督学习依靠人工标注的数据完成学习