下列关于强化学习与监督学习的说法中,正确的是
强化学习需要工作人员提前准备大量已标注完毕的训练数据来开展学习
监督学习通过智能体与环境互动、依靠试错的方式积累学习经验
强化学习与监督学习的原理和应用场景并没有区别
强化学习依靠“奖励”反馈信号进行学习,监督学习依靠人工标注的数据完成学习