模糊强化学习奖励波动很大

模糊强化学习奖励波动很大模糊优化法
模糊系统优化：1. 基于输入输出数据学习的优化：使用数据驱动的方法来学习规则和调整 FIS 参数。2. 自定义评价函数：通过评价函数向模糊系统提供输入，通过系统输出与模型输出比较，为优化算法提供评价值MATLAB中使用 tunefis 函数
模糊强化学习奖励波动很大机器学习数据聚类系统优化
admin7月前
170