首页
IT技术
前端
后端
移动开发
编程语言
数据库
大数据
每日资讯
登录
标签
模糊强化学习奖励波动很大
模糊强化学习奖励波动很大 模糊优化法
模糊系统优化:1. 基于输入输出数据学习的优化:使用数据驱动的方法来学习规则和调整 FIS 参数。2. 自定义评价函数:通过评价函数向模糊系统提供输入,通过系统输出与模型输出比较,为优化算法提供评价值MATLAB中使用 tunefis 函数
模糊强化学习奖励波动很大
机器学习
数据
聚类
系统优化
admin
6月前
14
0