策略迭代法的意思

cè lüè dié dài fǎ

策略迭代法

拼音cè lüè dié dài fǎ

拼音字母ce lve die dai fa

拼音首字母clddf

百科含义

策略迭代法（policy iteration method）是动态规划中求最优策略的基本方法之一。它借助于动态规划基本方程，交替使用“求值计算”和“策略改进”两个步骤，求出逐次改进的、最终达到或收敛于最优策略的策略序列。

词语组词

相关词语