现在的所有的最优控制理论,都需要有一些参数,然后根据参数列出最优控制的方程,然后解出最优解。
但是,参数不知道怎么办?就需要测量。测量之后怎么办呢?就采用通行的办法,就是对参数进行估计,产生估计值,然后,将估计值作为参数的真实值,代入到最优控制的方程中,求出最优解。
而观测过程理论在人类历史上,第一次提出,这种做法是不对的。正确的做法,是整个最优控制的方程,要根据对参数进行观测而产生的概论分布,来计算出最优的控制解。或者说,观测主体也就是控制主体,应当根据观测中获得的有关观测客体的知识来进行最优决策,而不应当根据什么估计值来进行最优决策。
这个思想在人类历史上首次出现于深圳大学学报(理工版)2001,18(1)这一期中。
在这篇论文及后来出版的《观测过程理论》一书中,都给出了详细的数学模型。
为了方便读者理解,这篇论文及本书中还举了一个非常好的例子,来说明为什么根据事件发生的概率来求最优控制而不是根据什么估计值来求最优控制是最好的。
这个例子用的是一个人周末休闲的决策,如果不下雨,出外游玩可得3分,而如果下雨,出外游玩只能够被淋,得-2分,而在家里着休闲可得1分。如果带伞出行,则万一下雨也是0分,不至于损失很大,如果没有下雨,因为有备无患,则多带了一个东西游玩不方便,因此得2.5分。
如果按传统的办法来,则首先要对下雨不下雨有一个气象台的观测并有一个概率,如果硬要给出结论,则这个结论无论如何算不出带伞出行的最优解,下雨就呆在家里,不下雨就出行。但是,人类获得的信息经常就是不完全的,不确定的,因此,根据不确定的事件的发生概率,就有机会获得带伞出行是最优解的情况。
例如,警察不知道会不会有罪案发生,军队不知道战争是不是会准确发生,居民不知道地震会不会准确发生。因此,都需要根据事物发生的概率来进行最优解的求出。
例如,在四川地震之后,地震局反复声称地震无法准确预测。其实,台风或者任何气象到现在为止也都不能够准确预测。只要有一个发生概率的大小,就可以根据这个概率来进行或多或少的准备,也不一定就非要全体居民呆在屋外那个代价那么大。当发生概率较大的时候,做的准备工作,如加固房屋,进行抢险队伍的值班,在空地准备好抢险的器械,这都可以算出相应的最优解。