观测过程理论的统计学突破

现在的统计学的一些原理,似乎已经是一些“成熟”的东西,如点估计理论,区间估计理论,假设检验,等等。是先有总体,然后再有样本,那样一套描述办法。

而观测过程理论则更要从信息论的观点来审视整个统计中的信息接收过程。还是来看前面已经提到过的一张图如下:

 

 

 


其中,空的桶代表整个观测或者统计产生之前,观测主体的状态,就是观测主体对于观测客体处于一无所知的状态。半满的桶代表了已经获得了一些信息后,观测主体的状态,就是对想要知道的东西,处于半知道半不知道的状态,已经不是一无所知。而满的桶当然是观测主体已经获得了完全精确的信息,这个时候关于观测客体的结论是精确的。

那么,从一无所知到知道一些,到知道很多,到完全知道,这些状态是信息传递中存在着的状态,但是“存在”在什么地方呢?是依赖什么存在呢?是存在于观测主体一边的,是依赖于观测主体而存在的,或者说,如果观测主体不存在,上述图示也就不存在。

观测过程理论认为观测主体就是一个具有存储能力和计算能力的计算机。那么,这部计算机是怎样存放上述的状态的?是以什么样的形式存在的?观测过程理论认为是以观测前的先验分布和观测后的后验分布这种形式存在的。

上面的空的桶,是用广义均匀分布的形式存在的,后来观测主体接收到一些信息,其后验概率是半满的桶,说明观测主体获得了观测客体的一些知识。这些知识是以后验分布(用后验概率密度表示)而存在的。但是,如果要进行进一步的观测,获得进一步的数据,则后验分布又成了下一步观测的先验分布了。而如果观测主体接收到了足够的信息,例如,假设进行了无限次的观测,最后获得的满的桶的状态,就是单点分布了。

因此,观测主体关于观测客体的知识的状态,从一无所知到完全清楚,是一个过程,在这个过程中,这个状态是用先验分布和后验分布的形式来描述的。其实也无所谓先验分布和后验分布,不过就是某一个特定的时刻,观测主体关于观测客体的有关知识的分布罢了,因此在观测过程理论中都将其称为知识分布,知识分布通常以概率密度函数存入于观测主体这个计算机中,它是以前的观测的后验概率密度,也是可能的进一步观测的先验概率密度。

但是,当观测主体的知识分布随着观测的进行而变化的时候,观测客体,它所想要获得知识的对象,却有可能是一直不变的,或者说,是常数!

那么,谈到分布也就谈到概率,因为,只要有了分布,也就有了各种事件的概率,这里的概率,既然依赖于观测主体而存在,它就和传统的概率论里定义的概率不一样,因此观测过程理论专门称这种概率,为主观概率。主观概率是一个重要的思想,它只是反映了观测主体的知识,却并不是象客观概率那样通过反复试验能够获得的。

因此,在观测主体看来的随机变量这个概念是什么意思呢?是对谁随机呢?是对观测主体随机。或者说,凡观测主体不知道的量,就是随机变量,如果完全不知道,那么这个随机变量的分布,就是广义均匀分布。而如果已经精确地知道,这个随机变量的分布,就是单点分布。

在观测系统中,观测主体往往不止一个,某甲的知识有可能比某乙多一些。当然,它们有可能存在信息交流。信息交流会让各个观测主体之间的知识趋于一致。但是也存在永不交流的情况,如战争中敌对的双方都是观测主体,它们关于某一些观测客体,如某架飞机的位置,知识或者分布通常不一样。

从这个角度考虑,承认主观概率这个重要概念也是必要的。

正是从这种思想出发,观测过程理论才对通常的统计,已经写入大学教材的被国内外广泛使用的统计模型,进行了新思想的全面描述,这个描述首次出现在吉首大学学报200223(2)中的文章《对正态总体进行观测》一文中。