1 马尔可夫性质(Markov property)
对于天气预报而言,今天是否下雨只取决于前一天的天气情况,无关于前2345...n天的情况。这就是MP(马尔可夫性质,下文简称MP)
换句话来说,一个随机过程在给定现在状态及所有过去状态情况下,其未来状态的条件概率分布仅依赖于当前状态。给出公式如下
p(Xt+1=xt+1∣X0:t=x0:t)=p(Xt+1=xt+1∣Xt=xt)
此处假设随机变量X0,X1,...,XT为一个随机过程。公式代表的含义指需要看每个p的后半部分**(|xxx)**,意思就是前面的都不用看,看个t就行。
MP也可以描述为给定当前状态时,将来的状态与过去状态是条件独立的。如果某一个过程满足马尔可夫性质,那么未来的转移与过去的是独立的,它只取决于现在。马尔可夫性质是所有马尔可夫过程的基础。
2 马尔可夫链(Markov chain)
这就是符合MP的一个系统,此处需要引入五元组之一
s
s(state)是马尔可夫过程(Markov process)中的随机变量序列,满足马尔可夫性,并且下一时刻的状态st+1 only depend on st.
设状态的历史为ht=s1,s2,...,st,则MP满足以下条件
p(st+1∣st)=p(st+1∣ht)
其实和1.1的内容大差不多,但本节可以映入一个状态转移矩阵(state transition matrix)P来描述状态p(st+1=s′∣st=s)。五元组大部分都是需要用到矩阵运算的,所有这样显的很高级(开玩笑的,主要是很好算)
p=p(s1∣s1)p(s1∣s2)⋮p(s1∣sN)p(s2∣s1p(s2∣s2)⋮p(s2∣sN)⋯⋯⋱⋯p(sN∣s1))p(sN∣s2)⋮p(sN∣sN)
下图是一个离散情况的马尔可夫链实例,可以理解为走迷宫时,从state A 到state B的概率是多少

还有一个最经典的例子就是火星车,假设我们从s3开始,可以获取如下三个轨迹(很多轨迹,我就举三个例子哈)
· s3,s4,s5,s6,s6
· s3,s2,s3,s2,s1
· s3,s4,s4