O应该就是观察值的数据,data数据应该只能在1~O内变换,超过就会报错。有199个观察值时混淆矩阵自然是5*199(5为状态数),没啥矛盾的。不知道你说的矛盾在哪!如果数据是你最后描述的那样,我觉得可以用混合高斯隐马尔科夫模型来训练,而不是用离散的,因为离散的隐马尔科夫观察值太多,而中间有很多的观察值基本不会出现在数据里,对估算结果肯定会有影响。
需要查看一下这个函数的帮助文档。