决策论和风险分析

我们都一定在追求最有用的知识。“有用”一定意味着“帮助实现我们的目标”。如果我们要选择一个最影响我们能控制的我们成功的因素,这个因素一定是我们的决定,对吧?我们的决定的好不好一定是最影响我们的生活的事。我这样思考着,最近看了一本很简单的书关于决策论,叫”The Ri9ht Decision“的书。这本书非常非技术的,可以用三个句子总结所有的真有用的内容。但是,这本书提醒我一些我过去知道的知识关于最优决定,风险分析,等等。我会先写关于这本书里知道的一些重要的(有用的)概念,然后写关于类似的风险分析的概念。

关于决策论

首先这本书介绍支付向量的概念。这个概念非常简单。我们先要选择我们希望最优化的得分(选择得分跟自己的目标:如果我们的目标是做个聚会的话,可能的得分是“人数”,如果我们的目标是快乐的话,得分可能是“做喜欢的活动的小时数”)。然后看看所有的可选择的行为(行为种类的菜单),对每个行为给相对应对的“得分”。这样的“得分的向量”被称为“支付向量” $P = (p_1, p_2,..., p_n)$。如果我们有只一个得分种类,我们从支付向量选择最高的值的行为种类,就做做了最优的决定。(这么简单!)

我觉得上一句的命题很好,因为它让我们明白决策论是多么简单吗。其实,如果我们有包括所有的重要的元素(表达我们目标,包括我们希望)的那么抽象的“得分”(评分系统),我们就不要看以后的书的内容,解决是 $i: p_i = \mathrm{max} (P)$.

作者介绍了可能性对每个行为(action)有更多支付向量。其实,如果我们想想我们有复杂的目标(希望满足的条件的集合$G$),看着目标我们可以选择合适$G$的支付向量的子集。

然后作者介绍了Minimax算法和Maximax算法,然后给它的解释:这两的标准意味着我们应该避免最大的损失的行为,追求最大的支付的行为。(顺便,这些概念,虽然被用$\mathrm{min}$和$\mathrm{max}$,但是,比如在真正的空间,当然用风险函数的$\mathrm{inf}$和$\mathrm{sup}$被下定义的。

终于作者介绍"贝叶斯标准"。贝叶斯标准意味着“为了知道最可能的,长的时间的得平均分值,计算加权平均数(权值为相对应概率)。当然,像我们知道,这个加权平均数被成为期望值 $\mathbb{E}[X] = x_1 p_1 + \cdots + x_n p_n$。虽然这个是非常简单的标准,但是实际上它意味着很有用的事。比如,越大 $n$,越大期望值,比如,如果希望找到工作,越大发给的邮件数,越大概率找到工作。也是,当然每个$p_i$依靠每个邮件里的文章的质量式项。也是,当然每个$x_i$依靠希望工作的公司(组织)的质量。这个标准当然意味着我们要选择有最高的期望值的$x_1, \cdots, x_n$组合。

在这个地方我就想起来了我在学士的时候学的贝叶斯最优分类器(它用贝叶斯定理最小错误概率)。也是,必将想起来我的学士的时候对我们概率论的老师说的事”如果你们要找到统计学家的工作,而在面试的时候他们问你不知道怎么回答的问题,正确的回答是『我要计算期望值』”。也是,必将想起来同一个老师对我们说“一个人问柯尔莫哥洛夫『您觉得您的生活上您有最大的贡献是什么呢?』他不是回答了『我介绍概率论公理』,他回答『我介绍条件期望值』的。在读学士的时候我不太了解为什么,但是我现在觉得是因为它在统计决策论最重要。在金融,也在很多其它的领域,在时间序列分析也,我们在选择最优的决定的时候,我们比较被我们的行为组合$\mathrm{Y}$ 被条件的 $\mathbb{E}[X|Y]$ 条件期望值,选择最大(还是最小的)。我们就也可以用贝叶斯分类器。也是,我想起来我们学过的勒贝格-斯蒂尔切斯积分,而明白怎么用它能够计算$\mathbb{E}[X]$和风险。其实,如果$X$是在概率空间$(\Omega, \mathcal{F}, \mathcal{P})$ 中的一个随机变量,那么它的期望值$\mathbb{E}[X]$的定义是:

$$\mathbb{E}[X] = \int_\Omega X\, \mathrm{d}P$$

比如,如果$X$是支付函数(随机变量),$P$是概率测度,那么这个积分等于支付的期望值。我觉得我要介绍一下这个地方,怎么计算这个积分(勒贝格-斯蒂尔切斯积分),以后用中文写。但是临时你们可以看看在这里(是『The Lebesgue-Stieltjes Integral: A Practical Introduction』 的书的6章)怎么计算。只有8个定理,就可以计算。我觉得是很有用。

关于风险分析

为什么危险分析和决策论有关系吗?风险是损失的期望值(这样的定义)。

$$ Risk = {\mathbb E} [Loss] $$

好像贝叶斯最优分类器最小错误概率,风险分析帮我们最小化损失。只要计算我们的行为和目标为条件的条件风险,就可以选择最小化失败的行为。

F & P