[科普中国]-斯塔克尔贝格对策-

基本内容

冲突：一般来说，两个或两个以上的组织间存在争论，这种情况称为冲突。

冲突分析：是在经典对策论和偏对策理论基础上发展起来的一种对冲突行为进行正规分析(Formal Analysis)的决策分析方法，它运用数学模型来描述冲突现象，提取冲突过程的本质和特点，分析各种可能和必然的冲突结果，并决策者提供有力的决策依据。

冲突分析的目的在于协调冲突中各参与者之间的矛盾，提出最终权宜解决方案。这是一种着眼于解决现实社会争端的一种特别的游戏理论，属于一般博弈理论的一个分支。
冲突分析的主要特点是能最大限度地利用信息，通过对许多难以定量描述的现实问题的逻辑分析，进行冲突事态的结果预测和过程分析（预测和评估、事前分析和事后分析），帮助决策者科学周密地思考问题。它是分析多人决策和解决多人竞争问题的有效工具之一。

冲突分析的要素(也叫冲突事件的要素)是使现实冲突问题模型化、分析正规化所需的基本信息，也是对原始资料处理的结果。主要有：
（1）时间点：是说明“冲突”开始发生时刻的标志；对于建模而言，则是能够得到有用信息的终点。因为冲突总是一个动态的过程，各种要素都在变化，这样很容易使人认识不清，所以需要确定一个瞬间时刻，使问题明朗化。但时间点不直接进入分析模型。
（2）局中人（Players）：是指参与冲突的集团或个人(利益主体)，他们必须有部分或完全的独立决策权(行为主体)。冲突分析要求局中人至少有两个或两个以上。局中人集合记作N。
（3）选择或行动(Options)：是各局中人在冲突事态中可能采取的行为动作。冲突局势正是由各方局中人各自采取某些行动而形成的。每个局中人一组行动的某种组合称为该局中人的一个策略。
（4）结局(Outcomes)：各局中人冲突策略的组合共同形成冲突事态的结局。全体策略的组合(笛卡尔乘积或直积)为基本结局集合，结局是冲突分析问题的解。
（5）优先序或优先向量（Preference Vector）：各局中人按照自己的目标要求及好恶标准，对可能出现的结局（可行结局）排出优劣次序，形成各自的优先序（向量）1。

发展历程早在1952年，英国经济学家H．Von Stackelberg在研究静态经济竞争时就提出了斯塔克尔贝格对策形成的原始模型。但直到Chen和Cruz研究了两人动态非零和主从对策，Simaan和Cruz研究了两群局中人的情形才使人们转入到对它的研究上来。后来，Castanon等人将主从对策推广到了随机对策，相继提出了开环策略、反馈策略、闭环策略等概念，并初步考虑了非嵌套信息结构以及多层主从对策结构。20世纪70年代末。Basar提出了设计 “队优”(team-optima1)策略的间接法，考虑将主、从双方的决策变量联系起来，为研究提供新途径，队优策略则逐步发展成为以后的诱导策略。进入20世纪90年代，主从对策的求解和算法广泛引起了关注2。

分类静态Stackelberg对策静态问题可描述如下：局中人由主方(Leader)和从方(Follower)两方组成，其目的要极小化各自的费用函数。

费用函数：。

动态Stackelberg对策动态Stackelberg对策可分为离散时间和连续时间两种情形。离散时间Stackelberg对策描述如下：

状态方程为：。

费用函数为：；。

其中，，是给定的初始值，，。

鼓励性策略当主方占有绝对的有利地位，它可以追求理想的境界，从而产生了鼓励或威胁的手法，把人们从艰难的直接求解中解脱出来，转向间接求解1。

比较斯塔克尔贝格对策：基本问题是对策中的主方如何利用自己的领导地位制订决策或策略，以引导从方采取合作行为，它与经济学中有关机制设计的研究有密切联系，两者都是研究如何设计适当的激励机制或诱导策略用以揭示从方的私有信息、诱导从方的利己行为有益于全局的利益。这种模型较好地反映了社会、经济和管理系统中的层次结构，近年来吸引了众多的学者进行研究。

误对策：又称超对策，是20世纪70年代由西方学者提出的。该方法假设：各局中人因对其他局中人的偏好顺序判断有误、对其他局中人的可用策略错误理解等等，而对决策形势产生了偏差。一个误对策的均衡点是由对策表中主对角线上各偏好顺序向量而确定的。误对策分析主要有一阶误对策和二阶误对策。一阶误对策是指至少有一个局中人的感知产生误差而所有局中人都没有意识到。二阶误对策是指至少有一个局中人意识到有某个局中人的感知存在误差。K阶误对策的概念可以此类推。
软对策**:** Nigel Howard于1990年提出了软对策论。其前提条件更接近客观实际，在原有理性选择模型中，偏好或者被预先设定并保持不变，或者过分强调偏好的动态特性，而软对策既研究偏好固定时的情形，又研究其动态演变过程，使冲突中的静、动态特性得到了有机统一。软对策理论对传统理论进行了改进，如将传统的方案分析法扩展为对抗分析法，并创新性地对一些假定进行了修正，引入了许多局中人之间相互影响的新因素：非理性、情绪与不信任等。 1993年Bennett和Howard又提出了戏剧模型，对软对策理论有了进一步发展2。

应用对策起源于经济，它有着丰实的经济学背景和乐观的应用前景。严格说来对策与决策是有本质区别的，对策是指人与人之间的关系，决策则指人与自然的关系。而在经济学中这些问题往往又相互交织在一起，形成多级决策系统。

其中，用国家调节利率、税收、投资等决策量来控制各部门各单位的行为而实现全局最优，企业通过分配、奖励等手段来引导职工采取合作行为以提高整体的效益，都属于斯塔克尔贝格对策。例如，用一个三人对策模型(一个中央政府，两个地方政府)用来描述我国过去的财政包干制度，考虑两种不同的Stackelberg对策，第一种情况是中央政府先行动，地方政府后行动；第二种情况是，地方政府先行动，中央政府后行动。第一种情况对应于中央政府能够信守事先签订的税收分享合同的情况，第二种情况对应于中央政府不能信守合同的行动，并就理论研究结果给出了建设性的意见。

斯塔克尔贝格对策也广泛应用于物流供应链订货问题的求解对策上。例如，给出了一个一般Stackelberg对策问题模型及其解计算的遗传算法求解步骤，在一类单分销商、多顾客单产品供应链中，针对订货的Stackelberg对策中分销商的最小补充期协调问题，建立顾客成本合理性约束下的分销商成本优化模型，并以分销系统为对象进行了Stackelberg对策的仿真实验。结果表明，通过供应链中最小补充期协调，整个供应链及其成员都可从中受益，供应链订货的Stackelberg对策的分散协调机制有效地实现了供应链协调3。