Page 15 - 《中国药房》2021年20期
P. 15

重复博弈。此时,博弈一方实施机会主义行为容易遭到                           除。此时,博弈实为有限次重复博弈,博弈方仍不会考
        对方的报复和惩戒,因此其会充分思考背信的成本,自                           虑长远得益,双方最终策略组合为(不信任,不信任)。
        发减少背信行为,策略选择更倾向于长期利益的获取。                           由此可见,仅靠联盟成员的道德自律无法抵消短期高额
        故客观而言,在无限次重复博弈模型中,博弈双方更易                           得益的诱惑,需要引入外部力量来约束和规范联盟成员
        于达成互信。                                             的行为,提高背信成本,以此促使联盟得益得以优化。
            如果核心企业与合作伙伴开展的是无限次重复博                          2.2  外部约束力量下中药产业联盟成员合作信任的博
        弈,本文假设双方均选择如下触发策略:博弈阶段 t=1                         弈分析
        时双方均选择信任,策略组合为(信任,信任)。任何阶                              研究表明,对中药产业联盟成员的合作行为可以引
        段 t 时,只要一方选择信任,另一方也会选择信任;若某                        入外部力量进行约束,诸如法律、声誉等 。在上述初
                                                                                               [20]
        一方选择不信任,另一方则会在阶段≥t+1 时永远选择                         次博弈的基础上,因外部约束力量的存在,本文假设联
        不信任。在无限次重复博弈之后,若核心企业与合作伙
                                                           盟成员因背信而造成的得益损失为 f,守信成员因此得
        伴始终选择信任,可知重复博弈每阶段得益均为a,令核
                                                           益增加 f,则双方单次静态博弈模型如表 2 所示(其中,
        心企业总得益现值为U1,折现因子为δ,δϵ[0,1](δ反映了
                                                           b>a>d>c)。
        重复博弈中时间的偏好,也反映出博弈双方的耐心程
                                                                   表2 中药产业联盟单次静态博弈模型
                                                 [19]
        度,即δ越大,双方耐心程度越高,博弈次数越多 )。根
                                                           Tab 2 Single static game model of TCM industrial
        据无限次重复博弈理论可以得到:
                                                                   alliance
                               a
            U1=a+aδ+aδ +…=                                                           合作伙伴B
                       2
                              1-δ                           核心企业A
                                                                            信任                  不信任
            为简化模型,本文假设核心企业在阶段 1 时选择不                        信任               a,a               c+f,b-f
        信任,合作伙伴在阶段1时选择信任,根据触发策略,合                           不信任            b-f,c+f             d-f,d-f
        作伙伴在阶段2时会进行报复,即选择不信任,可知核心                              由表2可知,若想达到唯一纳什均衡(信任,信任),
        企业阶段 1 时得益为 b,以后每阶段得益均为 d,令无限                                                                d-c
                                                           则需令 a>b-f 且 c+f>d-f,即 f>b-a 且 f>
        次重复博弈之后核心企业总得益现值为U2,则:                                                                        2   。
                                 dδ                        进一步分析上述博弈模型可知,中药产业联盟成员是否
            U2=b+dδ+dδ +…=b+
                       2
                                1-δ                        守信与背信损失 f 的大小密切相关。当背信损失 f 同时
                          a         dδ           b-a                         d-c
            令U1>U2,即         >b+        ,可得δ>              满足f>b-a且f>             两个条件时,博弈有唯一纯策
                        1-δ        1-δ           b-d                          2
            由博弈结果可知,只要博弈双方有充分的耐心和足                         略纳什均衡,即联盟成员策略组合为(信任,信任)。该
        够多的博弈次数,未来得益就会足够大,核心企业若背                           博弈结果表明,在背信损失足够大且上不封顶的情况
                                                  b-a      下,联盟成员均选择彼此信任,上述博弈策略组合(信
        信就有可能遭到合作伙伴的报复和惩戒。当δ>
                                                  b-d      任,信任)为纯策略纳什均衡且有唯一纳什均衡解。
        时,只要核心企业采用上述触发策略,即阶段1时选择信                                                                d-c
                                                               若 a>b-f 且 c+f<d-f,即 b-a<f<             时,根
        任,合作伙伴的最优策略始终也是信任。双方触发策略                                                                  2
        组合即是这个无限次重复博弈的子博弈完美纳什均衡,                           据博弈奇数定理可知,该博弈还有混合策略纳什均衡
        双方每阶段博弈策略组合(信任,信任)即为该重复博弈                          解。本文假设核心企业选择信任的概率为 p,选择不信
        的均衡路径,博弈双方因守信而收获的长期得益大于失                           任的概率为1-p;合作伙伴选择信任的概率为q,选择不
        信所带来的得益,不信任行为就会减少,此时联盟总得                           信任的概率为1-q,则双方博弈模型如表3所示。
        益最大。由博弈的对称性可知,如果阶段1时先失信方                                   表3 中药产业联盟混合策略博弈模型
        为合作伙伴,上述触发策略组合仍为此无限次重复博弈
                                                           Tab 3 Mixed strategy game model of TCM industrial
        的子博弈完美纳什均衡,每阶段博弈策略组合(信任,信
                                                                  alliance
        任)也仍为该重复博弈的均衡路径。                                                             合作伙伴B
            在上述博弈中,若要使联盟总得益最大,则需要博                          核心企业A           信任概率q            不信任概率1-q
        弈双方有充分的耐心和足够多的博弈次数,但由于中药                            信任概率p            a,a               c+f,b-f
                                                            不信任概率1-p        b-f,c+f            d-f,d-f
        产业联盟技术创新活动的复杂性,联盟成员合作关系容
        易发生改变,博弈次数往往较少,合作关系易被很快解                               当核心企业的混合策略为(p,1-p)时,其期望得益


        中国药房    2021年第32卷第20期                                            China Pharmacy 2021 Vol. 32 No. 20  ·2441 ·
   10   11   12   13   14   15   16   17   18   19   20