Page 10 - 《中国药房》2020年22期
P. 10

在语料库中的相对分量。由LDA主题模型训练得出每
                                                            篇文档对应主题的后验概率以及每个主题对应主题词
                                                            的后验概率,进而得出主题强度,计算公式如下:
                                                                      N
                                                                Pk=∑ iθki/N … … … … … … … … … … … … … … (5)
                                                                其中,Pk表示第 k 个主题的主题强度,θ ki表示第 i 篇
                                                            文档的主题是主题 k 的概率,N 为政策文本的总数。本
                                                            研究所得8个主题的主题强度分布见图6。
                                                                                 主题强度
                                                                  0.35
                                                                                                    0.299
                                                                  0.30
                                                                  0.25
                                                                 主题强度  0.20  0.116     0.134  0.168  0.113
                                                                  0.15
                                                                  0.10
                                                                          0.049  0.063  0.058
                                                                  0.05
                                                                   0
                                                                       0   1    2   3   4   5    6   7
                                                                                     主题
                                                                       图6 8个主题的主题强度分布
                    图5 政策文本关键词词云图                               Fig 6 Topic intensity distribution of 8 themes
                Fig 5 Policy text keyword cloud map
                                                                                  [17]
                                                                参考文献的分类方法 ,根据上述主题强度值对主
        产业政策主要是以支持和激励为导向,引导企业发展。                            题挖掘结果进行热门主题和冷门主题的对比研究。强
        生物医药产业的特点是长周期、高投入、高风险、高利                            度较高的主题有7、5、4,即为热门主题;主题0、6强度适
        润,因此企业前期的资金风险较高,特别是中小型生物                            中等,主题 1、2、3 强度明显低于其他主题,即为冷门
        医药企业面临的处境更为困难,企业发展离不开资金,                            主题。
        图中“补贴”“资金”等词汇体现出我国政策的侧重点在                           4.2.2  主题内容分析       由“2.2”项下模型和本课题组对
        对企业的财政支持上,例如,北京中关村管委会发布的                            政策文本的先验知识,结合主题的代表特征词进行归纳
        《中关村国家自主创新示范区天使投资和创业投资支持                            总结,可得主题-特征词分布,详见表 2(因篇幅所限,本
        资金管理办法》 对企业成果转化类项目及产业转化类                            文仅列出每个主题所对应的前10个特征词)。
                      [18]
        项目给予资金支持,带动了园区内企业协同创新平台的                                根据各个主题-特征词的分布情况,对8个主题的侧
        建设。如今,人才已成为各行各业发展不可或缺的资                             重点和政策关注的主要层面归纳如下:主题0为项目金
        源,从图中也可看出,“人才”“团队”“补助”等词汇体现                         融支持,其特征词“项目”“投资”“外商投资”表明政策对
        出园区政策对国家高新区人才建设的大力支持,如泰州                            项目推进的支持侧重于资金的投入;主题1为中小企业
        医药高新区管委会发布的《关于加强中国医药城专业化                            建设,“新兴产业”“科技攻关”“优惠政策”体现了政策对
        高层次人才队伍建设的实施意见》 对医药城高层次创                            于中小企业科技创新的支持;主题2为资源引领,“上市
                                      [19]
        业人才给予资金奖励及生活津贴,同时解决其配偶就业                            公司”“跨国公司”等词汇体现出政策对龙头企业的引领
        问题,并提供子女入学保障、医疗保险、住房补贴、社会                           作用;主题3为出口贸易,“出口”“重大项目”“专利技术”
        保障等完善措施,以解决创新创业人才的家庭顾虑。创                            所体现的是政策对于通过扩大海外市场提升竞争力的
        新是生物医药产业发展的核心竞争力,激励生物医药产                            支持;主题4围绕的是融资支持,“融资”“资金”“扶持”等
        业创新发展已成为产业转型升级的重要方式,图中“创                            词表明政策的导向是通过促进融资来支持企业的研发
        新”“科技”“知识产权”即体现出政策的关注点集中于企                          创新;主题5与人才建设有关,“资助”“经费”等表明政策
        业创新,如泰州医药高新区管委会印发《关于推进科技                            支持高层次人才、专家学者来共同参与建设国家高新区
        创新引领高质量发展的若干政策》 ,通过鼓励企业自                            的生物医药产业;主题6是税收优惠,“所得税”“抵扣”等
                                       [20]
        主创新、推动科技成果转移转化、加强研发机构和载体                            说明政策在税收方面实行优惠以促进生物医药企业的
        建设多个渠道推动生物医药产业科技创新的高质量                              发展;主题7为技术创新,“科技”“创新”“研发”等表明创
        发展。                                                 新是生物医药产业发展的动力源泉,是政策支持的重点
        4.2  政策文本主题分析                                       对象。结合图 6 可知,国家高新区 518 项生物医药产业
        4.2.1  主题强度分布 LDA        主题模型可以计算整个语                政策中的强度较高的热门主题依次为技术创新(0.299)、
        料库中每个主题的比例,即主题强度,以反映每个主题                            人才建设(0.168)、融资支持(0.134),强度较低的冷门主


        ·2692 ·  China Pharmacy 2020 Vol. 31 No. 22                                 中国药房    2020年第31卷第22期
   5   6   7   8   9   10   11   12   13   14   15