Page 10 - 《中国药房》2020年22期
P. 10
在语料库中的相对分量。由LDA主题模型训练得出每
篇文档对应主题的后验概率以及每个主题对应主题词
的后验概率,进而得出主题强度,计算公式如下:
N
Pk=∑ iθki/N … … … … … … … … … … … … … … (5)
其中,Pk表示第 k 个主题的主题强度,θ ki表示第 i 篇
文档的主题是主题 k 的概率,N 为政策文本的总数。本
研究所得8个主题的主题强度分布见图6。
主题强度
0.35
0.299
0.30
0.25
主题强度 0.20 0.116 0.134 0.168 0.113
0.15
0.10
0.049 0.063 0.058
0.05
0
0 1 2 3 4 5 6 7
主题
图6 8个主题的主题强度分布
图5 政策文本关键词词云图 Fig 6 Topic intensity distribution of 8 themes
Fig 5 Policy text keyword cloud map
[17]
参考文献的分类方法 ,根据上述主题强度值对主
产业政策主要是以支持和激励为导向,引导企业发展。 题挖掘结果进行热门主题和冷门主题的对比研究。强
生物医药产业的特点是长周期、高投入、高风险、高利 度较高的主题有7、5、4,即为热门主题;主题0、6强度适
润,因此企业前期的资金风险较高,特别是中小型生物 中等,主题 1、2、3 强度明显低于其他主题,即为冷门
医药企业面临的处境更为困难,企业发展离不开资金, 主题。
图中“补贴”“资金”等词汇体现出我国政策的侧重点在 4.2.2 主题内容分析 由“2.2”项下模型和本课题组对
对企业的财政支持上,例如,北京中关村管委会发布的 政策文本的先验知识,结合主题的代表特征词进行归纳
《中关村国家自主创新示范区天使投资和创业投资支持 总结,可得主题-特征词分布,详见表 2(因篇幅所限,本
资金管理办法》 对企业成果转化类项目及产业转化类 文仅列出每个主题所对应的前10个特征词)。
[18]
项目给予资金支持,带动了园区内企业协同创新平台的 根据各个主题-特征词的分布情况,对8个主题的侧
建设。如今,人才已成为各行各业发展不可或缺的资 重点和政策关注的主要层面归纳如下:主题0为项目金
源,从图中也可看出,“人才”“团队”“补助”等词汇体现 融支持,其特征词“项目”“投资”“外商投资”表明政策对
出园区政策对国家高新区人才建设的大力支持,如泰州 项目推进的支持侧重于资金的投入;主题1为中小企业
医药高新区管委会发布的《关于加强中国医药城专业化 建设,“新兴产业”“科技攻关”“优惠政策”体现了政策对
高层次人才队伍建设的实施意见》 对医药城高层次创 于中小企业科技创新的支持;主题2为资源引领,“上市
[19]
业人才给予资金奖励及生活津贴,同时解决其配偶就业 公司”“跨国公司”等词汇体现出政策对龙头企业的引领
问题,并提供子女入学保障、医疗保险、住房补贴、社会 作用;主题3为出口贸易,“出口”“重大项目”“专利技术”
保障等完善措施,以解决创新创业人才的家庭顾虑。创 所体现的是政策对于通过扩大海外市场提升竞争力的
新是生物医药产业发展的核心竞争力,激励生物医药产 支持;主题4围绕的是融资支持,“融资”“资金”“扶持”等
业创新发展已成为产业转型升级的重要方式,图中“创 词表明政策的导向是通过促进融资来支持企业的研发
新”“科技”“知识产权”即体现出政策的关注点集中于企 创新;主题5与人才建设有关,“资助”“经费”等表明政策
业创新,如泰州医药高新区管委会印发《关于推进科技 支持高层次人才、专家学者来共同参与建设国家高新区
创新引领高质量发展的若干政策》 ,通过鼓励企业自 的生物医药产业;主题6是税收优惠,“所得税”“抵扣”等
[20]
主创新、推动科技成果转移转化、加强研发机构和载体 说明政策在税收方面实行优惠以促进生物医药企业的
建设多个渠道推动生物医药产业科技创新的高质量 发展;主题7为技术创新,“科技”“创新”“研发”等表明创
发展。 新是生物医药产业发展的动力源泉,是政策支持的重点
4.2 政策文本主题分析 对象。结合图 6 可知,国家高新区 518 项生物医药产业
4.2.1 主题强度分布 LDA 主题模型可以计算整个语 政策中的强度较高的热门主题依次为技术创新(0.299)、
料库中每个主题的比例,即主题强度,以反映每个主题 人才建设(0.168)、融资支持(0.134),强度较低的冷门主
·2692 · China Pharmacy 2020 Vol. 31 No. 22 中国药房 2020年第31卷第22期