2020年高教社杯全国大学生数学建模竞赛C题 第三问详细解答+代码
本文摘自小编自己的参赛论文与经历,小编获得了2020年高教社杯国奖,有问题的同学们可私聊博主哦。
问题 三: 增加企业抗突发因素能力后 信贷策略 的 调整
1.1 问题分析
问题三要求我们把突发因素考虑在内,仍然是对 302 家无信贷记录的企业进行研究,因为缺少企业信誉评级,而问题三要求我们把突发因素考虑在内,那我们自然想到可以利用新增的突发因素代替企业信誉在信贷策略中所占有的地位,于是我们需要综合考虑企业实力和突发因素对企业的影响。为了能够量化突发因素对企业的影响,我们应该找到一个可以评判企业抗突
发因素的能力的指标,把这个指标与企业实力相结合,再来研究银行对企业的信贷策略。 从数据表格分析,我们发现公司企业的 行业与类别 不同主要体现在企业名字上,所以我们考虑到对公司名字进行处理分析,并结合“多元 化企业往往抗突发因素能力强,单一化企业往往抗突发因素能力弱” 和“规模大的企业抗突发因素强,规模小的企业抗突发因素能力弱” 的假设,对企业的抗突发因素能力进行了衡量。
1.2 数据预处理
数据初处理
在企业实力评价系数的计算方面,我们利用问题二中的预处理结果可以很容易计算得到企业实力的相关数据。考虑到突发因素对不同的企业有着不同的影响,所以我们必须对企业的名字进行一定的处理。在处理过程中,为了处理之后信息具有一定的有效性,我们必须保留能够反映公司规模大小以及行业类别的关键字,所以 我们 保留 了“公司”、 “发展中心 、“合作社”、 “厂”、“场”、“房”、“店”、“部”、“院”、“所”、“站”、 “分公司 以
及“个体” 等能反映 企业 规模的关键词,剔除了 “有限”、“股份”、“责任”、 “(有限合伙)”、 E***E***”以及 “******”等 既不能反映公司规模也无法体现公司行业类别的分词, 最后 并把每个公司对应的关键词 先 进行另存,方便后面的提 取 与利用。
数据二次处理
经过初处理的数据虽然已经含有了所有有效信息,但还知识一串文本信息,无法对文本中的关键词进行运用,因为我们后续计算需要用到“公司行业关键词”以及“公司规模关键词”所以必须对数据进行二次处理。首先我们对文本进行切词处理,将文本切分成一个个的关键词,因为“公司规模关键词”都在文本最后,所以我们把处理后得到的最后一个关键词转存到专门的表格中,然后把剩余关键词另存在另一个表格中,需要注意的是,我们数据处理时,发现有的文本既含有“公司”、又含有“分公司”,比如企业 E414 它的命名名字是“ 物流有限责任公司 分公司 ”,所以在处理时,处理了上述情况,这时候我们只 保留“分公司”一个关键词作为企业 E414 的“公司规模关键词”,并且不把“公司”纳入“公司行业关键词”中。考虑到
Excel 对 少量数据处理 的优越性, 我们在二次数据处理时,利用 Excel对 进行数据处理, 把公司行业关键词个数和公司规模关键词写入 表格, 处理后的表格数据作为我们后续计算的支撑。
1.3 企业抗突发因素能力
企业抗突发因素能力
突发因素突发因素往往具有突发性和难以 预见性、不确定性和非常规性、公共性和多样性 等特点。突发因素对不同的行业,不同类别的企业有着不同的影响,它的随机性和多元性也导致我们很难定性的描述突发因素的企业的影响。
指标选取
在已有的数据支撑之下,我们可以发现不同的企业有着不同的行业交叉度和广泛度,有的企业非常单一化只涉及一种行业,有的企业行业涉及面非常广,如下图 所示。
因为有关企业类别的数据较少,我们为了找到能够衡量企业抗风险能力的指标,在已有数据的基础上,选择企业的行业涉及面的广窄 以及企业的规模大小两个指标 来作为衡量企业抗风险能力的指标。
模型建立
记企业抗突发因素 能力为 A ,企业的规模大小系数为 S ,企业的行业 覆盖 强度 系数为 K ,我们给出企业抗突发能力的计算公式
式中,i,j 分别代表了企业规模和企业的行业 覆盖 强度 在计算企业抗突发能力时的权重大小。
企业规模大小系数
在分析了表格数据后,我们发现对企业规模的描述有以下几类::“公司”、“厂”、“场”、“房”、“店”、“部”、“院”、“所”、“站”、“分公司”以及“个体”。为了能定量的计算企业规模大小,我们对企业规模划分为四类,每种企业规模对应的企业规模大小系数如表所示
为了保证计算得到的企业规模系数的有效性,我们沿用前边在计算是企业信誉评价系数时的思想,在计算企业规模大小系数时,在对应的区间随机取值。下面我们给出企业规模大小系数的计算公式: