说明
数字化转型必然面对的问题
说起来数字化转型已经被提倡了至少3年时间,从我的实际体会上存在以下困难:
- 1 由于技术发展过快,许多企业的管理人员无法理解,所以也不知道该怎么转型
- 2 过于“珍惜”数据,宁可放着不用也不打算用(长期来看,数据资产的质量是下降的,乃至不可用)
从某种程度上说,建模所需的数据恰恰是隐私无关
的。类似电话号码、身份证这样的数据,对模型一点用都没有。模型需要的是学习并提取通用的规律。
刚才还想着怎么解释,正好有一个Kaggle的竞赛有点兴趣,难道这不是一种很理想的方式吗?(企业出钱,整理好数据,让大家来做,选择做的好的)
10万美金,对一个企业来说,多吗?
内容
1 解耦
将数据维度和实际业务意义进行剥离
这一步比较简单,例如age
变量可以比较容易猜出业务