建模杂谈系列112 通用数据交换规范

说明

数字化转型必然面对的问题

说起来数字化转型已经被提倡了至少3年时间,从我的实际体会上存在以下困难:

  • 1 由于技术发展过快,许多企业的管理人员无法理解,所以也不知道该怎么转型
  • 2 过于“珍惜”数据,宁可放着不用也不打算用(长期来看,数据资产的质量是下降的,乃至不可用)

从某种程度上说,建模所需的数据恰恰是隐私无关的。类似电话号码、身份证这样的数据,对模型一点用都没有。模型需要的是学习并提取通用的规律。

刚才还想着怎么解释,正好有一个Kaggle的竞赛有点兴趣,难道这不是一种很理想的方式吗?(企业出钱,整理好数据,让大家来做,选择做的好的)

建模杂谈系列112 通用数据交换规范
10万美金,对一个企业来说,多吗?

内容

1 解耦

将数据维度和实际业务意义进行剥离

这一步比较简单,例如age 变量可以比较容易猜出业务

上一篇:批量更新数据的时候。格式化数据,使用excel


下一篇:112. 路径总和