ML之FE:基于load_mock_customer数据集(模拟客户,单个DataFrame)利用featuretools工具实现自动特征生成/特征衍生

输出结果


type: <class 'pandas.core.frame.DataFrame'>

  customer_id zip_code           join_date date_of_birth

0            1    60091 2011-04-17 10:48:33    1994-07-18

1            2    13244 2012-04-15 23:31:04    1986-08-18

2            3    13244 2011-08-13 15:42:34    2003-11-21

3            4    60091 2011-04-08 20:08:14    2006-08-15

4            5    60091 2010-07-17 05:27:50    1984-07-28

feature_matrix_customers

            zip_code  DAY(date_of_birth)  DAY(join_date)  \

customer_id                                                

1              60091                  18              17  

2              13244                  18              15  

3              13244                  21              13  

            MONTH(date_of_birth)  MONTH(join_date)  WEEKDAY(date_of_birth)  \

customer_id                                                                  

1                               7                 4                       0  

2                               8                 4                       0  

3                              11                 8                       4  

            WEEKDAY(join_date)  YEAR(date_of_birth)  YEAR(join_date)  

customer_id                                                            

1                             6                 1994             2011  

2                             6                 1986             2012  

3                             5                 2003             2011  

features_defs_customers: 9 [<Feature: zip_code>, <Feature: DAY(date_of_birth)>, <Feature: DAY(join_date)>, <Feature: MONTH(date_of_birth)>, <Feature: MONTH(join_date)>, <Feature: WEEKDAY(date_of_birth)>, <Feature: WEEKDAY(join_date)>, <Feature: YEAR(date_of_birth)>, <Feature: YEAR(join_date)>]

<Feature: MONTH(date_of_birth)>

The month of the "date_of_birth".

ML之FE:基于load_mock_customer数据集(模拟客户,单个DataFrame)利用featuretools工具实现自动特征生成/特征衍生

ML之FE:基于load_mock_customer数据集(模拟客户,单个DataFrame)利用featuretools工具实现自动特征生成/特征衍生




设计思路

ML之FE:基于load_mock_customer数据集(模拟客户,单个DataFrame)利用featuretools工具实现自动特征生成/特征衍生











上一篇:阿里云在线教育解决方案——促进教育资源均等化,助推教育质量提升


下一篇:silverlight中datagrid数据到处excel