ALINK(十一):加载数据集 (四)Table数据读入 (TableSourceBatchOp)

Java 类名:com.alibaba.alink.operator.batch.source.TableSourceBatchOp

Python 类名:TableSourceBatchOp

功能介绍

从Table中生成BatchOperator数据

参数说明

名称

中文名称

描述

类型

是否必须?

默认值

代码示例

Python 代码

from pyalink.alink import *
import pandas as pd
useLocalEnv(1)
df = pd.DataFrame([
    [0, "0 0 0"],
    [1, "1 1 1"],
    [2, "2 2 2"]
])
inOp = BatchOperator.fromDataframe(df, schemaStr='id int, vec string')
inOp.getOutputTable()
TableSourceBatchOp(inOp.getOutputTable()).print()

Java 代码

import org.apache.flink.types.Row;
import com.alibaba.alink.operator.batch.BatchOperator;
import com.alibaba.alink.operator.batch.source.MemSourceBatchOp;
import com.alibaba.alink.operator.batch.source.TableSourceBatchOp;
import org.junit.Test;
import java.util.Arrays;
import java.util.List;
public class TableSourceBatchOpTest {
  @Test
  public void testTableSourceBatchOp() throws Exception {
    List <Row> df = Arrays.asList(
      Row.of(0, "0 0 0"),
      Row.of(1, "1 1 1"),
      Row.of(2, "2 2 2")
    );
    BatchOperator <?> inOp = new MemSourceBatchOp(df, "id int, vec string");
    inOp.getOutputTable();
    new TableSourceBatchOp(inOp.getOutputTable()).print();
  }
}

运行结果

id

vec

0

0 0 0

1

1 1 1

2

2 2 2

 
上一篇:ALINK(十六):数据导入与导出 (七)与 Dataframe 互操作


下一篇:ALINK(十二):加载数据集 (五)内存数据读入 (MemSourceBatchOp)