TVM 各个模块总体架构

TVM 各个模块总体架构

TVM 各个模块总体架构

 

  TVM 各个模块总体架构

 

 Deploy Deep Learning Everywhere

 TVM 各个模块总体架构

 

 Existing Deep Learning Frameworks

 TVM 各个模块总体架构

 

 Limitations of Existing Approach

 TVM 各个模块总体架构

 

 Learning-based Learning System

 TVM 各个模块总体架构

 

 Problem Setting

 TVM 各个模块总体架构

 

 Example Instance in a Search Space

 TVM 各个模块总体架构

 

 TVM 各个模块总体架构

TVM 各个模块总体架构

 

  Optimization Choices in a Search Space

 

TVM 各个模块总体架构

 

 Problem Formalization

 TVM 各个模块总体架构

 

 Black-box Optimization

 TVM 各个模块总体架构

 

 Cost-model Driven Approach

 TVM 各个模块总体架构

 

 Statistical Cost Model

 TVM 各个模块总体架构

 

 Unique Problem Characteristics

 TVM 各个模块总体架构

 

 Vanilla Cost Modeling

 TVM 各个模块总体架构

 

 Program-aware Modeling: Tree-based Approach

 TVM 各个模块总体架构

 

 Program-aware Modeling: Neural Approach

 TVM 各个模块总体架构

 

 Comparisons of Models

 TVM 各个模块总体架构

 

 Unique Problem Characteristics

 TVM 各个模块总体架构

 

 Transferable Cost Model

 TVM 各个模块总体架构

 

 Impact of Transfer Learning

 TVM 各个模块总体架构

 

 Learning to Optimize Tensor Programs

 TVM 各个模块总体架构

 

 Device Fleet: Distributed Test Bed for AutoTVM

 TVM 各个模块总体架构

 

 TVM: End to End Deep Learning Compiler

 TVM 各个模块总体架构

 

 Tensor Expression and Optimization Search Space

 TVM 各个模块总体架构

 

 Search Space for CPUs

 TVM 各个模块总体架构

 

 Hardware-aware Search Space

 TVM 各个模块总体架构

 

 Search Space for GPUs

 TVM 各个模块总体架构

 

 Search Space for TPU-like Specialized Accelerators

 TVM 各个模块总体架构

 

 Tensorization Challenge

 TVM 各个模块总体架构

 

 Tensorization Challenge

 TVM 各个模块总体架构

 

 Search Space for TPU-like Specialized Accelerators

 TVM 各个模块总体架构

 

 Software Support for Latency Hiding

 TVM 各个模块总体架构

 

 TVM 各个模块总体架构

 

 Summary: Hardware-aware Search Space

 TVM 各个模块总体架构

 

 VTA: Open & Flexible Deep Learning Accelerator

 TVM 各个模块总体架构

 

 TVM: End to End Deep Learning Compiler

 TVM 各个模块总体架构

 

 Need for More Dynamism

 TVM 各个模块总体架构

 

 Relay Virtual Machine

 TVM 各个模块总体架构

 

 uTVM: TVM on bare-metal Devices

 TVM 各个模块总体架构

 

 Core Infrastructure

 TVM 各个模块总体架构

 

 TSIM: Support for Future Hardware

 TVM 各个模块总体架构

 

 Unified Runtime For Heterogeneous Devices

 TVM 各个模块总体架构

 

 Unified Runtime Benefit

 TVM 各个模块总体架构

 

 Effectiveness of ML based Model

 TVM 各个模块总体架构

 

 Comparisons of Models

 TVM 各个模块总体架构

 

 Device Fleet in Action

 TVM 各个模块总体架构

 

 End to End Inference Performance (Nvidia Titan X)

 TVM 各个模块总体架构

 

 Portable Performance Across Hardware Platforms

 TVM 各个模块总体架构

 

上一篇:解决Flex布局justify-content: space-evenly最后一行数量不固定


下一篇:Paper:2020年3月30日何恺明团队最新算法RegNet—来自Facebook AI研究院《Designing Network Design Spaces》的翻译与解读