英特尔® Distribution of OpenVINO™ toolkit 2021 版的发布说明

注意 2020 版的发布说明,请参阅英特尔® Distribution of OpenVINO™ toolkit 2020 版的发布说明。 

简介

英特尔® Distribution of OpenVINO™ toolkit 用于快速开发应用程序和解决方案,以解决各种任务(例如:模拟人类视觉、自动语音识别、自然语言处理和推荐系统等)。该工具套件基于最新一代的人工神经网络,包括卷积神经网络 (CNN)、递归网络和基于注意力的网络,可扩展跨英特尔® 硬件的计算机视觉和非视觉工作负载,从而最大限度地提高性能。它通过从边缘到云部署的高性能、人工智能和深度学习推理来为应用程序加速。

英特尔® Distribution of OpenVINO™ toolkit

  • 支持从边缘到云的深度学习推理。
  • 借助英特尔® CPU、英特尔® 集成显卡、英特尔® Gaussian & Neural Accelerator、英特尔® 神经电脑棒 2、搭载英特尔® Movidius™ 视觉处理器的英特尔® Vision Accelerator Design 的通用 API,支持跨英特尔加速器的异构执行。
  • 通过一套易用的计算机视觉功能库和预优化内核库来加速上市时间。
  • 包括针对 CV 标准进行的调用优化,包括 OpenCV* 和 OpenCL™。

第 3 版发布中的更新和更改

主要功能和改进

  • 升级到最新版本以获取新功能和性能改进。
  • 引入了条件编译的预览(可在开源发行版中获得),该预览可以显著减少特定模型的运行时组件(链接到应用程序的推理引擎)的二进制占用。
  • 推出针对第三代英特尔® 至强® 可扩展平台(代号 Ice Lake)的支持,可实现高级性能、安全性、效率和内置人工智能加速,以处理独特的工作负载和更强大的人工智能。
  • 全新预训练模型和对公共模型的支持,以简化开发:
    • 预先训练的模型:机器翻译、人/车/自行车检测、文本识别和文本语音转换。
    • 公共模型:aclnet-int8 (sound_classification)、deblurgan-v2 (image_processing)、fastseg-small 和 fastseg-large(语义分割)等。
  • 现在可以在 Windows*、Linux* 和 macOS*上使用 pip install openvino-dev,以 Python wheel 包的形式提供开发人员工具,轻松进行软件包的安装和升级。

支持变更和弃用通知

  • 工具套件组件弃用通知:英特尔® Media SDK

    弃用生效日期 2021 年 3 月 23 日
    移除日期 2021 年 10 月
    • 从英特尔® Distribution of OpenVINO™ 工具套件 2021.3 版本开始,英特尔® Media SDK 将于 2021 年 10 月弃用。
    • 建议用户迁移到英特尔® oneAPI Video Processing Library (oneVPL),作为用于视频解码、编码和处理的统一编程接口,以在 CPU、GPU 和加速器上构建便携式媒体管道。请注意 API 和功能的差异和变化。
    • 英特尔® Distribution of OpenVINO™ 工具套件将支持英特尔® one API Video Processing Library (oneVPL),以替代英特尔® Media SDK。
    • 请参阅《oneVPL 编程指南》以获取从英特尔® Media SDK 迁移到 oneVPL 的指导说明并获取《API 更新文档》以供参考。
  • 操作系统弃用通知:CentOS*

    弃用生效日期 2021 年 3 月 23 日
    移除日期 2021 年 10 月
    • 英特尔® Distribution of OpenVINO™ 工具套件将继续支持 Red Hat Enterprise Linux (RHEL) 8,并将在 2022.1(2021 年 10 月)开始的新版本中放弃对 CentOS 的支持。
    • 有关支持的硬件和操作系统的完整列表,请参阅系统要求

       

      2021.3(此版本)

      2021.4 LTS

      2022.1(2021 年 10 月)

      支持

      CentOS 7

      RHEL 8

      CentOS 7

      RHEL 8

      RHEL 8

       

  • 操作系统支持更新通知:Ubuntu* 18.0x

    变更通知开始 2021 年 3 月 23 日
    支持变更日期 2021 年 10 月
    • Ubuntu 18.0x 将转为有限支持。  Ubuntu 18.0x 将无法支持从 2022.1 版本及更高版本新发布的英特尔® 硬件。

    • 从 2022.1(2021 年 10 月)开始,新的推荐操作系统版本将为 Ubuntu 20.0。
    • 有关更多信息,请参见系统要求(从 2022.1 版本开始,推荐配置将标记为粗体)。
  • 框架弃用通知:TensorFlow* 1.x

    变更通知开始 2021 年 3 月 23 日
    支持变更日期 2021 年 10 月
    • TensorFlow 1.x 转为有限支持。仍支持使用 OpenVINO 2020.4 或更高版本创建的 TensorFlow 1.x 模型的任何中间表示 (IR) 文件。使用最新的 OpenVINO,仍然可以将 TensorFlow 1.x 模型转换为中间表示 (IR)。
    • 由于 TensorFlow 已弃用 1.x,因此要为 TensorFlow 1.x 模型生成新的 IR 文件,就需要将 Python 3.6 与 NumPy 版本 1.19.2 结合使用。
    • 英特尔® Distribution of OpenVINO™ 工具套件将在 2021 年 6 月的 2021.4 LTS 版本中继续支持 NumPy 1.19.2 版本。LTS 对 2021.4 版本的支持将延长至 2023 年 6 月。从 2021 年 10 月的 2022.1 版本开始,将不再支持 NumPy 1.19.2。
    • 建议用户在上述情况下升级到 TensorFlow 2.x 或更高版本,或使用 TensorFlow 1.x 模型。
    • 请参阅《TensorFlow1 代码迁移到 TensorFlow 2》文档和《转换 TensorFlow 模型文档》以获取指导说明。

模型优化器

模型优化器

常见的变更

  • 为了避免组件 1.25.8 版本中存在安全问题,要求中将 urllib3 版本更新为了“urllib3>=1.25.9”。
  • 在 ShapeOf 子图中用 StridedSlice 操作改进了模型的重塑功能
  • 向 IR 中的输出端口添加了框架张量名称。
  • 实现了使用完全定义的类名在 MO 中启用/禁用转换的新方法。 您只需将完全定义的类名称放入 `MO_ENABLED_TRANSFORMS` (`MO_DISABLED_TRANSFORMS`) 变量中即可(例如, `extensions.back.NonmalizeToNormalizeL2.NormalizeToNormalizeL2`)。
  • 为模型优化器实现了基本遥测数据的发送(用户启动了 MO、模型转换结果、MO 版本)

ONNX*

增加了对以下操作的支持:

  • GatherElements - 11, 13

TensorFlow*

  • 现在将 CTCGreedyDecoder 转换为 OpenVINO 操作 CTCGreedyDecoderSeqLen。请参阅 OpenVINO 操作规范以了解更多信息。

MXNet*

  • 增加了对以下操作的支持:
    • take

TensorFlow 2*

  • 增加了对 TensorFlow2.X 对象检测 API 模型的支持,其中包括 8 个 EfficientDet 模型、10 个 SSD 模型、11 个 Faster R-CNN 模型和 Mask R-CNN 模型。
  • 增加了对具有形状不变输入的 'while_loop' 操作的支持,即循环变量中每个张量的初始形状在每次迭代中都相同。请注意,'while_loop' 操作仅在 RNN 上下文中受支持,可能在其他上下文中不起作用。
  • 增加了对 Keras 操作集的支持,但不包括 ConvLSTM2D、MultiHeadAttention、Masking 操作和 SELU 激活功能

推理引擎

推理引擎

常见变更

  • 引入到推理引擎中的 CNNNetwork::getOVNameForTensor() API,允许使用框架张量名称以获取 OpenVINO 的输入/输出名称。该 API 仅适用于 ONNX 模型,支持的框架集将在下一版本中进行扩展。
  • 增加了 InferRequest::Cancel 方法,用以取消推理请求的执行。该功能目前仅适用于 CPU 插件。 
  • CNNNetwork::Serialize() 方法支持序列化为 v10 IR 格式。
  • 弃用的 API:

    • 已弃用 InferenceEngine::IVariableState 接口,请使用 InferenceEngine::VariableState C++ 封装器

推理引擎 Python API

推理引擎 Python API

  • 增加了对设置 FP16 blob 的支持
  • 增加了 FP64 数据类型

CPU 插件

CPU 插件

  • 该插件已迁移到 oneDNN v1.6。这可以提供新功能支持(例如,AVX-VNNI 指令集架构 (ISA) 的支持)和现有管道的性能优化(例如,对不支持 AVX512 的传统硬件进行 int8 推断)。
  • 支持插件本身和 oneDNN 分支中的条件编译功能。对于特定的用户方案,该功能允许将 CPU 插件库的规模减小数倍。
  • 提供了 BF16 推理管道增强功能。扩展了许多操作以直接支持 BF16 精度。结合 oneDNN v1.6 的新功能的集成,与 2021.2OV 版本相比,该升级带来了平均性能的大幅提高。
  • 增加了对新运算的支持:
    • MVN-6
    • GatherElements-6
    • CTCGreedyDecoderSeqLen-6
    • ROIAlign-3
  • 实现了多种操作优化:Split、Pad、MVN。
  • 对于定量模型,在吞吐量方案中显著减少了内存消耗。 
  • 支持 InferRequest::Cancel 方法,该方法允许在中间阶段中断推理请求的执行。

GPU 插件

GPU 插件

  • 增加了对以下操作的支持:
    • MVN-6
    • CTCGreedyDecoderSeqLen-6
    • ScatterElementsUpdate-3
    • ScatterUpdate-3
    • Broadcast-3
  • 性能提高:
    • gen12lp GPU 的 int8 和 fp16 卷积内核的微调
    • 在所有空间维度上进行 Reduce内核的优化
    • NCHW→NHWC 案例的转置操作优化
  • 缩短加载时间

MYRIAD 插件

MYRIAD 插件

  • 增加了针对新操作的支持:
    • HSwish
    • GatherND
    • Interpolate
    • Ceil
  • 为 Broadcast 运算增加了“双向”模式。
  • 为 Proposal 运算增加了第二个可选输出。
  • 改善了现有操作的性能:
    • Mish
    • Swish
    • NonMaxSuppression

HDDL 插件

HDDL 插件

  • 与 MYRIAD 插件中相同的新操作和优化。
  • 为 ION 驱动程序启用了对 Linux 内核 5.4 的支持。

GNA 插件

GNA 插件

  • 模型导出现在可保存层名称,因此可以在导入之后再次使用。
  • 修复了某些层组合。

nGraph

nGraph

  • 引入了 opset6。全新 opset 包含以下全新操作。并非所有 OpenVINO™ 工具套件插件都支持这些操作。
    • MVN-6
    • GatherElements-6
    • CTCGreedyDecoderSeqLen -6
    • ExperimentalDetectronTopKROIs -6
    • ExperimentalDetectronGenerateProposalsSingleImage-6
    • ExperimentalDetectronDetectionOutput-6
    • ExperimentalDetectronPriorGridGenerator-6
    • ExperimentalDetectronROIFeatureExtractor-6
  • 公共 nGraph API 的更改

    • 增加了 add_parameters/remove_parameter 方法

  • ONNX 导入器的更改
    • 公共 API 目录中的标头数已减少到所需的最低限度(其他标头已移至“src”目录)
    • 新的运算符支持:GatherElements、ReduceSum (opset 13)、ExperimentalDetectron 和 PriorBoxClustered(非标准操作)、BitShift
    • Bert Squad opset 10 支持
    • ONNX 依赖项已更新为 v1.8.0

训练后优化工具 (POT)

训练后优化工具

  • 为 INT8 量化增加了可选的逐层微调机制,该机制有助于提高量化模型的准确性。该机制由“use_layerwise_tuning”参数启用。 ​
  • 引入了一种新的量化权重表示形式,以解决模型优化器中的相关变化。
  • 针对量化的 mobilenetv3 和 hbonet 模型实施了性能优化。
  • 通过 POT SW API 为 MobileNetV1 FPN 模型增加了带有 AccuracyAware 算法的 INT8 量化样本。
  • 扩大了模型覆盖范围:额外启用了 44 个模型。

神经网络压缩框架 (NNCF)

  • 集成了 NNCF 和 OTE 的实例分割案例。
  • 发布了 NNCF v1.6.0 for PyTorch:
    • 增加了 UNet@Mapillary (25%) 和 SSD300@VOC (40%) 作为过滤剪枝的样本模型
    • 批处理规范适应在默认情况下适用于所有压缩算法
    • ONNX 域设置为 org.openvinotoolkit 以进行自定义 OpenVINO 操作(例如,"FakeQuantize")
    • CPU 的 nn.Embedding 和 nn.EmbeddingBag 权重的量化
    • 选择优化量化标度的对数,而不是直接优化标度本身
    • 支持插入压缩操作作为 PyTorch 操作的预挂钩
    • 扩展了 ONNX 压缩模型导出接口,并带有一个选项,可以显式命名输入和输出张量
    • AutoQ - 一种用于量化的基于 AutoML 的混合精度初始化模式

深度学习工作台

深度学习工作台

  • 扩展支持界标检测和人脸识别用例 - IR 转换、AC 测量、INT8 校准、配置文件(已选中:sphereface、facenet、arcface、MobileFace、landmarks-regression-retail-0009 模型)。数据集支持扩展到 LFW 和 VGGFace2 数据集。 
  • 增加了运行时精度分析。现在,该工具提供了运行时精度统计信息,运行时图 (Netron) 中的精度可视化,带有精度转换的表。 
  • 基于精度分析(基于模型精度的规则集)创建和公开的建议系统。咨询系统指明了常见的性能问题,并将用户向逻辑流程引导(例如,INT8 校准等)。
  • 新增了将 Accuracy Checker 配置从 DL Workbench 导出(例如导出到 CLI 中使用)的功能。
  • 增加了导入外部 Accuracy Checker 配置文件的功能,并能够在 DL Workbench 中进行交互式编辑。
  • 通过 DL Workbench 创建并公开了 OpenVINO JupyterLab 沙箱。用户现在可以结合使用 OpenVINO 沙箱和一组准备好的笔记本(分类、对象检测、语义分割、样式转换),并能够从 DL WB 移植自己的模型,以继续在 DL Workbench 中进行实验。 
  • 模型比较模式、IR 和运行时图形可视化等方面的用户体验改进。
  • 从英特尔® Distribution of OpenVINO™ 工具套件 2021.3 版本开始,DL Workbench 仅可作为预构建的 Docker 映像使用。在 OpenVINO 安装中保留了对 DL Workbench 的引用,但现在从 DockerHub 中提取了预构建的映像,而不是从软件包中对其进行构建。 

OpenCV*

  • 已更新版本至 4.5.2。
  • 增加了对动态加载的并行处理后端的支持(包括预构建的 TBB 插件)。
  • 启用了 libva 互操作性支持。

示例

  • 增加了新的 Python 示例 (hello_reshape_ssd),该示例使用 SSD-VGG 等对象检测网络进行推理。该示例显示了如何使用形状推理
  • 扩展了 C 示例 (hello_classification_async),以显示如何使用批处理

Open Model Zoo

Open Model Zoo

借助额外的 CNN-预训练模型和预生成的中间表示文件 (.xml + .bin) 对 Open Model Zoo 进行了扩展。颜色编码:替代 2021.2 模型、新模型、弃用模型:

  • 替代 2021.2 模型:
    • human-pose-estimation-0005
    • human-pose-estimation-0006
    • human-pose-estimation-0007
    • instance-segmentation-security-0002
    • instance-segmentation-security-0091
    • instance-segmentation-security-0228
    • instance-segmentation-security-1039
    • instance-segmentation-security-1040
    • text-spotting-0004-detector
    • text-spotting-0004-recognizer-decoder
    • text-spotting-0004-recognizer-encoder
  • 新模型: 
    • machine-translation-nar-en-de-0001
    • machine-translation-nar-de-en-0001
    • person-vehicle-bike-detection-2003
    • person-vehicle-bike-detection-2004
    • text-recognition-0013
    • text-to-speech-en-0001-duration-prediction
    • text-to-speech-en-0001-regression
    • text-to-speech-en-0001-generation
  • 弃用模型:
    • instance-segmentation-security-0010
    • instance-segmentation-security-0050
    • instance-segmentation-security-0083
    • instance-segmentation-security-1025
    • human-pose-estimation-0002
    • human-pose-estimation-0003
    • human-pose-estimation-0004

对以下模型的支持扩展了公有模型列表:

模型名称

任务

框架

aclnet-int8

声音分类

PyTorch

deblurgan-v2 图像处理 PyTorch
densenet-201-tf 分类 TensorFlow
dla-34 分类 PyTorch
fastseg-large 语义分割 PyTorch
fastseg-small 语义分割 PyTorch
netvlad-tf 地点识别 TensorFlow
regnetx-3.2gf 分类 PyTorch
rexnet-v1-x1.0 分类 PyTorch
ssh-mxnet 物体检测 MxNet

 

重组了 Open Model Zoo 演示文件夹,以删除 <omz_dir>\demos\python_demos 文件夹,并在每个特定的演示子文件夹 cpp、cpp_gapi、python 下找到演示实现。注意:并非所有的 OMZ 演示都具有所有不同的实现。

增加了新的演示应用程序:

  • Python face_detection_mtcnn_demo
  • Python deblurring_demo
  • Python place_recognition demo 

object_detection_demo 扩展了新模型支持,包括扩展了支持新模型的 Yolo-V4、segmentation_demo

Open Model Zoo 工具:

  • 模型下载器:
    • --output_dir 的值是相对路径时,修复了带有存档文件的下载模型。
  • 模型转换器:

    • 减少了 PyTorch-to-ONNX 转换阶段的内存使用量(取决于模型,减少幅度至高可达约 33%)。
    • 如果子进程被信号终止,则现在将打印该信号的名称。
  • Accuracy Checker: 
    • 增加了对 TensorFlow2.x 版本的支持作为推理后端
    • 带有机会转储和上载图像列表的改进子集选择逻辑
    • 增加了离线评估模式:分离推理和指标计算管道部分,并可在不同的计算机上执行
    • 注释保存机制提供有关转换步骤的元数据
    • 功能扩展了新的任务范围:命名实体识别,在黑暗中可见;扩展支持自动语音识别和文本到语音转换方法

深度学习流媒体播放器

  • 更新了 gvadetect,以包括针对 YoloV4 模型的后处理。
  • gvatrack 中引入了新的属性 “config” 以配置跟踪算法。它可帮助开发人员指定要跟踪的最大对象数,从而减少计算量并提高吞吐量。通过帮助开发人员根据边界框的位置选择是否保留跟踪 ID,即使检测到的类由于模型不正确而发生更改,它也可以提高准确性。
  • 在 gvadetect 和 gvainference 中增加了新属性 ‘object-class’。它提供了仅在特定对象类上运行辅助推理的功能。
  • 通过消除在解码和推理元素之间进行视频转换的需求,提高了跨 CPU 和 GPU 的管道的性能和可移植性。
  • 样本已更新,以接受用于推理设备选择和启用 FPS 计数器或输出视频渲染的命令行选项。这为无需修改代码而运行示例提供了更大的灵活性。
  • 在开放源代码仓库中预览:面向 Windows 的 DL Streamer 简介。现在,您可以使用 DL Streamer 构建 Windows OS 的对象检测和对象分类管道。该预览可在 ‘preview/support-for-windows’ 分支中找到。
  • 在开放源代码仓库中预览:引入了一个新的元素 gvasegment 来执行分割。该预览可在 ‘preview/segmentation’ 分支中找到。

OpenVINO™ 模型服务器

模型服务器

  • 有向无环图调度程序的自定义节点支持。即使顺序模型的输入和输出不匹配,OpenVINO 模型服务器中的自定义节点也可以简化将深度学习模型链接到完整管道的过程。在许多情况下,一个模型的输出不能直接传递给另一模型。数据可能需要分析、过滤或转换为其他格式。这些操作在人工智能框架中很难实现,或者根本不受支持。定制节点解决了这一具有挑战性的难题。它们允许使用 C++ 或 C 开发的动态库来执行任意数据转换。 
  • DAG 多路分解 - 有向无环图调度程序允许使用 Node 输出多路分解,为单独的子输出和分支管道执行来创建管道。它可以改善执行性能,并满足一些场景的需求,其中定制节点生产的任意数量的中间批次都可以分别处理,并在任何图形阶段进行收集。
  • 用于 OCR 管道的示例性自定义节点 - 在 OCR 管道中已演示了用于自定义节点和执行多路分解的用例场景https://github.com/openvinotoolkit/model_server/blob/v2021.3/docs/east_ocr.md。它结合了 east-resnet50 模型和 CRNN 模型,实现了完整的文本检测和文本识别。  该自定义节点分析了 east-resnet50 模型的响应。根据推理结果和原始图像,它会生成检测到的文本识别框列表。输出中的每个图像将被调整为预定义的目标大小,以适合 DAG 管道 (CRNN) 中的下一个推理模型。
  • 支持状态模型 - 状态模型可识别连续推理请求之间的依赖关系。它维持推理请求之间的状态,以便下一个推理依赖于先前请求的结果。OVMS 现允许在特定序列的上下文中提交推理请求。OVMS 根据客户端的请求历史记录,对状态进行存储和建模,并响应预测结果。   https://github.com/openvinotoolkit/model_server/blob/develop/docs/stateful_models.md
  • Control API - 扩展的 REST API,提供触发 OVMS 配置更新的功能。端点配置/重新加载启动应用配置更改和模型重新加载。它可以确保在特定时间部署配置更改,并确认有关重新加载操作状态的信息。端点/配置报告所有提供的模型及其版本。它简化了客户端的使用模型和连接故障排除。
  • Helm 图表增强功能 - 增加了用于在新方案下进行部署的多个配置选项:新模型存储类、Kubernetes 资源限制、安全上下文。修复了大规模部署中存在缺陷的问题。
  • Kubernetes 运算符 - 使用面向 OVMS 的 Kubernetes 运算符启用了 OVMS 部署。该功能可用于简化 Openshift 和开源 Kubernetes 中的 OVMS 服务的大规模管理。此功能将在 https://operatorhub.io 中发布

OpenVINO™ 安全插件

  • 记录的 SWTPM-HWTPM 报价绑定详细信息。
  • 使用最新的 5.0 版本的 tpm2-tools 进行了测试。
  • 如《入门指南》中所述,将命令行选项更新为 ovsatool。

新分发

  • Python 软件包:
    • OpenVINO 开发人员工具现在可作为 Python wheel 包提供。如果要安装推理引擎、模型优化器、训练后优化工具和精度检查工具实用程序,只需在您的 Python 虚拟环境中运行 pip install openvino-dev。 仅限运行时的 wheel 软件包 (pip install openvino) 也已更新,并且在使用任何一个 Python 软件包时,都不再需要在 Linux 和 macOS 上设置 Windows PATH 或 LD_LIBRARY_PATH 变量。这些软件包可以安装在许多版本的 Linux 和 Windows 上,并具有以下方面的官方支持: 

      受支持的操作系统

      Python* 版本(64 位)

      Ubuntu* 18.04 长期支持 (LTS) 版本,64 位 3.6、3.7
      Ubuntu* 20.04 长期支持 (LTS) 版本,64 位 3.6、3.7
      Red Hat* Enterprise Linux* 8,64 位 3.6、3.7
      CentOS* 7,64 位 3.6、3.7
      macOS* 10.15.x 版本 3.6、3.7、3.8
      Windows 10*,64 位 3.6、3.7、3.8
  • 容器:
    • DockerHub 容器注册表上提供了新的 Ubuntu 20 dev Docker 镜像
      • 包括推理引擎、OpenCV、示例、演示、模型优化器、训练后优化工具、精度检查工具和 Open Model Zoo 工具。
      • 支持 CPU、GPU、VPU、GNA 和 HDDL 设备。
    • 新的 RHEL8 运行时 Docker 镜像在 Red Hat Quay.io 容器注册表中可用,并支持 CPU、GPU 插件。
      • 包括推理引擎和 OpenCV。
      • 支持 CPU 和 GPU 设备。
    • 新的 Dockerfile 可使用 OpenCV 和适用于 Ubuntu 18.04 的 Open Model Zoo,从源构建推理引擎。

第 2 版发布中的更新和更改

要点综述

  • 将深度学习工作台与英特尔® DevCloud for the Edge 集成以构成 Beta 版本。使用英特尔® DevCloud for the Edge 上的深度学习工作台(而不是仅本地计算机)以图形方式分析模型,从而针对多个远程硬件配置进行解决方案的比较、可视化和微调。
  • 推出对 Red Hat Enterprise Linux (RHEL) 8.2 的支持。有关更多信息,请参阅系统要求。 运行时包可供下载。
  • 在模型优化器中为通过 TensorFlow 量化感知训练进行了量化的模型推出每通道量化支持(包括权重的每通道量化),通过模型压缩和延迟减少提高了性能。
  • 预训练模型和对公共模型的支持,以简化开发:
    • 公共模型:Yolov4(用于对象检测)、AISpeech(用于语音识别)和 DeepLabv3(用于语义分割)
    • 预训练模型:人体姿势估计(更新)、公式识别多项式手写体(新增)、机器翻译(更新)、通用手语识别(新增)和文本语音转换(新增)
  • 全新的 OpenVINO™ 安全插件,通过安全封装和执行来控制对模型的访问。这款全新插件基于 KVM 虚拟机和 Docker* 容器,与 OpenVINO™ 模型服务器兼容,可进行封装以实现灵活部署和受控的模型访问。
  • PyPI 项目从 openvino-python 迁移到 openvino,2021.1 版将从默认视图中移除。通过使用 openvino-python==2021.1,依赖于该特定版本的用户将仍然可以使用该版本。

模型优化器

模型优化器

常见的变更

  • 更新了对 NumPy 组件的要求,以避免与 TensorFlow 1.x 产生兼容性问题。
  • 借助 Eltwise 和 CTCGreedyDecoder 运算,改进了模型的重塑能力

ONNX*

  • 已支持使用“ --output”命令行参数指定模型输出张量名称的功能。
  • 增加了对以下操作的支持:
    • Acosh
    • Asinh
    • Atanh
    • DepthToSpace-11、13
    • DequantizeLinear-10(zero_point 必须为常数)
    • HardSigmoid-1,6
    • QuantizeLinear-10(zero_point 必须为常数)
    • RedueL1-11、13
    • RedueL2-11、13
    • Resize-11, 13(除了mode="nearest"(5D+输入),mode="tf_crop_and_resize",以及属性 exclude_outside 和 exclude_outside 使用非零值)。
    • ScatterND-11、13
    • SpaceToDepth-11、13

TensorFlow*

  • 增加了在调整图像大小之前应用平均/刻度值时,对使用预处理块的 TensorFlow Object Detection API 模型的支持。此前仅支持在调整大小之后应用平均/标度值的情况。
  • 将采用 FakeQuantize 方法的限值调整与 TensorFlow 方法保持一致
  • 增加了对以下操作的支持:
    • GatherND
    • Round
    • NonMaxSuppression
    • LogSoftmax
    • FakeQuantWithMinMaxVarsPerChannel

MXNet*

  • 增加了对以下操作的支持:
    • GatherND
    • Round

Kaldi*

  • 增加了对以下操作的支持:
    • TdnnCompontent

推理引擎

推理引擎

常见变更

  • 移除了 inference_engine_legacy 上的依赖项。自 2021.2 版起,客户的应用程序不直接链接 inference_engine_legacy。inference_engine_legacy 直接通过插件链接。 
  • 增加了对具有外部数据文件的 ONNX 模型读取的支持。要读取这些模型,仅需要将 core.ReadNetwork() 方法传入到 ONNX 模型中,外部数据文件将会自动找到并加载。
  • 对于 ONNX 读取器,检测受支持模型的逻辑有所改进。
  • ONNX 依赖项已更新为 v1.7.0
  • 增加了对 ONNX 函数的支持(运算符列表底部 https://github.com/onnx/onnx/blob/v1.7.0/docs/Operators.md
  • 改进了有关在 ONNX 载入器中注册自定义运算的文档和示例
  • setBatchSize 方法现已迁移到重塑方法逻辑中,以更新模型的输入形状。此外,它还应用了对模型中的某些不可重塑模式进行松弛的智能重塑转换。现在可以对同一模型使用 setBatchSize 和重塑方法,不会导致先前版本中的未定义行为。

  • 在 Windows 平台上,推理引擎库在文件属性中拥有新的“详细信息”部分。该部分包含有关动态链接库 (DLL) 的信息,包括库的描述和版本。

废弃 API

  • ExecutableNetwork::QueryState 方法被 InferRequest::QueryState 方法取代,旧方法被废弃。
  • IVariableState::GetLastState 方法更名为 IVariableState::GetState,旧名称被废弃
  • IMemoryState 更名为 IVariableState,旧名称仍可使用,但不推荐

CPU 插件

CPU 插件

  • 增加了对新运算的支持:
    • Loop-5
    • Round-5
    • NonMaxSuppression-3, NonMaxSuppression-5
    • HSigmoid-5
    • LogSoftmax-5
    • GatherND-5
  • 为 CTCLoss、Pad、Permute 和 Elementwise 运算实施了多项优化。这些优化改进了客户模型上的 CPU 性能,大幅提高了 Open Model Zoo 范围内的整体性能几何平均值。
  • 增加了对动态输入的 I64/U64 数据类型的支持(通过到 I32 的内部转换)。
  • 改进了状态 API,现在可以用于具有多个并行推理请求的应用程序:
    • 修复了 IVariableState::GetName() 方法的 MKLDNN 插件实施,现在返回变量 ID
    • 在 MKLDNN 插件中增加了对 IVariableState::GetState 的支持

GPU 插件

GPU 插件

  • 支持英特尔锐炬® Xe MAX 显卡(原代号为 DG1) 
  • 增加了对以下操作的支持:
    • HSigmoid-5
    • Round-5
    • LogSoftMax-5
  • 通过非对称量化改进了 int8 卷积的性能
  • 增加了插件侧的编译内核缓存机制,可使用它代替驱动程序中的 cl_cache。

MYRIAD 插件

MYRIAD 插件

  • 增加了针对新操作的支持:
    • HSwish
    • GatherND
    • Interpolate
    • Ceil
  • 为 Broadcast 运算增加了“双向”模式。
  • 为 Proposal 运算增加了第二个可选输出。
  • 改善了现有操作的性能:
    • Mish
    • Swish
    • NonMaxSuppression

HDDL 插件

HDDL 插件

  • 与 MYRIAD 插件中相同的新操作和优化。
  • 为 ION 驱动程序启用了对 Linux 内核 5.4 的支持。

GNA 插件

GNA 插件

  • 模型导出现在可保存层名称,因此可以在导入之后再次使用。
  • 修复了某些层组合。

nGraph

  • 推出了 opset5。全新 opset 包含以下全新操作。并非所有 OpenVINO™ 工具套件插件都支持这些操作。
    • BatchNormInference-5
    • GRUSequence-5
    • RNNSequence-5
    • LSTMSequence-5
    • Loop-5
    • Round-5
    • NonMaxSuppression-5
    • HSigmoid-5
    • LogSoftmax-5
  • 实施了公共 nGraph 转换:
    • LowLatency
      转换展开了 TensorIterator 节点,以在低延迟下对其进行逐步推理,每次推理运算中均存储状态。 转换将迭代次数更改为 1,并使用 ReadValue 和 Assign 运算代替后向边(例如,RNN 状态输入和输出)。 可对 CPU 和 GNA 插件进行该转换。
  • 公共 nGraph API 变更:
    • 推出 Sink 类以方便识别属于图形中的“Sinks”(未被任何其他节点使用的节点)的运算。通过“添加/移除 Sinks”的方法扩展了 nGraph Function API。目前,只有 Assign 节点继承自 Sync 类,Result 节点是单独存储的特殊节点,并不是 Sinks。

  • 在与英特尔® Distribution of OpenVINO™ toolkit 集成之前持续清理 nGraph 原始代码库,可移除该工具套件不支持的传统运算。

神经网络压缩框架 (NNCF)

  • 对于单级对象检测的情况,将 NNCF 与 OTE/mmdetection 集成。
  • 发布了面向 PyTorch 的 NNCF v1.5:
    • 切换了默认情况下设置的量化器基于传播的模式(与硬件配置更好集成)。
    • 对 HAWQ 混合精度量化算法实施了改进:压缩比参数支持、激活量化器位宽选择、更通用的损失计算方法。
    • 通过视觉处理器硬件配置为 EltWise 提供统一标度支持。
    • 启用了 GPT2 压缩,在受支持的模型列表中增加了修剪后的 googlenet-v1。
    • 有关功能的详细信息和完整列表,请参阅 NNCF 发布说明

训练后优化工具

训练后优化工具

  • 在 POT 配置中引入了模型预设,特别是 Transformer 模型的预设,使 POT 用户可以更轻松地量化这些模型。
  • 改进了 POT 文档,包括量化示例。增加了《常见问题解答》文档。 
  • 扩大了模型覆盖范围:额外启用了45 个模型。

深度学习工作台

深度学习工作台

  • 发行版:深度学习工作台现在可在英特尔® DevCloud for the Edge 中使用
  • 增加了对用于风格迁移、超级分辨率和图像修复用例的 GAN 模型的支持 
  • 增加了以 CSV 格式导出分析实验结果的功能

OpenCV*

  • 将版本更新至 4.5.1。
  • 在 VideoCapture API 的 Media SDK (MFX) 后端增加了对宽度/高度属性的支持。
  • G-API:为推理和流 API 增加了更多 CV 运算和Python 绑定,并为媒体格式支持引入了 MediaFrame 数据类型(例如 NV12)。

示例

  • 语音样本命令行参数中的输入层(用于输入数据文件)和输出层(用于输出和参考文件)顺序现在可以使用新的命令行参数(-iname 和 -oname)明确指定。

Open Model Zoo

  • 使用额外的 CNN 预训练模型和预生成的中间表示 (.xml + .bin) 扩展了 Open Model Zoo:

    • 替换了 2021.1 模型:

      • text-spotting-0003-detector
      • text-spotting-0003-recognizer-decoder
      • text-spotting-0003-recognizer-encoder
    • 已添加新模型:
      • bert-small-uncased-whole-word-masking-squad-int8-0002
      • bert-small-uncased-whole-word-masking-squad-emb-int8-0001
      • formula-recognition-polynomials-handwritten-0001-decoder
      • formula-recognition-polynomials-handwritten-0001-encoder
      • handwritten-simplified-chinese-recognition-0001
      • human-pose-estimation-0002
      • human-pose-estimation-0003
      • human-pose-estimation-0004
      • person-detection-0003
    • 最终模型:
      • bert-large-whole-word-masking-squad-fp32-0001 renamed to bert-large-uncased-whole-word-masking-squad-0001
  • 对以下模型的支持扩展了公有模型列表:

    模型名称

    任务

    框架

    anti-spoof-mn3

    分类

    PyTorch

    cocosnet 图像翻译 PyTorch
    colorization-v2 图像处理 PyTorch
    colorization-siggraph 图像处理 PyTorch
    common-sign-language-0001 分类 PyTorch
    efficientdet-d0-tf 物体检测 TensorFlow
    efficientdet-d1-tf 物体检测 TensorFlow
    forward-tacotron-duration-prediction 文字转语音 PyTorch
    forward-tacotron-regression 文字转语音 PyTorch
    fcrn-dp-nyu-depth-v2-tf 深度估计 TensorFlow
    hrnet-v2-c1-segmentation 语义分割 PyTorch
    mozilla-deepspeech-0.8.2 语音识别 TensorFlow
    shufflenet-v2-x1.0 分类 PyTorch
    wavernn-rnn 文字转语音 PyTorch
    wavernn-upsampler 文字转语音 PyTorch
    yolact-resnet50-fpn-pytorch 实例分割 PyTorch
    yolo-v4-tf 物体检测 TensorFlow
  • 用着色模型的 PyTorch 变体来取代该模型的旧的 Caffe 变体。

    • 增加了新的演示应用:
    • Python gesture_recognition_demo(代替 asl_recognition_demo)
    • Python human_pose_estimation_demo(支持新的 human-pose-estimation-0002/3/4 模型)
    • Python image_translation_demo
    • Python text to speech demo
    • Python object_detection_demo(代替 object_detection_demo_centernet、object_detection_demo_faceboxes、object_detection_demo_retinaface、object_detection_demo_ssd_async 和 object_detection_demo_yolov3_async)
    • C++ object_detection_demo(替换 object_detection_demo_ssd_async 和 object_detection_demo_yolov3_async)
  • 移除了已废弃的 object_detection_demo_faster_rcnn。

  • Open Model Zoo 工具:

    • 通过支持自定义预转化脚本扩展了 Model Converter,简化了非冻结模型图的转化。
    • 通过覆盖新的任务(基于图像的定位、显著图检测、光流估计、DNA 测序),扩展了 Accuracy Checker。
    • 增加了在 Accuracy Checker 中设置输入精度和获取中间指标结果的命令行选项。
    • 改进了在 Accuracy Checker 中对 GAN 模型的处理,扩展了后处理,增加了新的指标(Inception Score 和 Frechet Inception Distance)。
    • 需要使用 Tensorflow 2.3 转换 efficientdet-d0/d1 模型。

深度学习流媒体播放器

  • 直接支持 ONNX 模型:DL Streamer gvadetect、gvaclassify 和 gvainference 元素现在将支持 CPU 上的 OpenVINO™ 推理引擎支持的 ONNX 模型,无需转换为中间表示 (IR) 格式。
  • 基于全帧和 ROI 的推理:对于连续检测和全帧分类等用例,在 gvadetect、gvaclassify 和 gvainference 元素中增加的新属性 'inference-region' 将使开发人员能够在全帧或 ROI(感兴趣区域)上运行推理。
  • 无图像对象跟踪:在 gvatrack 中引入两个新算法 'short-term imageless' 和 'zero-term imageless',将能在不访问图像数据的情况下跟踪对象。 
  • Docker 文件更新:使用 DL Streamer GitHub 中的 Docker 文件创建的文件夹结构与 OpenVINO™ 在 DockerHub* 上发布的 Docker 映像一致。无论选择哪种发行方式(OpenVINO Installer、OpenVINO Docker 映像、DL Streamer Docker 文件、从源构建),开发人员现在都可以按照相同的说明和准则使用 DL Streamer。

有关 DL Streamer 的更多信息,请参阅位于 GitHub 上的 DL Streamer 开源项目存储库“openVINO™ 工具套件 - DL Streamer”中的 DL Streamer 教程、API 参考和样本。还可访问“DL Streamer 样本”查看样本文档。

OpenVINO™ 模型服务器

模型服务器

  • 有向无环图 (DAG) 调度程序 -(以前为 `models ensemble`)该功能首次在 2021.1 版中以预览版的形式提供。现在它已得到官方支持,从而使定义由响应单个预测请求的多个互联模型组成的推理管道成为可能。在该版本中,我们增加了对其余 API 调用(预览版中的 DAG 不支持)的支持,特别是 `GetModelStatus` 和 `GetModelMetadata`。`GetModelStatus` 返回整个管道的状态,而 GetModelMetadata 返回管道输入和输出参数。新的 2021.2 版改进了 DAG 配置验证。
  • 直接导入 ONNX 模型 - 现在可以导入 ONNX 模型,无需转换为中间表示 (IR) 格式。这有助于利用 ONNX 模型和 PyTorch 训练框架简化部署。
  • 自定义加载器以及与 OpenVINO™ 安全插件的集成 - 现在可以定义自定义库,用于处理模型加载操作 - 包括与模型解密和许可证验证有关的额外步骤。要了解有关模型保护的信息,请查看安全插件组件的文档。
  • 流量加密 - 新的部署配置通过 mTLS 证书进行客户端授权,通过与 Docker 容器中的 NGINX 反向代理集成进行流量加密。 
  • 从云存储进行远程模型缓存 - 进行需要重新加载模型的配置变更后,不再多次下载存储在 Google Cloud Storage (GCS)、Amazon S3 和 Azure blob 中的模型。在模型重新加载操作期间,将使用缓存的模型。更改服务的模型时,将仅在模型存储中添加相应的新版本文件夹。

OpenVINO™ 安全插件

OpenVINO™ 安全插件

该安全插件是一组工具,让模型开发人员能够使用 OpenVINO™ 模型服务器控制开发后对模型的访问,并检查在受控环境中运行期间对模型的访问。它由定义模型访问控制的一组开发工具、在将模型加载到模型服务器之前检查模型许可证的许可服务、位于 OpenVINO™ 模型服务器内的可在其中执行访问受控模型的隔离环境组成。

 安全插件的关键功能

  • 定义开发后对模型的访问控制。
  • 生成限制模型使用天数的客户特定许可证。
  • 在将模型加载到 OpenVINO™ 模型服务器之前检查许可证的有效性。
  • 使用 OpenVINO™ 模型服务器,通过 KVM 虚拟机在隔离环境中执行模型。
  • 通过 NGINX 控制应用程序对模型的访问。

第 1 版发布中的更新和更改

要点综述

  • 2020 年 10 月重要发布(2021 年版) 此版本推出了重要的全新功能,以及突破性更新和向后不兼容的修改,强烈建议您升级到此版本。 
  • 支持 TensorFlow 2.2.x 为在 TensorFlow 2.2.x 框架中训练的模型提供官方支持。
  • 支持最新硬件。 为面向物联网 (IoT) 应用程序的第十一代智能英特尔® 酷睿™ 处理器家族(原代码 Tiger Lake)提供官方支持,包括采用英特尔锐炬® Xe 显卡和英特尔® 深度学习加速指令实现全新推理性能增强,以及采用英特尔® Gaussian & Neural Accelerators 2.0 实现低功耗语音处理加速。
  • 突破视觉极限。 支持端到端功能,以使用英特尔® Distribution OpenVINO™ 工具套件,该工具套件用于计算机视觉以外的工作负载,包括音频、语音、语言和推荐,并提供全新预训练模型,支持公共模型、代码样本和演示,以及 OpenVINO™ 工具套件中的非视觉工作负载。
  • 将于 2020 年第四季度发布:(测试版)集成 DL Workbench 和英特尔® DevCloud for the Edge。 开发人员现在可以使用英特尔® DevCloud for Edge 上的深度学习工作台(而不仅是本地计算机)以图形方式分析模型,针对多个远程硬件配置比较、可视化和微调解决方案。
  • OpenVINO™ 模型服务器。 英特尔® Distribution of OpenVINO™ toolkit 的附加组件和可扩展微服务提供了用于推理的 GRPC 或 Http/REST 端点,从而更易于将模型部署在云或边缘服务器环境中。现在,它通过 C++ 实施以减少容器占用的空间(例如,少于 500 MB),并提供更高的吞吐量和更低的延迟。
  • 现在可以通过 Gitee* 和 PyPI* 分发方式获得。我们建议您从分发方式和下载中选择。 

与 2020.4 相比,向后不兼容的修改

  • 废弃 API 列表API 变更
  • IRv7 自 2020.3 年版以来已被废弃,此版本不再受支持。您无法读取 IRv7 和较低版本的 Core:ReadNetwork,建议更新至最高版本 IRv10。IRv10 提供了简化且面向未来的操作组,该操作组与公共框架保持一致,并更好地支持低精度模型,以便在量化模式下运行时保持准确性,并支持可重塑模型。
  • 推理引擎 NNBuilder API 已被移除。建议使用 nGraph 作为替代品,从 C++ 代码创建 CNN 图形。
  • 以下推理引擎的公共 API 已移除:
    • InferencePlugin、IInferencePlugin 和 InferencEnginePluginPtr 类。请使用 Core 类作为替代。
    • PluginDispatcher 类。请使用 Core 类作为替代。
    • CNNNNetReader 类。请使用 Core::ReadNetwork 作为替代。
    • PrimitiveInfo、TensorInfo 和 ExecutableNetwork::GetMappedTopology。请使用 ExecutableNetwork::GetExecGraphInfo 作为替代。
    • ICNNNetworkStats、NetworkNodeStats、CNNNetwork::getStats 和 CNNNetwork::setStat。使用采用了 FankeQuantze 方法的 IRv10 作为 INT8流的替代品。
    • IShapeInferExtension 和 CNNNetwork::addExtension。将 IExtension 系列用作 nGraph::Nodes 的容器,供其实施形状推理。
    • 来自推理引擎 Python API 的 IEPlugin。使用 Core API 作为替代。
    • Data::getCreatorLayer、Data::getInputTo 和 CNNLayer。使用 CNNNetwork:getFunction 来使图形发生迭代。
  • 从OpenVINO™ 工具套件 2020.2 版开始,此前通过 nGraph 提供的所有功能已合并至 OpenVINO™ 工具套件。因此,此前通过 ONNX RT Execution Provider for nGraph 提供的所有功能都已合并至 ONNX RT Execution Provider for OpenVINO™ 工具套件。因此,ONNX RT Execution Provider for nGraph 将于 2020 年 6 月 1 日起弃用,并于 2020 年 12 月 1 日完全移除。将迁移至 ONNX RT Execution Provider for the OpenVINO™ 工具套件,作为英特尔® 硬件人工智能推断的统一解决方案。
  • 以下 nGraph 公共 API 将被弃用或移除:
    • 已移除在早期版本中弃用的 nGraph 方法和类。
    • GetOutputElement 操作已移除。
    • copy_with_new_args() 已替换为 clone_with_new_inputs()。
    • opset0 和反向传播操作已移除。
    • opset0 中部分操作已移除,opset 中废弃操作已移除,上述废弃操作未在较新版本的 opset 中使用。
    • 已移除对 JSON 格式的序列化 nGraph 函数的支持。
    • FusedOp 已弃用。
  • nGraph 公共 API 的结构已更改。nGraph 构建器和参考实现已从 nGraph 公共 API 中移除。已合并具有融合和实验性操作的子文件夹及通用操作目录。
  • 系统要求已更改。请查看以下部分。
  • 英特尔® 将过渡到基于 FPGA 的下一代可编程深度学习解决方案,以提高 FPGA 深度学习的自定义水平。作为此过渡的一部分,未来标准的英特尔® Distribution of OpenVINO™ toolkit 的标准版本(非 LTS 版)将不再包含搭载英特尔® Arria® 10 FPGA 的英特尔® Vision Accelerator Design,以及搭载英特尔® Arria® 10 GX FPGA 的英特尔® Programmable Acceleration Card。英特尔® Distribution of OpenVINO™ toolkit 2020.3.X LTS 版将继续支持搭载英特尔® Arria® 10 FPGA 的英特尔® Vision Accelerator Design,以及搭载英特尔® Arria® 10 GX FPGA 的英特尔® Programmable Acceleration Card。有关基于 FPGA 的下一代可编程深度学习解决方案的问题,请与您的销售代表联系或联系我们来获取最新的 FPGA 更新。

模型优化器

模型优化器

常见的变更

  • 实施了多项优化转型,以 HSwish、Mish、Swish 和 SoftPlus 操作取代操作子图。
  • 默认情况下,模型优化器生成 IR 并保持形状计算子图 先前,如果提供 "--keep_shape_ops"命令行参数,则会触发该行为。该密钥在此版本中被忽略,并将在下一个版本中删除。要触发传统行为以生成固定输入形状的 IR(将操作和形状计算子图折叠为常量),请使用“--static_-shape”命令行参数。对于此类 IR,在运行时使用 Inference Engine API 更改模型输入形状可能会失败。
  • 已修复模型优化器转换问题导致使用推理引擎重塑 API 引发不可重塑的 IR。
  • 已启用转换,以修复原始网络中的不可重塑模式:
    • 硬编码重塑
      • 在 Reshape(2D)-> MatMul 模式中
      • 当模式可以融合至 ShuffleChannels 或 DepthToSpace 操作时,Reshape->Transpose->Reshape
    • 硬编码插值
      • 在 Interpolate->Concat 模式中
  • 为 TensorFlow 2.X 添加了专用需求文件,以及专用的安装先决条件脚本。
  • 使用 ScadterNDUpdate-4 替换了 SparseToDense 操作。

ONNX*

  • 已支持使用“ --output”命令行参数指定模型输出张量名称的功能。
  • 增加了对以下操作的支持:
    • Acosh
    • Asinh
    • Atanh
    • DepthToSpace-11、13
    • DequantizeLinear-10(zero_point 必须为常数)
    • HardSigmoid-1,6
    • QuantizeLinear-10(zero_point 必须为常数)
    • RedueL1-11、13
    • RedueL2-11、13
    • Resize-11, 13(除了mode="nearest"(5D+输入),mode="tf_crop_and_resize",以及属性 exclude_outside 和 exclude_outside 使用非零值)。
    • ScatterND-11、13
    • SpaceToDepth-11、13

TensorFlow*

  • 增加了对以下操作的支持:
    • Acosh
    • Asinh
    • Atanh
    • CTCLoss
    • EuclideanNorm
    • ExtrationImagePatches
    • FloorDiv

MXNet*

  • 增加了对以下操作的支持:
    • Acosh
    • Asinh
    • Atanh

Kaldi*

  • 修复了 ParallelComponent 支持的错误。目前已得到完全支持,不存在任何限制。

推理引擎

推理引擎

常见变更

  • 迁移到 Windows 默认的 Microsoft Studio c++ (MSVC) 2019 编译器,可帮助您将 OpenVINO™ 运行时的二进制大小减小 2.5 倍。请查看借助英特尔® Distribution of OpenVINO™ toolkit 中的最新功能来减少应用程序占用空间,以了解详情
  • 请参阅与 2020.4 相比弃用消息和向后不兼容的更改章节,以了解 API 的详细更改。
  • 将基于 CPU 的预处理路径(即针对不同数量的通道、布局转换和颜色空间转换的调整)移植至 AVX2 和 AVX512 指令集。

推理引擎 Python API

推理引擎 Python API

  • 启用了 nGraph Python API,该 API 允许使用 Python 与 nGraph 函数进行通信。这可支持对已加载图形进行分析。
  • 已启用图形节点的设置参数。 
  • 已启用使用 Python API 读取 ONNX 模型。

推理引擎 C API

推理引擎 C API

  • 无变更

CPU 插件

CPU 插件

  • 改进了使用 MSVC 编译器构建的 CPU 插件的性能,使其与使用英特尔® 编译器构建的版本保持一致,从而支持将 MSVC 用作 Windows 上二进制分发的默认编译器。此更改使 CPU 插件和其他组件的二进制大小减少了 2 倍以上。请查看借助英特尔® Distribution of OpenVINO™ toolkit 中的最新功能来减少应用程序占用空间,以了解详情
  • 增加了针对新操作的支持:
    • ScatterUpdate-3
    • ScatterElementsUpdate-3
    • ScatterNDUpdate-3
    • Interpolate-4
    • CTC-Loss-4
    • Mish-4
    • HSwish-4

GPU 插件

GPU 插件

  • 为面向物联网 (IoT) 应用程序的第十一代智能英特尔® 酷睿™ 处理器家族(原代码 Tiger Lake)提供官方支持 
  • 支持基于英特尔® 深度学习加速的集成显卡优化的 INT8 推理管道。
  • 支持新操作:
    • Mish
    • Swish
    • SoftPlus
    • HSwish

MYRIAD 插件

MYRIAD 插件

  • 针对具有固定输入形状和动态输出形状的 ONNX Faster R-CNN 添加了支持。
  • 为自定义 OpenCL 层添加了针对 automatic-DMA 的支持。
  • 增加了针对新操作的支持:
    • Mish
    • Swish
    • SoftPlus
    • Gelu
    • StridedSlice
    • 在 Div 中支持 I32 数据类型
  • 改善了现有操作的性能:
    • ROIAlign
    • Broadcast
    • GEMM
  • 在 myriad_compile 中添加了新选项 VPU_TILING_CMX_LIMIT_KB,可限制 DMA 事务的规模。
  • OpenCL 编译器与 OpenVINO 一起再次分发,仅针对面向 SHAVE* 处理器的英特尔® 神经电脑棒 2。OpenCL 支持由 ComputeAorta* 提供,并在英特尔® 和 Codeplay* Software Ltd 之间的许可协议下进行分发。

HDDL 插件

HDDL 插件

  • 支持自定义 OpenCL 层的 automatic-DMA。
  • 与 MYRIAD 插件中相同的新操作和优化。
  • OpenCL 编译器与 OpenVINO 一起再次分发,仅针对面向 SHAVE* 处理器的英特尔® Vision Accelerator Design 和英特尔® Movidius™ 视觉处理器组合。OpenCL 支持由 ComputeAorta* 提供,并在英特尔和 Codeplay* Software Ltd 之间的许可协议下进行分发。

GNA 插件

GNA 插件

  • 新增为面向物联网 (IoT) 应用程序的第十一代智能英特尔® 酷睿™ 处理器家族(原代码 Tiger Lake)提供的官方支持。
  • 添加了对许多其他层和层组合的支持,包括:
    • 基于 TensorFlow 框架的模型卷积层
    • 电源参数不同于 1 的电源层。
    • 输入层数量大于 2 的 Concat 层
    • 4D 元素级运算
  • 增加了对从流中导入模型的支持。
  • 增加了对 Windows 的 QoS 机制的支持。
  • Python Benchmark 工具中添加了对 GNA 特定参数的支持。

nGraph

  • 推出 opset4。全新 opset 包含以下全新操作。并非所有 OpenVINO™ 工具套件插件都支持这些操作。
    • Acosh-4
    • Asinh-4
    • Atanh-4
    • CTCLoss-4
    • HSwish-4
    • Interpolate-4
    • LSTMCell-4
    • Mish-4
    • Proposal-4
    • Range-4
    • ReduceL1-4
    • ReduceL2-4
    • ScattenNDUpdate-4
    • SoftPlus-4
    • Swish-4
  • 启用了 nGraph Python API,该 API 允许使用 Python 与 nGraph 函数进行通信。可帮助您对已加载的图形进行分析。
    • 已启用图形节点的设置参数。 

    • 已启用使用 Python API 读取 ONNX 模型。

  • 重构了 nGraph Transformation API,以使其具有透明的结构,并更易于使用。请访问 nGraph 开发人员指南,以了解更多内容。
  • nGraph 公共 API 已与其余代码分开,ONNX 导入程序已移至前端文件夹。

神经网络压缩框架 (NNCF)

  • NNCF v1.4 for PyTorch 已发布:
  • 允许将修剪后的模型导出至 ONNX。
  • 增加了对 FP16 微调以实现量化的支持。
  • 增加了对 BatchNorm 调整的支持,作为常见的压缩算法初始化步骤。
  • 提升了每通道量化训练的性能。性能几乎与按张量训练相当。
  • 支持 nn.Embedding 和 nn.Conv1d 加权的默认量化。
  • 有关详细信息,请参阅 NNCF 版本说明

训练后优化工具

训练后优化工具

  • 在“精度感知”算法中启用了量化参数的自动调整。
  • 已加速 Honest Bias Correction 算法。相比 2020.4,当'use_fast_bias'= false 时,量化时间的平均提升约 4 倍。
  • 已实现 Post-training Optimization Toolkit API 产品化。提供 API 使用演示的示例和文档,其中包括:
    • 集成到用户的管道。
    • 自定义数据加载器、指标计算和执行引擎。
  • 默认的量化方案对应于兼容模式,该模式需要在不同的硬件上提供几乎相同的精度。
  • 扩展模型覆盖范围:已启用 44 款全新模型。

深度学习工作台

深度学习工作台

  • 已支持预训练 TensorFlow2.0 模型的导入和分析。 
  • 使用 POT 显示的不同预设启用 INT8 校准。
  • 已启用远程目标的 INT8 校准。
  • 改进了面向 IR 和运行时图表的可视化,包括显卡交互和热图。 
  • 在用户选择的映像中增加了推理结果的可视化。该功能处于实验模式。

OpenCV*

  • 更新版本至 4.5.0。
  • 将上游许可证更改为 Apache 2 (PR#18073)。
  • 增加了对 OpenCV 应用程序中多个 OpenCL 环境的支持。

示例

  • 更新了推理引擎 C++ 示例,以演示如何直接加载 ONNX* 模型。

Open Model Zoo

  • 使用额外的 CNN 预训练模型和预生成的中间表示 (.xml + .bin) 扩展了 Open Model Zoo:

    • 替换了 2020.4 模型:

      • face-detection-0200
      • face-detection-0202
      • face-detection-0204
      • face-detection-0205
      • face-detection-0206
      • person-detection-0200
      • person-detection-0201
      • person-detection-0202
      • person-reidentification-retail-0277
      • person-reidentification-retail-0286
      • person-reidentification-retail-0287
      • person-reidentification-retail-0288
    • 已添加新模型:
      • bert-large-uncased-whole-word-masking-squad-emb-0001
      • bert-small-uncased-whole-word-masking-squad-0002
      • formula-recognition-medium-scan-0001-im2latex-decoder
      • formula-recognition-medium-scan-0001-im2latex-encoder
      • horizontal-text-detection-0001
      • machine-translation-nar-en-ru-0001
      • machine-translation-nar-ru-en-0001
      • person-attributes-recognition-crossroad-0234
      • person-attributes-recognition-crossroad-0238
      • person-vehicle-bike-detection-2000
      • person-vehicle-bike-detection-2001
      • person-vehicle-bike-detection-2002
      • person-vehicle-bike-detection-crossroad-yolov3-1020
      • vehicle-detection-0200
      • vehicle-detection-0201
      • vehicle-detection-0202
    • 最终模型:
      • face-detection-adas-binary-0001
      • pedestrian-detection-adas-binary-0001
      • vehicle-detection-adas-binary-0001
  • 对以下模型的支持扩展了公有模型列表:

    模型名称

    框架

    aclnet

    PyTorch

    resnest-50 PyTorch
    mozilla-deepspeech-0.6.1 Tensorflow
    yolo-v3-tiny-tf Tensorflow
  • 增加了新的演示应用程序:
    • bert_question_answering_embedding_demo, Python
    • formula_recognition_demo, Python
    • machine_translation_demo, Python
    • sound_classification_demo, Python
    • speech_recognition_demo, Python 
  • Open Model Zoo 工具:
    • 提升了下载程序速度。
    • 在每个模型文件夹中添加了“准确性检查程序”配置文件。为了兼容性,原有位置的软链接被保留至新位置。在未来的版本中,将删除软链接。
    • 已简化“准确性检查程序”配置文件,无需在配置文件中指定模型 IR 或目标设备的路径和精度。将这些参数应用于“准确性检查器”命令行选项。请参阅如何使用预定义配置文件的说明,以了解详细信息。
    • 已扩展准确性检查程序,通过推理引擎预处理 API 支持优化的预处理操作。
    • 已在“准确性检查器”中启用 ONNX 模型评估,无需转换为 IR 格式。

深度学习流媒体播放器

  • 已添加对音频分析的支持,DL Streamer 不再局限于视频内容。新增使用 AclNet 模型检测音频事件的新元件 gvaaudiodetect。为示例文件夹添加了管道的端到端示例。
  • 添加了新元件 gvametaaggregate,以组合来自管道多个分支的结果。这有助于将管道拆分成多个分支以并行处理,随后组合各个分支的结果,创建复杂的管道。 
  • 支持 GPU 的 VAAPI 解码、调整大小、CSC 和 DL Streamer 推理元件之间的 GPU 内存表面共享,即数据的零拷贝,以改善整体管线性能。
  • 在 gvatrack 和 gvawatermark 元件的输入和输出时允许 GPU 内存,因此在 GPU 上执行推理时,无需使用 vaapipostproc 显式地将内存从 GPU 转换为 CPU。这不仅有助于管道在有或无 GPU 的设备之间移植,而且由于删除了内存复制步骤而提高了性能。
  • [预览] 将 DL Streamer OS 支持扩展至 Ubuntu 20.04。DL Streamer 将在 Ubuntu 20.04 上使用操作系统提供的 GStreamer 及其插件,因此您可以访问 GStreamer 默认安装时提供的所有元件。

有关 DL Streamer的 更多信息,请参阅 OpenVINO™ 推理引擎样本中的 DL Streamer 教程、API 参考和示例文档,以及位于 OpenVINO™ 工具套件 - GitHub 的 DL Streamer 资源库中的 DL Streamer 开源项目新主页。

OpenVINO™ 模型服务器

模型服务器

模型服务器是一个可扩展的高性能工具,用于服务采用 OpenVINO™ 优化的模型。它通过 gRPC 或 HTTP/REST 端点提供推理服务,使您无需编写定制代码即可将模型更快地投入生产。

主要特性和优势:

  • 提高了单个服务器实例的可扩展性。借助新的 C ++ 实现,您可以使用具有线性可伸缩性的全部可用硬件,同时避免前端出现任何瓶颈。
  • 减少了客户端和服务器之间的延迟。这对于高性能加速器或 CPU 尤为明显。
  • 已减少占用空间。通过切换至 C++ 并减少依赖项,Docker 镜像大小将减少至约 450MB。
  • 增加了对在线模型更新的支持。服务器可以监控配置文件更改,并根据需要重新加载模型,而无需重新启动服务。

有关模型服务器的更多信息,请参阅开源回购模型服务器版本说明。预构建 Docker 映像可通过 openvino/model_server 获取。 

预览功能术语

预览功能是一项正在推出的功能,以便获得开发人员早期反馈。欢迎向论坛提交有关预览功能的评论、提问和建议。

预览功能的关键属性:

  • 高质量实施
  • 无法保证未来的存在、兼容性或安全性。

注意:预览功能/支持在未来会发生变化。其在未来的版本中可能会被移除或更改。对预览功能的更改需要经过废除和删除的过程。因此,不鼓励在生产代码库中使用预览功能。

已知问题

Jira ID

描述

组件

周转

#1 仍有许多尚待解决的问题,请参阅“英特尔® Distribution of OpenVINO™ toolkit v.2020 发布说明”中的“已知问题”部分 全部
21670 当指定 8 位量化时,英特尔® GNA 插件无法对具有双峰权重分布的 FC 层进行精确量化。数值接近于 0 的权重被设置为零。 IE GNA 插件 目前,在这些用例中使用 16 位权重。
25358 在 GT3e/GT4e/ICL NUC 平台上,GPU 插件可能会出现一些性能降级 IE GPU 插件
24709 重新训练的 TensorFlow 对象检测 API RFCN 模型有显著的精度降级。只有预训练模型才会生成正确的推理结果。 全部 如果需要对模型进行再训练,则使用 Faster-RCNN 模型取代 RFCN 模型。

26388

由于缺少状态处理,搭载 LSTMCell 的低延迟(批量尺寸 1)图形无法正确推理。 全部 使用废弃的 IRv7,并手动将内存层插入到 IR 图形中。 或者,将状态张量添加为额外输入和输出节点,在加载图形后,将它们给予了IR 节点 ID 的 Blobs 联系起来。
24101 如果层不进行 64 字节对齐,性能和内存的消耗可能会很差。 IE GNA 插件 尝试避开未进行 64 字节对齐的层,让模型 GNA 变得友好。
28259 在 Python 接口中进行缓慢的 BERT 推理。 IE Python 仅在导入 PyTorch 时可见。请勿导入 PyTorch 模块。
35367 [IE][TF2] 在 FP32 的最后一次张量检查中,有几个模型失败。 IE MKL-DNN 插件  
39060 CentOS 7上的大量模型使 LoadNetwork 崩溃。 IE MKL-DNN 插件  
34087 [cIDNN]OpenCL 驱动程序升级导致多个模型的性能降级。 clDNN  
33132 [IE CLDNN] FP32 模型在 ICLU GPU 上的准确性和最后张量检验回归 IE clDNN 插件  
25358 [cIDNN]R4 上 NUC 和 ICE_Lake 目标的性能下降。 IE clDNN 插件
39136 重塑失败后调用 LoadNetwork 会引发异常 IE NG 集成  
42203

受中国的防火墙限制,中国客户从新存储 https://storage.openvinotoolkit.org/ 下载内容时可能会遇到一些问题

OMZ 请使用含有旧存储 download.01.org 链接的分支 https://github.com/openvinotoolkit/open_model_zoo/tree/release-01org
24757 异构模式不适用于 GNA IE GNA 插件 拆分模型以在 CPU 上运行不受支持的层
48177 无法使用 python3.8 导入 IE Python API Python API 请在 PyPI (https://pypi.org/project/openvino) 上使用 wheel 软件包 

包含在此版本中

英特尔® Distribution of OpenVINO™ toolkit 提供以下版本:

  • 适用于 Windows* 的 OpenVINO™ 工具套件
  • 适用于 Linux* 的 OpenVINO™ 工具套件
  • 适用于 macOS* 的 OpenVINO™ 工具套件
组件 许可 位置 Windows Linux macOS

深度学习模型优化器

为已训练模型准备的模型优化工具

Apache 2.0 <install_root>/deployment_tools/model_optimizer/*

深度学习推理引擎

统一的 API 将推理集成到应用程序逻辑中

推理引擎标题

EULA

 

 

Apache 2.0

<install_root>/deployment_tools/inference_engine/*

 

 

<install_root>/deployment_tools/inference_engine/include/*

OpenCV* 库

为英特尔® 硬件编译的 OpenCV* 社区版本

Apache 2.0 <install_root>/opencv/*

英特尔® Media SDK 库(开源版本)

简化 OpenVINO™ 工具套件和英特尔® Media SDK 之间的集成。

MIT <install_root>/../mediasdk/*

OpenVINO™ 工具套件文档

开发人员指南和其他文档

  可从 OpenVINO™ 工具套件产品网站获取,不包含在安装程序包内。

Open Model Zoo

来自英特尔® Open Model Zoo 的模型文档。使用模型下载程序,下载二进制格式的模型。

Apache 2.0 <install_root>/deployment_tools/open_model_zoo/*

推理引擎样本

说明推理引擎 API 用途的示例和演示如何在您的应用程序中使用英特尔® Distribution of OpenVINO™ toolkit 功能的示例

Apache 2.0

<install_root>/deployment_tools/inference_engine/samples/*

深度学习工作台

支持通过 OpenVINO™ 模型优化器运行深度学习模型、将模型转换为 INT8、微调模型、运行推理,以及测量准确性。

EULA 从英特尔® Distribution of OpenVINO™ 工具套件 2021.3 版本开始,DL Workbench 仅可作为预构建的 Docker 映像使用。在 OpenVINO 安装中保留了对 DL Workbench 的引用,但现在从 DockerHub 中提取了预构建的映像,而不是从软件包中对其进行构建。 

训练后优化工具套件

设计旨在通过应用不需要重新训练(例如,训练后量化)的特定方法来将模型转化为对硬件更加友好的表示文件。

EULA <install_root>/deployment_tools/tools/post_training_optimization_toolkit/*

语音库和端到端的语音演示

 

GNA 软件许可协议 <install_root>/data_processing/audio/speech_recognition/*
DL Streamer EULA <install_root>/data_processing/dl_streamer/*

 

哪里可以下载此版本

系统要求

免责声明:某些硬件(包括但不限于 GPU 和 GNA)要求安装特定的驱动程序才能正常工作。驱动程序可能需要更新您的操作系统(包括 Linux 内核),请参参阅相关文档。操作系统更新应由用户处理,不包含在 OpenVINO 安装内。

英特尔® CPU 处理器

硬件:

  • 搭载英特尔® SSE4.2 支持的英特尔凌动® 处理器
  • 搭载英特尔® 核芯显卡的英特尔® 奔腾® 处理器 N4200/5、N3350/5、N3450/5
  • 第六代至第十一代智能英特尔® 酷睿™ 处理器
  • 英特尔® 至强® 处理器可扩展处理器(以前称为 Skylake)
  • 第二代智能英特尔® 至强® 可扩展处理器(原 Skylake 和 Cascade Lake)
  • 第三代英特尔® 至强® 可扩展处理器(以前称为 Cooper Lake 和 Ice Lake)

操作系统:

  • Ubuntu* 18.04 长期支持 (LTS) 版本,64 位
  • Ubuntu* 20.04 长期支持 (LTS),64 位 - 预览支持
  • Windows* 10、64 位
  • macOS* 10.15,64 位
  • CentOS* 7,64 位
  • Red Hat Enterprise Linux* 8.2,64 位

英特尔® 处理器显卡

硬件:

  • 英特尔® 高清显卡
  • 英特尔® 超核芯显卡
  • 英特尔锐炬® Xe 显卡
  • 英特尔锐炬® Xe Max 显卡 
  • 英特尔锐炬® Pro 显卡

操作系统:

  • Ubuntu* 18.04 长期支持 (LTS) 版本,64 位
  • Windows* 10、64 位
  • Yocto* 3.0, 64 位

注意 此安装需要未包含在英特尔 Distribution of OpenVINO 工具套件包中的驱动程序

注意:英特尔®️ 至强® 处理器需要支持处理器显卡的芯片组。图形处理器并未包含在所有处理器中。参见产品规格来获得关于您处理器的信息。

英特尔® Gaussian & Neural Accelerator (Intel® GNA)

操作系统:

  • Ubuntu* 18.04 长期支持 (LTS) 版本,64 位
  • Windows* 10、64 位

英特尔® 视觉处理器

搭载英特尔® Movidius™ 视觉处理器 (VPU) 的英特尔® Vision Accelerator Design

操作系统:

  • Ubuntu* 18.04 长期支持 (LTS) 版本,64 位(Linux 内核 5.2 和更低版本)
  • Windows* 10、64 位
  • CentOS* 7.6,64 位

英特尔® Movidius™ 神经电脑棒和英特尔® 神经电脑棒 2

操作系统:

  • Ubuntu* 18.04 长期支持 (LTS) 版本,64 位
  • CentOS* 7.6,64 位
  • Windows* 10、64 位
  • Raspbian*(仅限目标)

搭载英特尔® Movidius™ Myriad™ X C0 视觉处理器和 1 个 MYDX 的 AI Edge Computing Board:

操作系统:

  • Windows* 10、64 位

在验证过程中使用的组件

在验证过程中使用的操作系统:

用于验证的 DL 框架:

  • TensorFlow 1.15.2, 2.2.0(根据产品特性提供有限支持)
  • MxNet 1.5.1

注意: 上面指定的 CMake 版本是从源构建 OpenVINO 的。  从英特尔® Distribution of OpenVINO™ 工具套件构建示例和演示需要 CMake* 3.10 或更高版本(Windows 除外,在 Windows 中首先需要 CMake 3.14 支持 Visual Studio 2019)。

有用的链接

注意:在新窗口中打开链接。

 

法律信息

您使用本文档时不得涉及针对本文档所述英特尔产品的任何侵权分析或其他法律分析,也不得为此提供便利。您同意就此后起草的任何专利权利(包括此处披露的主题)授予英特尔非排他性的免版税许可。

本文档未授予任何公司或其他机构知识产权许可(明示或暗示、明确或隐含地)。

此处提供的信息可随时改变而毋需通知。关于最新英特尔® 产品的规格和路线图,请联系您的英特尔代表。

所述产品可能包含设计缺陷或错误(即勘误表),这可能会使产品与已发布的技术规格有所偏差。可应要求提供当前的勘误表。

英特尔技术特性和优势取决于系统配置,并可能需要支持的硬件、软件或服务激活。访问 http://www.intel.cn/ 了解详情,或咨询生产厂家或零售商。

没有任何计算机系统能保证绝对安全。

英特尔、Arria、酷睿、Movidius、至强、OpenVINO 和英特尔标志是英特尔公司在美国和/或其他国家(地区)的商标。

OpenCL 和 OpenCL 标识是 Apple Inc.的商标,经 Khronos 许可使用

* 文中涉及的其它名称及商标属于各自所有者资产。

版权所有 © 2021 英特尔公司。保留所有权利。

有关编译器优化的更完整信息,请参阅我们的优化说明

上一篇:关于中颖单片机PWM功能使用的一点经验2——PWM定时器配置


下一篇:16.15-S7-1200-开关量PWM的方式控制-固态继电器调节水温