2021极术通讯-大话DPU，从网络到数据

2023-12-28 18:42:22

首发极术社区。
如对Arm相关技术感兴趣，欢迎私信 aijishu20加入技术微信群。
导读：极术社区推出极术通讯，引入行业媒体和技术社区、咨询机构优质内容，定期分享产业技术趋势与市场应用热点。

芯方向

• 苹果公司提出Mobile-ViT | 更小、更轻、精度更高，MobileNets或成为历史！

MobileviT是一个用于移动设备的轻量级通用可视化Transformer，据作者介绍，这是第一次基于轻量级CNN网络性能的轻量级ViT工作，性能SOTA!。性能优于MobileNetV3、CrossviT等网络。（来源：极术社区嵌入式AI专栏）

• 在AWS Graviton 2处理器上使用Apache Kafka可优化高达30%的性能

本文对运行在基于64位Arm Neoverse的AWS Graviton2处理器上的自我管理Apache Kafka进行了性能基准测试。基于64位Arm Neoverse N1内核的AWS Graviton 2处理器是使用现代7nm技术构建的定制CPU。这些CPU是从头开始构建的，专门针对云本地工作负载进行设计和优化。与当前一代基于X86的实例相比，高效的基于Arm Neoverse的体系结构有助于AWS Graviton2为各种工作负载提供高达40%的性价比。（来源：极术社区Arm软件开发者专栏）

• GPU渲染/光线追踪测试：NVIDIA RTX A4000 vs. GeForce 3070

单纯从GPU渲染计算应用来看，GeForce RTX 3090单卡的性能没得说，性价比也较专业显卡更好。如果是多卡环境，特别是高密度部署，RTX A系列（即Quadro）就显现出优势了。从A4000的能耗比和16GB显存来看，可以说继承了4000系列“甜点卡”的称号。（来源：极术社区企业存储技术专栏）

• 高速的、标准化的存储接口NVMe

网络侧现在还没有形成标准的接口。Virtio-net因为软件虚拟化的流行所以标准，但其性能较差；AWS有自己的ENA/EFA接口，NVIDIA提供的是NV-SRIOV自定义接口，以及基于此封装的Virtio-net接口。在存储侧，业界形成了“伟大”的共识：NVMe标准接口，兼顾了标准化和高性能。与此同时，从Virtio-blk逐步切换到NVMe在业界得到了众多的认可。（来源：极术社区软硬件融合专栏）

芯观察

• 从Adaptive AUTOSAR的角度看SOA

身处汽车行业的我们深知，新技术的应用或者新概念的提出，一定是事出有因的。通常是为了抢夺新技术高地，让汽车更好地满足未来的需求。那么，汽车电子电气架构领域掀起的这股SOA热潮是由什么导致的？什么是SOA？SOA能带来什么好处？怎样实施SOA呢？Adaptive AUTOSAR与SOA是什么关系？（来源：极术社区汽车电子与软件专栏）

• 大话DPU—从网络到数据

DPU是承载RDMA的另一个载体。通过DPU把整个数据中心连接起来，实现高速率，低延迟的效果。核心目标就是像本地数据一样，访问分布式或者池化的资源。通过DPU实现数据资源池化。（来源：极术社区IC设计专栏）

• 苹果A15芯片评测：CPU和GPU提升惊人

与A14相比，全新A15将双性能核心集群的单核峰值频率提升了8%，相比上一代的2998MHz，新核心的频率现在达到了3240MHz。性能 CPU的 L2 增加到 12MB，SLC 增加到 32MB，在 GPU 方面，Apple的峰值性能改进超出了图表，新的更大的 GPU、新的架构和更大的系统缓存相结合，有助于提高性能和效率。（来源：极术社区半导体行业观察专栏）

相关阅读

码农公寓

芯方向

芯观察

相关文章