首发极术社区。
如对Arm相关技术感兴趣,欢迎私信 aijishu20加入技术微信群。
导读:极术社区推出极术通讯,引入行业媒体和技术社区、咨询机构优质内容,定期分享产业技术趋势与市场应用热点。
芯方向
• 苹果公司提出Mobile-ViT | 更小、更轻、精度更高,MobileNets或成为历史!
MobileviT是一个用于移动设备的轻量级通用可视化Transformer,据作者介绍,这是第一次基于轻量级CNN网络性能的轻量级ViT工作,性能SOTA!。性能优于MobileNetV3、CrossviT等网络。(来源:极术社区嵌入式AI专栏)
• 在AWS Graviton 2处理器上使用Apache Kafka可优化高达30%的性能
本文对运行在基于64位Arm Neoverse的AWS Graviton2处理器上的自我管理Apache Kafka进行了性能基准测试。基于64位Arm Neoverse N1内核的AWS Graviton 2处理器是使用现代7nm技术构建的定制CPU。这些CPU是从头开始构建的,专门针对云本地工作负载进行设计和优化。与当前一代基于X86的实例相比,高效的基于Arm Neoverse的体系结构有助于AWS Graviton2为各种工作负载提供高达40%的性价比。(来源:极术社区Arm软件开发者专栏)
• GPU渲染/光线追踪测试:NVIDIA RTX A4000 vs. GeForce 3070
单纯从GPU渲染计算应用来看,GeForce RTX 3090单卡的性能没得说,性价比也较专业显卡更好。如果是多卡环境,特别是高密度部署,RTX A系列(即Quadro)就显现出优势了。从A4000的能耗比和16GB显存来看,可以说继承了4000系列“甜点卡”的称号。(来源:极术社区企业存储技术专栏)
网络侧现在还没有形成标准的接口。Virtio-net因为软件虚拟化的流行所以标准,但其性能较差;AWS有自己的ENA/EFA接口,NVIDIA提供的是NV-SRIOV自定义接口,以及基于此封装的Virtio-net接口。在存储侧,业界形成了“伟大”的共识:NVMe标准接口,兼顾了标准化和高性能。与此同时,从Virtio-blk逐步切换到NVMe在业界得到了众多的认可。(来源:极术社区软硬件融合专栏)
芯观察
身处汽车行业的我们深知,新技术的应用或者新概念的提出,一定是事出有因的。通常是为了抢夺新技术高地,让汽车更好地满足未来的需求。那么,汽车电子电气架构领域掀起的这股SOA热潮是由什么导致的?什么是SOA?SOA能带来什么好处?怎样实施SOA呢?Adaptive AUTOSAR与SOA是什么关系?(来源:极术社区汽车电子与软件专栏)
DPU是承载RDMA的另一个载体。通过DPU把整个数据中心连接起来,实现高速率,低延迟的效果。核心目标就是像本地数据一样,访问分布式或者池化的资源。通过DPU实现数据资源池化。(来源:极术社区IC设计专栏)
与A14相比,全新A15将双性能核心集群的单核峰值频率提升了8%,相比上一代的2998MHz,新核心的频率现在达到了3240MHz。性能 CPU的 L2 增加到 12MB,SLC 增加到 32MB,在 GPU 方面,Apple的峰值性能改进超出了图表,新的更大的 GPU、新的架构和更大的系统缓存相结合,有助于提高性能和效率。(来源:极术社区半导体行业观察专栏)
相关阅读