d如何及为什么探测器

探测器profiler给定输入,生成程序如何花费时间报告.记住:性能不仅由机器码主导.可告诉你如何使算法更快.可分析时间/内存/线程竞争.
程序慢时,要探测.诊断性能,理解程序.定期基测,不时探测,来检查程序.
如何取数据?
采样:中断过程,收集数据,循环…更快.
VTune提供检测和跟踪API.
或者,模拟,如Valgrind.
要测量并保存数据及位置,保存指针及环境,因此调用栈更好
采样调用栈要取指令指针(易),并可遍历调用栈(难).在X86上,省略帧指针可让编译器多用一个寄存器,但损失了调试性.尽量用调试符号分析.
dmd-gs,对GDC-fno-omit-frame-pointer,对ldc--frame-pointer=all.
druntime中的prologepilog,收集计时信息,然后退出程序时存储并打印.输出为trace.log.
-profile缺点,对IO 绑定工作负载,调用非根模块函数不好,配置文件中只能看到检测函数.采样调用图,而非调用栈.仅在函数级,对函数成本高.
dmd探测分配.对时间不是很好,但分配不错.
-profile=gc编译.分析堆不必与语言集成,但了解分配的确切类型有帮助.
1,用-profile=gc编译.2,运行.3,检查profilegc.log日志.
如何呢:
1,低开销,2,采样调用栈,3,分析源码(要求调试信息),4,来自硬件的完整信息,5,跨平台.
用perf.林操系统.
perf_event,测量时间+硬件和软件事件(如页错误),作为(分析器,优化器等)的基础
基本方法:perf record -g收集数据和样本调用栈,-e启用特定性能计数器.
perf report|perf annotate.
cpu提供工具,intelvTune工具,amd/uProf.
Perf的源注释工具功能强大且有用,但有点过时了.
Agner Fog处理器架构专著.
帧分析器,用于展示并发性和并行性.
Coz,分析多线程代码,计算给定行影响.
性能计数器,跟踪执行类型,停顿等统计信息

上一篇:几篇关于MySQL数据同步到Elasticsearch的文章---第一篇:Debezium实现Mysql到Elasticsearch高效实时同步


下一篇:MySQL 高可用:mysql+mycat实现数据库分片(分库分表)