我最近设计了一个完全兼容H.323/SIP的视频服务器(至少使用代码),该服务器完全装有基于套接字的API(.NET SDK将使用该套接字)和一个Web服务器,您知道…所有这些东西.无论如何,我选择将OPAL用于我的调用堆栈,并将我的体系结构大致基于EKIGA的设计.我什至用两个输出和三个输入劫持了数字I/O的串行端口.
我的Linux PC一切正常.我为带有Intel Atom处理器和2 GB RAM的新主板专门构建了自己的Linux distribution.问题? Atom处理器无法处理编码器的负载.我在NTSC上获得的最大帧速率约为7 FPS.无论比特率如何,它都会这样做.我知道我没有任何内存泄漏,但是两个内核之间的CPU负载上升到大约130%,因此总计大约66%.我真的不想更改堆栈,但是我不知道该怎么做.我可以将某些重量更轻的编码器转换为PWLIB插件吗?
无论视频编码器,H.261,theora,H.263+等如何,都会发生此问题.我的下一个攻击计划是什么?
更新:
好的,所以我认为下一步是找到一个低调的PCIe GPU,它与OpenGL兼容.它需要与主板平行放置.我怎样才能做到这一点?另外,我是不是在树上叫错了?我只是一个程序员,所以请原谅我的无知.
附加问题:
假设我得到了另一块带有GPU的板.如何确定编码是在GPU而不是CPU上完成的?这由操作系统和驱动程序管理吗?我需要编写特殊的代码吗?另外,在我看来,GPU的主要功能是渲染和输出,它是否还管理实际的转换和编码?推荐一本好书会很好.
更多信息:
我怀疑现在不是GPU问题.我认为这可能与时间空间权衡有关.我在超频的i7 950上安装了闪光灯,并遇到了同样的问题.我发现帧速率在运动时下降,但是如果没有运动,则可以保持较高的帧率.我还与OPAL VoIP的一位架构师进行了交谈,他们还怀疑GPU是问题所在.还有什么问题呢?
解决方法:
现在是进行微量纯化的时候了:是时候仔细观察内循环了.
您需要弄清楚哪些内部循环很重要,然后仔细查看如何获得最大的吞吐量.您还可以进行健全性检查:机器真的可以执行您想做的事情吗?例如.如果您需要进行n个多次/累加运算,并且您有n / 3个循环,则存在一个基本问题,您需要执行其他操作.