这个问题已经在这里有了答案: > inlining failed in call to always_inline ‘_mm_mullo_epi32’: target specific option mismatch 1个
我正在尝试从github编译this project,该代码在C中使用SIMD内部(SSE4.1)实现. github中的项目是作为Visual Studio解决方案给出的,但是我正尝试使用cmake将其移植到Qtcreator中.当我尝试编译它时,出现以下错误:
/usr/lib/gcc/x86_64-unknown-linux-gnu/5.3.0/include/smmintrin.h:520:1: error: inlining failed in call to always_inline '__m128i _mm_cvtepu8_epi32(__m128i)': target specific option mismatch
_mm_cvtepu8_epi32 (__m128i __X)
我确定这与SSE优化部分有关,但是由于我对这个主题并不那么熟悉,所以我真的不知道这意味着什么,以及如何解决这个问题,而且在搜索到的网络中,我无法真正做到这一点得到一些有用的东西.给出以下问题的代码如下:
static void cvt8u32f(const Mat& src, Mat& dest, const float amp)
{
const int imsize = src.size().area()/8;
const int nn = src.size().area()- imsize*8 ;
uchar* s = (uchar*)src.ptr(0);
float* d = dest.ptr<float>(0);
const __m128 mamp = _mm_set_ps1(amp);
const __m128i zero = _mm_setzero_si128();
for(int i=imsize;i--;)
{
__m128i s1 = _mm_loadl_epi64((__m128i*)s);
_mm_store_ps(d,_mm_mul_ps(mamp,_mm_cvtepi32_ps(_mm_cvtepu8_epi32(s1))));
_mm_store_ps(d+4,_mm_mul_ps(mamp,_mm_cvtepi32_ps(_mm_cvtepu8_epi32(_mm_srli_si128(s1,4)))));
s+=8;
d+=8;
}
for(int i=0;i<nn;i++)
{
*d = (float)*s * amp;
s++,d++;
}
}
有人可以解释我的问题是什么,我缺少什么.提前致谢.
解决方法:
在file.pro中添加:
QMAKE_CXXFLAGS = -msse3