//In other words, this equilavent to cv::Mat1f mat(5,n)
//i.e. a matrix 5xn
std::vector<cv::Mat1f> mat(5,cv::Mat1f::zeros(1,n));
std::vector<float> indexes(m);
// fill indexes
// m >> nThreads (from hundreds to thousands)
for(size_t i=0; i<m; i++){
mat[indexes[m]] += 1;
}
预期结果是将每行的每个元素增加一个.这是一个玩具示例,实际总和要复杂得多.我试图将其与:
#pragma omp declare reduction(vec_float_plus : std::vector<cv::Mat1f> : \
std::transform(omp_out.begin(), omp_out.end(), omp_in.begin(), omp_out.begin(), std::plus<cv::Mat1f>())) \
initializer(omp_priv=omp_orig);
#pragma omp parallel for reduction(vec_float_plus : mat)
for(size_t i=0; i<m; i++){
mat[indexes[m]] += 1;
}
但这失败了,因为每行的每个元素都是随机初始化的.我该如何解决?
所以我发现问题出在this上.所以我应该用以下命令初始化mat:
std::vector<cv::Mat1f> mat(5);
for(size_t i=0; i<mat.size(); i++)
mat[i] = cv::Mat1f::zeros(1,n);
但这会导致omp_priv = omp_orig出现问题,因为它将考虑std :: vector< cv :: Mat1f>垫(5);它的值是不确定的.我该如何解决?我想到的唯一解决方案是创建一个包装器结构,例如:
class vectMat{
public:
vectMat(size_t rows, size_t j){
for(size_t i=0; i<rows; i++)
mats.push_back(cv::Mat1f::zeros(1,j));
}
private:
std::vector<cv::Mat1f> mats;
};
但是,我应该实现什么才能使其与其余代码一起工作?
解决方法:
在这种情况下,使用引用而不是复制的cv :: Mat1f这样的类型确实很危险.您可以通过拆分并行区域和for循环来做出明确的显式解决方案.
#pragma omp declare reduction(vec_mat1f_plus : std::vector<cv::Mat1f> : \
std::transform(omp_out.begin(), omp_out.end(), omp_in.begin(), omp_out.begin(), std::plus<cv::Mat1f>()));
// initializer not necessary if you initialize explicitly
std::vector<cv::Mat1f> mat;
#pragma omp parallel reduction(vec_mat1f_plus : mat)
{
mat = std::vector<cv::Mat1f>(5);
for (auto& elem : mat) {
elem = cv:Mat1f::zeros(1, n);
}
#pragma omp for
for(size_t i=0; i<m; i++){
mat[indexes[m]] += 1;
}
}
我尚未测试std :: plus< cv :: Mat1f>可以,但是looks good.
如果您提供了一个运算符=,该运算符将使用clone()深度复制底层Mat,并保留初始化程序,则使用vectMat的方法也将起作用.