数据分类处理

数据分类处理

描述
信息社会,有海量的数据需要分析处理,比如*局分析身份证号码、 QQ 用户、手机号码、银行帐号等信息及活动记录。

采集输入大数据和分类规则,通过大数据分类处理程序,将大数据分类输出。

请注意本题有多组输入用例。

数据范围:1<=R,I<=100 ,输入的整数大小满足 0<=val<=2^31-1;
输入描述:
一组输入整数序列I和一组规则整数序列R,I和R序列的第一个整数为序列的个数(个数不包含第一个整数);整数范围为0~(2^31)-1,序列个数不限

输出描述:
从R依次中取出R,对I进行处理,找到满足条件的I:

I整数对应的数字需要连续包含R对应的数字。比如R为23,I为231,那么I包含了R,条件满足 。

按R从小到大的顺序:

(1)先输出R

(2)再输出满足条件的I的个数;

(3)然后输出满足条件的I在I序列中的位置索引(从0开始);

(4)最后再输出I。

附加条件:

(1)R需要从小到大排序。相同的R只需要输出索引小的以及满足条件的I,索引大的需要过滤掉

(2)如果没有满足条件的I,对应的R不用输出

(3)最后需要在输出序列的第一个整数位置记录后续整数序列的个数(不包含“个数”本身)

序列I:15,123,456,786,453,46,7,5,3,665,453456,745,456,786,453,123(第一个15表明后续有15个整数)

序列R:5,6,3,6,3,0(第一个5表明后续有5个整数)

输出:30, 3,6,0,123,3,453,7,3,9,453456,13,453,14,123,6,7,1,456,2,786,4,46,8,665,9,453456,11,456,12,786

说明:

30----后续有30个整数

3----从小到大排序,第一个R为0,但没有满足条件的I,不输出0,而下一个R是3

6— 存在6个包含3的I

0— 123所在的原序号为0

123— 123包含3,满足条件

示例1
输入:

15 123 456 786 453 46 7 5 3 665 453456 745 456 786 453 123
5 6 3 6 3 0

输出:

30 3 6 0 123 3 453 7 3 9 453456 13 453 14 123 6 7 1 456 2 786 4 46 8 665 9 453456 11 456 12 786

运用正则表达式:

#include<iostream>
#include<vector>
#include<regex>
#include<string>
#include<algorithm>
using namespace std;

bool match(int model,int goal){
    string md=to_string(model);
    string gl=to_string(goal);
    regex pattern(".*"+gl+".*");
    return regex_match(md,pattern);
}

int main(){
    int n,m;
    while(cin>>n){
        vector<int>I;
        vector<int>R;
        for(int i=0;i<n;++i){
            int tmp;
            cin>>tmp;
            I.push_back(tmp);
        }
        cin>>m;
        for(int i=0;i<m;++i){
            int tmp;
            cin>>tmp;
            R.push_back(tmp);
        }
        sort(R.begin(), R.end());
        R.erase(unique(R.begin(), R.end()),R.end());
        vector<int> output1;
        vector<pair<int, int>> output2;
        for(int i=0;i<R.size();++i){
            int count=0;
            bool flag=true;
            for(int j=0;j<n;++j){
                if(match(I[j], R[i]) && flag){
                    output1.push_back(R[i]);
                    output2.push_back({j,I[j]});
                    count++;
                    flag=false;
                }
                else if(match(I[j], R[i])){
                    count++;
                    output2.push_back({j,I[j]});
                }
            }
            if(count!=0) output1.push_back(count);
        }
        int number=output1.size()+2*output2.size();
        cout<<number<<' ';
        int index=0;
        for(int i=0;i<output1.size();++i){
            cout<<output1[i]<<' '<<output1[++i]<<' ';
            for(int j=0;j<output1[i];++j){
                cout<<output2[index].first<<' '<<output2[index].second<<' ';
                index++;
            }
        }
        cout<<endl;
    }
    return 0;
}
上一篇:2021年秋招面试复盘|绿盟科技研发工程师123面汇总(已意向)


下一篇:XtraBackup恢复MySQL双主模式的数据同步