正则表达式巧妙实现字符串去重

今天上午看到新浪的一个面试题:

  • 将字符串 "adsfjjbkk"处理,就是连一起重复的字符删除,变成“adsfjbk”,写出实现代码。
当然了,实现思路有很多。但是如果你用正则实现出来的话,估计会给你加分不少。下面我实现如下:

对于去除简单的相邻重复的情况,我们可以用正则实现如下:


   
  1. <span style= "font-size:14px;"> var str = "adsfjjbkk";
  2. // \1匹配第一个子串
  3. // 只去除连续重复
  4. console.log(str.replace( /(.)(\1)+/g, function($1,$2,$3){
  5. return $ 2;
  6. })); // adsfjbk</span>

但是,如果现在需求变了,要求只保留重复字符串的第一次出现的串,如对于字符串"adaaasfjjjbkk"去重后需为:

"adsfjbk"

我们该如何实现呢?

注意到\1是匹配第一个子表达式(正则中第一个括号内的值),replace()方法中的回调函数的参数第一个为匹配的整个子串,而从第二个开始一次为匹配的第一个、第二个......子表达式匹配的值。只要稍微变更一下,就能得出结果。

代码实现如下:


   
  1. var str = "adaaasfjjjbkk";
  2. // 只保留第一次出现的重复串
  3. console.error(str.replace( /(.).*(\1)/g, function($1,$2,$3){
  4. // 第一个参数匹配整个匹配值,从第二个开始是匹配的子串
  5. $ 1 = $ 2+$ 1.substring( 1).replace( new RegExp($ 2, 'g'), '');
  6. return $ 1;
  7. }));

如果结合js里的hash来实现,其实也很简单。类似于统计一个数组里每个字符或字符串出现的次数一样,实现如下:


   
  1. var str = "adaaasfjjjbkk";
  2. var helper = {},
  3. res = '';
  4. for( var i= 0,sub;sub=str.charAt(i);i++){
  5. if(helper[sub]){
  6. helper[sub] = ++helper[sub];
  7. continue;
  8. }
  9. helper[sub] = 1;
  10. res += sub;
  11. }
  12. console.info(res);

但是始终你会感觉到,用正则实现就是爽!

上一篇:Java轻松实现,每天给对象发情话!


下一篇:​LeetCode刷题实战254:因子的组合