jQuery-1.9.1源码分析系列(二)jQuery选择器续1

在分析之前说一点题外话。

ownerDocument和 documentElement的区别

  ownerDocument是Node对象的一个属性,返回的是某个元素的根节点文档对象:即document对象;documentElement是Document对象的属性,返回的是文档根节点

  对于HTML文档来说,documentElement是<html>标签对应的Element对象,ownerDocument是document对象.

接下开始正题。

3.几个jQuery选择器源码中遇到的几个函数


a. 解析函数:jQuery.parseHTML/parseJSON/parseXML函数详解


jQuery.parseHTML( data[, context][, keepScripts] ):将字符串解析成DOM节点集合

  这个函数本身并不复杂。首先data必须是有意义字符串,然后参数纠正,因为后面两个参数都是可选的。

  if ( !data || typeof data !== "string" ) {
    return null;
  }   if ( typeof context === "boolean" ) {
    keepScripts = context;
    context = false;
  }

  然后根据data的格式分两种情况处理:

  第一种:data是单个纯标签的情况,比如“<p></p>”或“<input/>”或“<input >”,则创建标签后组装成数组返回即可

  //rsingleTag = /^<(\w+)\s*\/?>(?:<\/\1>|)$/
  var parsed = rsingleTag.exec( data );
  if ( parsed ) {
    return [ context.createElement( parsed[1] ) ];
  }

  第二种:其他情况,使用 jQuery.buildFragment创建DOM节点碎片(包裹data创建出来的DOM节点)组装成数组返回。需要注意keepScripts参数规定是否保留其中的script标签,默认为false。

  scripts = !keepScripts && [];  
  parsed = jQuery.buildFragment( [ data ], context, scripts );
  if ( scripts ) {
    jQuery( scripts ).remove();
  }
  return jQuery.merge( [], parsed.childNodes );

  里面用到了jQuery.buildFragment,这个才是parseHTML的核心。

创建文档片段核心函数jQuery.buildFragment( elems, context, scripts, selection )详解

  首先,创建安全的创建文档碎片节点

  safe = createSafeFragment( context );

  所谓的安全,指的实际上是IE低版本兼容问题。createSafeFragment函数的源码如下

  function createSafeFragment( document ) {
    var list = nodeNames.split( "|" ),
    safeFrag = document.createDocumentFragment(); // ie6,7,8浏览器把safeFrage作为HTMLDocument类型         // 在IE6-8中添加HTML5新标签中的一个hack,IE6-8不支持html5标签,标签会被解析错误,先创建自定义标签然后使用就不会出现浏览器解析错误
    if ( safeFrag.createElement ) {
  while ( list.length ) {
        safeFrag.createElement(list.pop());
      }
    }
    return safeFrag;
  }   var nodeNames = "abbr|article|aside|audio|bdi|canvas|data|datalist|details|figcaption|figure|footer|"
    + "header|hgroup|mark|meter|nav|output|progress|section|summary|time|video";

  可以看出如果浏览器支持safeFrag.createElement的情况下(ie低版本),是不支持nodeNames中的标签的,需要使用createElement来一个个创建,具体有神马作用,请点击IE兼容性问题汇总【持续更新中】中查看IE8-不支持自定义标签

  至于动态创建html节点的方法document.createDocumentFragment,还有其他相关方法,有兴趣的童鞋可以查一下资料:

  · crateAttribute(name):        用指定名称name创建特性节点

  · createComment(text):       创建带文本text的注释节点

  · createDocumentFragment():    创建文档碎片节点

  · createElement(tagname):       创建标签名为tagname的节点

  · createTextNode(text):         创建包含文本text的文本节点

  然后:收集节点元素

  遍历elems参数,对每一个元素elem生成的节点压入节点缓存nodes中。

  对每一个elem 的处理分三种情况:

  1)jQuery.type( elem ) === "object" //直接添加节点

    jQuery.merge( nodes, elem.nodeType ? [ elem ] : elem );

  2)!rhtml.test( elem )//非”<…”或”&…;”这类html元素直接当文本节点处理

              nodes.push( context.createTextNode( elem ) );

  3)字符串html ;这种情况使用innerHTML将elem添加到文档碎片节点safe下的DIV标签中,然后使用DIV.childNodes把所有子节点压入节点缓存nodes即可。原理是简单,但是。。。兼容是个大问题。这里面有几个兼容问题需要解决

  在低版本IE下,某些标签必须要包含在一些标签内,比如”<thead>”标签必须要在”<table>”内。

  jQuery特意把所有这类情况保存在wrapMap中,wrapMap为(嵌套层数,起始标签,终止标签)wrapMap = {

    option: [ 1, "<select multiple='multiple'>", "</select>" ],

    legend: [ 1, "<fieldset>", "</fieldset>" ],

    area: [ 1, "<map>", "</map>" ],

    param: [ 1, "<object>", "</object>" ],

    thead: [ 1, "<table>", "</table>" ],

    tr: [ 2, "<table><tbody>", "</tbody></table>" ],

    col: [ 2, "<table><tbody></tbody><colgroup>", "</colgroup></table>" ],

    td: [ 3, "<table><tbody><tr>", "</tr></tbody></table>" ],

    // IE6-8 不能正常加载 link, script, style, or any html5 (NoScope) 标签,除非把他包含在一个非中断字符后面的div中.

    _default: jQuery.support.htmlSerialize ? [ 0, "", "" ] : [ 1, "X<div>", "</div>"  ]

}

  拿到elem先判断第一个标签名称,如果能在wrapMap中找到对应的属性,则用wrapMap中的外标签包裹起来,比如elem="<thead><tr></tr></thead>"处理后变成lem="<table><thead><tr></tr></thead></table>"。处理源码如下

  tmp = tmp || safe.appendChild( context.createElement("div") );
// rtagName :/<([\w:]+)/;获取标签名
tag = ( rtagName.exec( elem ) || ["", ""] )[1].toLowerCase();
wrap = wrapMap[ tag ] || wrapMap._default;   // rxhtmlTag: /<(?!area|br|col|embed|hr|img|input|link|meta|param)(([\w:]+)[^>]*)\/>/gi。
  //对非单个可闭合如“div”这样的标签误用为“<div#F/>”这样的闭合方式改成“<div#F></div>”
  tmp.innerHTML = wrap[1] + elem.replace( rxhtmlTag, "<$1></$2>" ) + wrap[2];  

  这样创建文档碎片是可以了,但是我们要把elem对应的文档取出来的时候不能包括我们添加上的外包装。这部分处理我们结合源码看一下

  //将tmp定位到真正的elem内容部分的父节点,到时候直接使用tmp.childNodes即可

  j = wrap[0];
  while ( j-- ) {
    tmp = tmp.lastChild;
  }   //rleadingWhitespace = /^\s+/
  //IE会将文本中的开始空格给删掉,比如$(" <span></span>")在IE上表现和$("<span></span>")一样,span前面的三个空格被干掉了。要把它找回来
  if ( !jQuery.support.leadingWhitespace && rleadingWhitespace.test( elem ) ) {
    nodes.push( context.createTextNode( rleadingWhitespace.exec( elem )[0] ) );
  }   // IE在创建table碎片时会自动添加<tbody>标签
  if ( !jQuery.support.tbody ) {     //rtbody = /<tbody/i;设置elem为<table...</table>,用来在后面去掉tbody
    //elem最外层标签是<table>, 并且<tbody>是IE自己添加上去的
    elem = tag === "table" && !rtbody.test( elem ) ?
    tmp.firstChild :
    //elem是裸的<thead>或<tfoot>,会自动添加<table>和<tbody>
    wrap[1] === "<table>" && !rtbody.test( elem ) ?
    tmp :
    0;
    //去掉<tbody>
    j = elem && elem.childNodes.length;
    while ( j-- ) {
      if ( jQuery.nodeName( (tbody = elem.childNodes[j]), "tbody" ) && !tbody.childNodes.length ) {
        elem.removeChild( tbody );
      }
    }
  }   jQuery.merge( nodes, tmp.childNodes );//收集节点   //循环使用的数据恢复初始值,以备后用
  tmp.textContent = "";   // Fix #12392 for oldIE
  while ( tmp.firstChild ) {
    tmp.removeChild( tmp.firstChild );
  }   tmp = safe.lastChild;

  OK,到此,搜集节点元素完成。不要忘了最后需要将文档碎片节点添加的DIV标签删掉。

  最后:构建碎片文档

  遍历每一个元素节点放入碎片文档中,safe.appendChild( elem )

  while ( (elem = nodes[ i++ ]) ) {
    // #4087 -如果起点和终点的元素是相同的,而且这是该元素,什么也不做;在DOM选取操作中用到
    if ( selection && jQuery.inArray( elem, selection ) !== -1 ) {
      continue;
    }     contains = jQuery.contains( elem.ownerDocument, elem );     //添加节点到文档碎片中,并搜集script标签
    tmp = getAll( safe.appendChild( elem ), "script" );     //保存脚本执行记录
    if ( contains ) {
      setGlobalEval( tmp );
    }     //捕获脚本,将脚本都保存到scripts中
    if ( scripts ) {
      j = 0;
      while ( (elem = tmp[ j++ ]) ) {
        //rscriptType = /^$|\/(?:java|ecma)script/i
        if ( rscriptType.test( elem.type || "" ) ) {
          scripts.push( elem );
        }
      }
    }
  }   return safe;//返回

jQuery.parseJSON( data ):将格式完好的JSON字符串转为与之对应的JavaScript对象

  所谓"格式完好",就是要求指定的字符串必须符合严格的JSON格式,例如:属性名称必须加双引号、字符串值也必须用双引号。如果传入一个格式不"完好"的JSON字符串将抛出一个JS异常。

  功能比较点单如果能使用window.JSON.parse来解析则直接使用。

  if ( window.JSON && window.JSON.parse ) { return window.JSON.parse( data ); }

  否则使用( new Function( "return " + data ) )()来解析

   return ( new Function( "return " + data ) )();

  完整源码如下:

  parseJSON: function( data ) {
    if ( window.JSON && window.JSON.parse ) { return window.JSON.parse( data ); }// 尝试使用浏览器的JSON.parse来解析
    if ( data === null ) { return data; }     if ( typeof data === "string" ) {
  data = jQuery.trim( data );//去掉头尾空格(IE不能处理他)
      if ( data ) {
        // 确保data是严格的JSON格式,从http://json.org/json2.js借逻辑
        //rvalidchars = /^[\],:{}\s]*$/,
        //rvalidbraces = /(?:^|:|,)(?:\s*\[)+/g,
        //rvalidescape = /\\(?:["\\\/bfnrt]|u[\da-fA-F]{4})/g,
        //rvalidtokens = /"[^"\\\r\n]*"|true|false|null|-?(?:\d+\.|)\d+(?:[eE][+-]?\d+|)/g,
if ( rvalidchars.test( data.replace( rvalidescape, "@" ).replace( rvalidtokens, "]" ).replace( rvalidbraces, "")) ) {
          return ( new Function( "return " + data ) )();
        }
      }
    }
    jQuery.error( "Invalid JSON: " + data );
  }

jQuery.parseXML( data ):将字符串解析为对应的XML文档

  该函数将使用浏览器内置的解析函数来创建一个有效的XML文档,该文档可以传入jQuery()函数来创建一个典型的jQuery对象,从而对其进行遍历或其他操作.

  这个比较简单,偷懒直接附上源码:

  parseXML: function( data ) {
    var xml, tmp;
    if ( !data || typeof data !== "string" ) {
      return null;
    }
    try {
      if ( window.DOMParser ) { // Standard
        tmp = new DOMParser();
        xml = tmp.parseFromString( data , "text/xml" );
      } else { // IE
        xml = new ActiveXObject( "Microsoft.XMLDOM" );
        xml.async = "false";
        xml.loadXML( data );
      }
    } catch( e ) {
      xml = undefined;
    }
    if ( !xml || !xml.documentElement || xml.getElementsByTagName( "parsererror" ).length ) {
      jQuery.error( "Invalid XML: " + data );
    }
    return xml;
  }

function getAll( context, tag )

  这是一个jQuery内部使用的函数,非常有用。他获取context中(自身以及后代节点)标签名为tag的节点集合。

  他使用context.getElementsByTagName或context.querySelectorAll来获取,当实在是没有获取到值的时候通过context.childNodes来获取conten的儿子节点中标签为tag的节点。

function getAll( context, tag ) {
var elems, elem,
i = 0,
// context为dom节点时直接获取
    found = typeof context.getElementsByTagName !== core_strundefined ? context.getElementsByTagName( tag || "*" ) :
    typeof context.querySelectorAll !== core_strundefined ? context.querySelectorAll( tag || "*" ) :
undefined; // context不为dom节点,为dom节点数组时,循环获取数组元素的每个子tag
if ( !found ) {
    for ( found = [], elems = context.childNodes || context; (elem = elems[i]) != null; i++ ) {
if ( !tag || jQuery.nodeName( elem, tag ) ) {
found.push( elem );
} else {
jQuery.merge( found, getAll( elem, tag ) );
}
}
} //如果传入节点context的节点名和tag相同,需要包含本身
return tag === undefined || tag && jQuery.nodeName( context, tag ) ?
jQuery.merge( [ context ], found ) :
found;
}

jQuery.grep( elems, callback, inv )函数详解

  函数目的是过滤出用户指定的数据。一般来说第三个参数不传或传为false,callback是一个过滤器,过滤成功返回true,过滤失败返回false。最终grep函数将callback返回成功的素有elem元素返回。这个函数无论是在jQuery内部,或者我们自己使用都很有作用

grep: function( elems, callback, inv ) {
var retVal,
ret = [],
i = 0,
length = elems.length;
inv = !!inv; // Go through the array, only saving the items
// that pass the validator function
for ( ; i < length; i++ ) {
retVal = !!callback( elems[ i ], i );
if ( inv !== retVal ) {
ret.push( elems[ i ] );
}
}
return ret;
},

  如果觉得本文不错,请点击右下方【推荐】!

上一篇:Java并发编程--线程池


下一篇:HTML5中类jQuery选择器querySelector的高级使用 document.querySelectorAll.bind(document);