Chrome浏览器网页截全屏算法以及实现

2024-03-06 23:51:08

做个一个简单的批量下载插件叫“挖一下”，正如插件的名字一样，采集网页里面的所有图片，根据筛选条件过滤不需要的图片，最后下载选中的图片。

索性把网页也一起给截了，截屏分两种：

1.可见内容截屏

2.完整网页截屏（包括可见和不可见）

可见内容截屏：

实现原理：直接通过chrome自带的截屏方法(chrome.tabs.captureVisibleTab)，回调函数返回图片类型和数据信息

chrome.tabs.captureVisibleTab({format:'png'}, function(screenshotUrl) {

  // 保存screenshotUrl， image信息，默认使用png格式

});

完整网页截屏

实现原理：因为chrome本身没有提供类似的截全屏的接口,或者不知道；于是找了很多方法，最终使用的方法就是自动滚动网页，然后一屏一屏的截（还是chrome.tabs.captureVisibleTab），并将这些小的截屏数据保存到缓存，通过canvas来合并。步骤如下：

（1）根据当前网页的scrollWidth和scrollHeight以及可视区域的clientWidth和clientHeight来计算最后需要截屏几次, 将网页整个网页拆分成多个截屏数据块。截屏代码如下：

var scrollWidth = document.body.scrollWidth;

var scrollHeight = document.body.scrollHeight;

var visibleWidth = document.documentElement.clientWidth;

var visibleHeight = document.documentElement.clientHeight;

// 根据可视区域计算整个网页可以拆分成多少行多少列

var columns = Math.ceil(scrollWidth*1.0 / visibleWidth);

var rows = Math.ceil(scrollHeight*1.0 / visibleHeight); 

var canvas_data = {

  size: {full_width: scrollWidth, full_height: scrollHeight, page_width: visibleWidth, page_height:visibleHeight},

  table:{rows: rows, colums: columns},

  screenshots: []

};

// 最后一行行的循环滚动页面截屏

for(var r=0; r<rows; r++) {

  document.body.scrollHeight = r*visibleHeight;

  for(var c=0; c<columns; c++) {

    document.body.scrollLeft = c*visibleWidth;

    // 截屏并保存

    chrome.tabs.captureVisibleTab({format:'png'}, function(screenshotUrl) {

        canvas_data.screenshots.push({row: r, column: c, data_url: screenshotUrl});

    });

  }

}

（2）通过canvas合并图像。

截屏之后得到一个截屏数组，数组的每一个元素都带有一个行号和列号，代表这个图像是网页的第几行第几列的图小。

当前网页的scrollWidth和scrollHeight创建一个canvas，根据元素信息以及以及可视区域的clientWidth和clientHeight，将图片一张张画到canvas。

function merge_images(canvas_data, image_element) {

  // initialize canvas

  var canvas = document.createElement("canvas");

  canvas.width = canvas.size.full_width;

  canvas.height = canvas.size.full_height;

  draw_image(canvas, canvas_data, 0, image_element);

}

function draw_image(canvas, canvas_data, n, image_element) {

  var screenshots = canvas_data.screenshots;

  if(n >= screenshots.length ) {

    // draw completed

    image_element.src = canvas.toDataURL('image/png');

  } else {

    console.log('draw '+n+' image');

    var draw_context = canvas.getContext("2d");

    var s = screenshots[n];

    var row = s.row;

    var column = s.column;

    var x=0, y=0;

    if(row < canvas_data.table.rows-1) {

      y = row*canvas_data.size.page_height;

    } else { // last row

      y = canvas.height - canvas_data.size.page_height;

    }

    if(column < canvas_data.table.columns-1) {

      x = column*canvas_data.size.page_width;

    } else { // last column

      x = canvas.width - canvas_data.size.page_width;

    }

    console.log('x:' + x + ', y=' + y);

    var memory_image = new Image();

    memory_image.onload =  (function(ctx, m, l, t) {

      return function() {

        console.log('image load ok');

        ctx.drawImage(m,l,t);

        draw_image(canvas, canvas_data, ++n, image_element);

      }

    })(draw_context, memory_image, x, y);

    memory_image.src = s.data_url;

  }

}

当canvas画图结束后，用img元素显示图像，代码如下：

image_element.src = canvas.toDataURL('image/png');

到此ok了，折腾好几天了，

插件源码地址：http://git.oschina.net/iknown/wayixia-chrome-extension

码农公寓

相关文章