web打印动态分页、预览。内容满了,自动换页、移动端兼容 生成PDF bookjs-eazy

WEB打印,HTML转PDF工具。bookjs-eazy
  • 仓库地址: GITEE | GITHUB
  • 主要解决,HTML生成PDF,分页可控的问题
  • 优势:
  1. 只需专注用H5构件你的PDF内容,而无需关心分页及内容截断问题
  2. 支持预览、WEB打印、页码/目录、自定义页眉页脚。
  3. 前后端皆可生成PDF,前端打印另存为PDF,后端可配套使用chrome headless和wkhtmltopdf命令行PDF生成工具。
  4. docker镜像。可快速构件你的在线PDF的打印生成服务
  5. 兼容主流浏览器及移动端

预览案例(./dist)

web打印动态分页、预览。内容满了,自动换页、移动端兼容 生成PDF bookjs-eazy

web打印动态分页、预览。内容满了,自动换页、移动端兼容 生成PDF bookjs-eazy

使用方式:

渲染机制:
程序会检查全局变量window.bookConfig.start 的值。
直到此值为true时,才开始渲染将 #content-box 节点的内容渲染为PDF样式。
重要:如果你的页面是动态的,就先将默认值设为false,当内容准备好后,在将其设为true,

配置页面参数:

  • 定义一个全局配置变量 bookConfig
<script>
bookConfig = {

    /**  全部纸张类型,未全量测试,常用ISO_A4
    ISO_A0、ISO_A1、ISO_A2、ISO_A3、ISO_A4、ISO_A5
    ISO_B0、ISO_B1、ISO_B2、ISO_B3、ISO_B4、ISO_B5、ISO_B6、ISO_B7、ISO_B8、ISO_B9、ISO_B10
    ISO_C0、ISO_C1、ISO_C2、ISO_C3、ISO_C4、ISO_C5、ISO_C6、ISO_C7、ISO_DL、ISO_C7_6
    JIS_B0、JIS_B1、JIS_B2、JIS_B3、JIS_B4、JIS_B5、JIS_B6、JIS_B7、JIS_B8、JIS_B9
    NA_LEGAL、NA_LETTER、NA_LEDGER、NA_EXECUTIVE、NA_INVOICE、
    BIG_K32
    **/
    // 定义纸张大小,两种方式,可选,默认:ISO_A4
    pageSize : ‘ISO_A4‘, 
    orientation :  ‘landscape‘, // portrait/landscape 定义纸张是竖屏/横屏放置
    /** pageSizeConfig 和 pageSize/orientation组合 ,只选一即可 **/
    pageSizeOption : {
        width : ‘15cm‘, // 自定义宽高
        height : ‘20cm‘,
    }

    // 可选,边距,所列选项为默认值
    padding : "31.8mm 25.4mm 31.8mm 25.4mm", 

    // 简易页码插件,可选(默认未开启),所列选项为开启时的默认值
    simplePageNum : {
        // 从第几页开始编号,默认0为第一页开始,,没有页码,也可以为一个css选择器如:".first_page",从包含选择器接点的页面开始编号
        pageBegin : 0, 
        // 从第几页结束编号,默认-1为最后一页结束,,没有页码,也可以为一个css选择器如:".end_page",到包含选择器接点的页面结束编号
        pageEnd : -1,
        // 页面部件, 可选
        pendant : ‘<div class="page-num-simple"><span style="">${PAGE} / ${TOTAL_PAGE}</span></div>‘,
    }, 

    // 目录插件,可选(默认未开启),所列选项为开启时的默认值
    simpleCatalog : {
        header : ‘<div class="catalog-title">目 录</div>‘, // 可选,目录页Header部分,放入你想加入的一切
        titlesSelector : ‘h1,h2,h3,h4,h5,h6‘, // 可选,作为目录标题的选择器,按目录级别依次
        itemFillChar : ‘…‘, // 可选,目录项填充字符, ""空字符串,不填充,使用自定义makeItem时,忽略该选项配置
        positionSelector : ‘.nop-page-item-pagenum-1‘, //可选,目录位置会插入在匹配页的之前,默认为第一个编号页前
        // 可选,自定义目录项。
        makeItem : function(itemEl,itemInfo) {
           /** 
            * @var itemEl jQuery Element 
            * @var object itemInfo PS: {title, pageNum, level,linkId}
            **/
            return ‘<div>自定义的目录项html内容,根据itemInfo自己构造</div>‘;
        }
    },

    // 工具栏插件,可选(默认开启),所列选项为开启时的默认值
    toolBar : {
        // Web打印按钮功能可选,默认true
        webPrint : true, 

        /**
         * HTML保存按钮,可选,bool|object,默认false:禁用保存HTML功能,true:启用并使用默认选项
         * saveHtml : {
         *     // 可选,保存的文件名,默认值: document.title + ‘.html‘
         *     fileName : ‘output.html‘,
         *     // 可选,自定义下载保存。可用于混合APP内下载时用
         *     save : function(getStaticHtmlPromiseFunc,fileName){
         *         getStaticHtmlPromiseFunc().then(function(htmlBlob){
         *             ...
         *         })
         *     }
         * }
         */
        saveHtml : false, 

        /**
         * 服务端打印下载按钮
         * 可选,bool|object,默认false:不启用,true:启用并使用默认选项,object:使用自定义的服务端打印
         * true等效的object的配置:serverPrint : { serverUrl : ‘/‘ }, 
         * 官网可用serverUrl : ‘//bookjs.zhouwuxue.com/‘
         * 要使用serverPrint,必须server能访问到你的网页。网页不要使用登录状态授权,建议通过URL参数传递临时授权
         * 如果使用官方的server进行打印,则需公网上可正确访问你用bookjs-eazy构造的网页
         * 
         * serverPrint : {
         *     // 可选,打印服务器地址
         *     serverPrint : ‘/‘,
         *     // 可选,保存的文件名,默认值 document.title + ‘.pdf‘
         *     fileName : ‘output.pdf‘,
         *     // 可选,打印附属参数
         *     params : {
         *         // 打印超时时间
         *         timeout : 30000,
         *         // 页面渲染完成后,打印前延时
         *         delay : 1000,
         *     }, 
         *     // 可选,自定义下载。可用于混合APP内下载时用
         *     save : function(pdfUrl, serverPrintOption){
         *         
         *     }
         * }
         */
        serverPrint : false,

        buttons : [
            // 这里可以自定义工具栏按钮
            // {
            //    id : ‘cloudPrint‘,
            //    icon : ‘https://xxxx.../aa.png‘
            //    onClick : function(){ console.log("...do some thing"); }
            // }
        ]
    }

    // 重要
    // 当这个值为true时,页面才开始渲染。如果你的页面是动态的,
    // 就先将默认值设为false,当下节所述中的#content-box节点内容准备好后,在将其设为true,
    // bookConfig.start = true;
    start : true,
}
</script>

PDF内容设计

  • 定义一个id为content-box节点内放入要插入到文档里的内容;
  • content-box下的每个节点都需定义属性 data-op-type,表示其在文档中的插入方式 其值含义如下:
block : 块:(默认)如果当前页空间充足则整体插入,空间不足,则会整体插入到下一页
    注意:这里的块,仅是内容不跨页。与css中的display无关,也就可以display: inline样式。
    前面有用户问到这个问题。从而限制了他对PDF内容设计的思维。

block-box : 块盒子:块盒子内部nop-fill-box标记的节点包含的多个块,盒子内的多个块被分割到多个页面时,都会复制包裹块的外部节点。
    以下一个示例中的表格为例:
    table节点定义为块盒子
    tbody节点定义为容纳块的容器节点(使用class: nop-fill-box标记)
    这样在填充行tr时,当前页空间不足时,换页并复制外部table(除去nop-fill-box标记的部分)继续填充。这样表头就得到复用

text : 文本,跨页内容自动分割,节点内直接放入文本内容。
text-box : 文本盒子:与块盒子类似,大文本内容跨多个页面时,会复制外部包裹文本的盒子的部分。
     文本盒子节点, 大文本的容器节点需用 class : nop-fill-box标记

mix-box : 混合盒子:与块盒子类似超出页面自动分页,(容器使用class: nop-fill-box标记),并复制容器外层,盒子内部放置的所有节点必须标记data-op-type属性,属性值: text或block 
     text:允许跨页截断
     block:(默认)不可跨页截断

new-page : 标记从新页,开始插入

pendants : 页面部件列表(页眉/页脚/页标签/水印背景等,相对页面纸张固定的元素),在其定义后的每个页面都会显示,直到下一个pendants出现。
  • 使用样例
<div id="content-box" style="display: none">
    <div data-op-type="pendants"><!-- 定义页面部件(页眉/页脚/页标签/水印背景等) -->
        <div class=‘pendant-title‘>第一章:块盒子</div>
    </div>
    <h1 data-op-type=‘block‘>第1章 块盒子</h1><!-- 块 -->
    <table data-op-type="block-box" class="simple-table" border="1"><!-- 块盒子 -->
        <thead>
            <tr><th>ID</th><th>姓名</th><th>年龄</th></tr>
        </thead>
        <tbody class="nop-fill-box"><!-- 子块列表,程序会自动差分 -->
            <tr><td>1</td><td>张三</td><td>12</td></tr>
            ...
        </tbody>
        <tfoot>
            <tr><td colspan="3">表格尾部</td></tr>
        </tfoot>
    </table>
    <div data-op-type="new-page"></div><!-- 新页面标记,强制从新页开始 -->
    <div data-op-type="pendants"><!-- 定义页面部件(页眉/页脚/书签/水印背景等) -->
        <div class=‘pendant-title‘>第二章:文本盒子</div>
    </div>
    <h1  data-op-type=‘block‘>第2章 文本盒子</h1><!-- 块 -->
    <p data-op-type="text-box"><!-- 文本盒子 -->
        <span class="nop-fill-box">1234566....(很长的文字)</span><!-- 大文本,程序会自动差分 -->
    </p>
    <div data-op-type="new-page"></div><!-- 新页面标记,强制从新页开始 -->
    <div data-op-type="pendants"><!-- 定义页面部件(页眉/页脚/书签/水印背景等) -->
        <div class=‘pendant-title‘>第三章:混合盒子</div>
    </div>
    <h1  data-op-type=‘block‘>第3章 混合盒子</h1><!-- 块 -->
    <div data-op-type="mix-box"><!-- 混合盒子 -->
        <div class="nop-fill-box" style=‘font-size: 14px;line-height: 1.5;color: white‘><!-- 文本或块列表,程序会自动差分 -->
            <div data-op-type=‘block‘ style=‘background-color: red;height: 300px;‘>red</div>
            <div data-op-type=‘block‘ style=‘background-color: green;height: 300px;‘>green</div>
            <div data-op-type=‘block‘ style=‘background-color: blue;height: 300px;‘>blue</div>
            <span data-op-type=‘text‘ style=‘color: red‘>ABCDEFGHIJKLMNOPQRSTUVWXYZ...</span>
        </div>
    </div>
</div>

设计中的相关细节

奇偶页实现

  • 在设置简易页面后,页面节点上会添加对应的class: nop-page-item-odd (奇数页)、 nop-page-item-even(偶数页) nop-page-item-pagenum-1(页编号)

文本、盒子被分割到不同页后,被差分部分特殊样式处理

  • 同一段落文本,被分到下一页的文本部分节点,会被class: nop-link-last 进行标记。可以根据此class,进行缩进特殊处理

  • text-box 、block-box、mix-box 内容被分割部分也同样会被class: nop-link-last 标记

浏览器类型标记

  • Book节点。上会标记浏览器类型。class: chrome、firefox、safari、ie、qq、wechat、wkhtmltopdf

打印和预览时样式差异处理

  • Book节点。在不同模式下,会使用class: nop-book-preview(预览)、nop-book-print(打印) 进行标记

生成PDF及配套PDF生成命令行工具的使用

  • 可以通过浏览器点击打印按钮,打印另存为PDF
  • (推荐) 也可以直接使用打开toolBar.serverPrint = true,使用官网docker镜像自建打印服务,进行生成下载PDF。
  • 此插件适配了wkhtmltopdf和chrome headless。可使用本项目中配套封装的命令行工具,从后端生成精美PDF

使用官网docker镜像,自建打印服务

  • 可使用 ./docker-start.sh 进行部署
    # 自己docker打印服务的命令
    # ./docker-start.sh [WEB_PORT=3000] [WEB_PATH=dist]

    # 运行打印服务
    # 会以dist为根目录,创建一个web站点。
    # 生成的pdf会存在./pdf/ 目录下。你的bookjs-eazy编写的页面也可以直接放在根目录下。

    # 在根目录下用bookjs-eazy创建book.html的文件。
    # bookConfig.toolBar.serverPrint 可以配置为 :true 或 {serverUrl : ‘//your_host_name[:WEB_PORT]/‘}
    # http://your_host_name[:WEB_PORT]/book.html访问即可预览/打印下载

详细内容见,<a href="https://gitee.com/wuxue107/screenshot-api-server" target="_blank">wuxue107/screenshot-api-server</a>项目

使用官网打印服务

前提是。您用bookjs-eazy创建的页面可外网访问。
如果使用官网打印服务,页面需要不授权访问,或者 使用短期授权码机制(建议),携带在url上。只有在有授权码在一定时间段内才有访问您用

    参考bookConfig.toolBar.serverPrint选项,工具栏会多出下载按钮
    配置值: { serverUrl: ‘//bookjs.zhouwuxue.com/‘ }

命令行打印,使用chrome headless方式渲染

    # 首次使用时,安装bin/html2pdf的依赖包
    yarn install
    # 安装过后,执行命令
    # 示例:
    bin/html2pdf print --output eazy-2-1.pdf "https://bookjs.zhouwuxue.com/eazy-2.html"

    #
    # 命令行说明:
    #   Usage: html2pdf print [options] <url>
    #   
    #   Options:
    #     -o --output [outputfile]     保存PDF文件的路径 (default: "output.pdf")
    #     -t --timeout [type]          超时时间 (default: 60000)
    #     -a --agent [agent]           指定转换引擎chrome-headless|puppeteer,默认:puppeteer (default: "puppeteer")
    #     -d --printDelay [delay]      打印前等待延迟(毫秒) (default: 1000)
    #     -c --checkJs [jsExpression]  检查是否渲染完成的js表达式 (default: "window.status === ‘PDFComplete‘")
    #                                  "window.document.readyState === ‘complete‘" 这个表达式可以用作非bookjs-eazy构建的网页
    #     -h, --help                   display help for command
    #
    #

命令行打印,使用wkhtmltopdf渲染(会更据h1-h6生成PDF书签),需自己去下载命令行,放入PATH的环境变量所在目录下


    bin/pdf-a4-landscape "https://bookjs.zhouwuxue.com/eazy-2.html" eazy-2-2.pdf
    #
    # 在bin目录下,有数个同类脚本文件。
    # 
    # bin/pdf-[纸张]-[纸张方向]  [预览的链接] [输出文件]
    #
    # 注意:如果使用wkhtmltopdf方式的自定义尺寸,不用担心,浏览器渲染完毕后,在Console上会输出wkhtmltopdf的PDF配套生成命令

生成常见问题

  • 生成的PDF里全是框框,原因在于。在linux服务器环境下,通常没有安装所需字体。
  • 执行bin/pdf-xx-xx 相关命令,找不到wkhtmltopdf,需自己去下载wkhtmltopdf放置PATH目录下
  • bin/html2pdf --agent=chrome-headless参数启动时,报错。该agent使用的是本地已存在的chrome headless remote-debug服务
:: 启动一个本地chrome headless
"chrome.exe" --headless --disable-gpu --remote-debugging-port=9222 --disable-extensions --mute-audio
:: 然后再使用 --agent=chrome-headless 则会成功。
:: 默认的 --agent=puppeteer 则不需,以上操作,会启动自带的浏览器。

web打印动态分页、预览。内容满了,自动换页、移动端兼容 生成PDF bookjs-eazy

上一篇:“xxx.app”已损坏,无法打开,你应该将它移到废纸篓 最详细最全的解决办法 for Mac


下一篇:RequestMapping与GetMapping、PutMapping等注解的区别