我想为我的网站生成一个图形站点地图.据我所知,有两个阶段:
>抓取网站并分析链接关系以提取树结构
>生成视觉上令人愉悦的树的渲染
有没有人有这方面的建议或经验,或者知道我可以构建的现有工作(理想情况下是Python)?
我遇到了一些用于渲染树的nice CSS,但它仅适用于3个级别.
谢谢
解决方法:
Here is a python web crawler,这应该是一个很好的起点.你的总体策略是这样的:
>您需要注意从不遵循出站链接,包括同一域上但高于起点的链接.
>当您使用蜘蛛时,该网站会收集映射到每个页面中包含的所有内部网址列表的页面网址的哈希值.
>对此列表进行传递,为每个唯一的URL分配一个令牌.
>使用{token =>的哈希值[tokens]}生成一个graphviz文件,为您布置图形
>将graphviz输出转换为imagemap,其中每个节点链接到其对应的网页
正如leonm所说,你需要做到这一切的原因是,网站是图形,而不是树木,而布局图形比使用简单的javascript和css更难. Graphviz擅长它的功能.