基数树RadixTree的golang实现

基数树是一种压缩前缀树:当一个节点没有兄弟节点时,将它与父节点合并,以解决前缀树中经常出现的分支退化为链表的问题。

不过,狭义上基数树来源于Linux pagecache数据结构。在文件索引结构体(inode)中的address_space字段记录了该文件所使用的页缓存。address_space使用基数树管理page offset(可理解为地址)到page结构体的映射。因为page offset位数太长了,用前缀树存储的话高度太高,所以使用基数树,将若干个(比如k个)比特位合并到一起,因此基数树实际上是一颗2^k叉树。

按理说基数树应该能进行精确匹配、前缀匹配,不过鄙人不才,只实现了前者。

基数树的插入操作分为两步:分裂原节点、插入新节点

基数树的删除操作,需要先定位到需删除节点,然后进行可能的合并操作(可能删除后没有兄弟节点了)

以下为代码。测试代码可能没有覆盖各种情况,如有纰漏敬请指摘。

import (
	"bytes"
	"encoding/json"
)

type RadixNode struct {
	Val      string
	IsEnd    bool
	Children map[string]*RadixNode
}

const RootVal = "#"

type RadixTree struct {
	Root *RadixNode
}

func NewRadixTree() *RadixTree {
	return &RadixTree{
		Root: &RadixNode{
			Val:      RootVal,
			Children: make(map[string]*RadixNode),
		},
	}
}

func (t *RadixTree) Insert(str string) {
	if len(str) == 0 {
		return
	}
	t.insertRecursively(t.Root, str)
}

func (t *RadixTree) insertAtNode(node *RadixNode, str string) {
	preFixIndex := prefixIdx(str, node.Val)

	if preFixIndex < len(node.Val)-1 {
		k := node.Val[preFixIndex+1:]
		node.Val = node.Val[0 : preFixIndex+1]
		if len(node.Children) == 0 {
			node.Children[k] = &RadixNode{
				Val:   k,
				IsEnd: true,
			}
		} else {
			newNode := &RadixNode{
				Val:      k,
				Children: node.Children,
				IsEnd:    node.IsEnd,
			}
			node.Children = map[string]*RadixNode{}
			node.Children[k] = newNode
		}
		node.IsEnd = preFixIndex == len(str)-1
	}

	if preFixIndex < len(str)-1 {
		t.insertRecursively(node, str[preFixIndex+1:])
	}
}

func (t *RadixTree) insertRecursively(node *RadixNode, str string) {
	for _, child := range node.Children {
		if str[0] == child.Val[0] {
			t.insertAtNode(child, str)
			return
		}
	}
	node.Children[str] = &RadixNode{
		Val:      str,
		Children: map[string]*RadixNode{},
		IsEnd:    true,
	}
}

func (t *RadixTree) Find(str string) bool {
	return t.findRecursively(t.Root, str)
}

func (t *RadixTree) findAtNode(node *RadixNode, str string) bool {
	preFixIndex := prefixIdx(str, node.Val)
	if preFixIndex < 0 {
		// 没有公共前缀,不在当前节点上
		return false
	}
	if preFixIndex == len(str)-1 && node.IsEnd {
		return true
	} else {
		return t.findRecursively(node, str[preFixIndex+1:])
	}
}

func (t *RadixTree) findRecursively(node *RadixNode, str string) bool {
	for _, child := range node.Children {
		if t.findAtNode(child, str) {
			return true
		}
	}
	return false
}

func (t *RadixTree) Delete(str string) bool {
	return t.deleteRecursively(t.Root, str)
}

func (t *RadixTree) deleteAtNode(parentNode *RadixNode, node *RadixNode, str string) bool {
	preFixIndex := prefixIdx(str, node.Val)
	if preFixIndex < 0 {
		return false
	}
	if preFixIndex == len(str)-1 && node.Val == str && node.IsEnd {
		if len(node.Children) == 0 {
			delete(parentNode.Children, node.Val)
			if len(parentNode.Children) == 1 && !parentNode.isRoot() {
				var theChild *RadixNode
				for _, child := range parentNode.Children {
					if child.Val != str {
						theChild = child
						break
					}
				}
				parentNode.Val += theChild.Val
				parentNode.IsEnd = theChild.IsEnd
				parentNode.Children = theChild.Children
			}
		} else {
			node.IsEnd = false
			if len(node.Children) == 1 {
				var theChild *RadixNode
				for _, child := range node.Children {
					theChild = child
					break
				}
				node.Val += theChild.Val
				node.IsEnd = theChild.IsEnd
				node.Children = theChild.Children
			}
		}
		return true
	} else {
		return t.deleteRecursively(node, str[preFixIndex+1:])
	}
}

func (t *RadixTree) deleteRecursively(node *RadixNode, str string) bool {
	for _, child := range node.Children {
		if t.deleteAtNode(node, child, str) {
			return true
		}
	}
	return false
}

func (t *RadixTree) Equals(other *RadixTree) bool {
	return t.Root.equal(other.Root)
}

func (n *RadixNode) equal(node *RadixNode) bool {
	if n == nil || node == nil {
		return n == nil && node == nil
	}
	if n.Val != node.Val {
		return false
	}
	if len(n.Children) != len(node.Children) {
		return false
	}
	for _, child := range n.Children {
		if child2, ok := node.Children[child.Val]; ok {
			if !child.equal(child2) {
				return false
			}
		} else {
			return false
		}
	}
	return true
}

func (t *RadixTree) String() string {
	b, _ := json.Marshal(*t)
	var out bytes.Buffer
	_ = json.Indent(&out, b, "", "  ")
	return out.String()
}

func (t *RadixTree) Clone() *RadixTree {
	return &RadixTree{Root: t.Root.clone()}
}

func (n *RadixNode) clone() *RadixNode {
	if n == nil {
		return nil
	}
	newRoot := &RadixNode{
		Val:      n.Val,
		IsEnd:    n.IsEnd,
		Children: map[string]*RadixNode{},
	}
	for _, child := range n.Children {
		newRoot.Children[child.Val] = child.clone()
	}
	return newRoot
}

func (n *RadixNode) isRoot() bool {
	return n.Val == RootVal
}

func prefixIdx(str1, str2 string) int {
	idx := 0
	for ; idx < len(str1) && idx < len(str2); idx++ {
		if str1[idx] != str2[idx] {
			break
		}
	}
	return idx - 1
}

  以下为测试代码

func main() {
	rt := search.NewRadixTree()
	data := []string{"tester", "slow", "water", "slower", "slowerly", "test", "watly", "team", "toast"}
	trees := make([]*search.RadixTree, 0)
	for _, str := range data {
		rt.Insert(str)
		trees = append(trees, rt.Clone())
	}
	for i := len(data) - 1; i >= 0; i-- {
		fmt.Println(rt.Equals(trees[i]))
		rt.Delete(data[i])
	}
	fmt.Println(rt)
}

  

上一篇:react-bmap 安装于使用


下一篇:java面试题-2.容器之Map