字典树

Trie树,又称字典树,单词查找树或者前缀树,是一种用于快速检索的多叉树结构,如英文字母的字典树是一个26叉树,数字的字典树是一个10叉树。

字典树(Trie树)的实现及应用

应用场景

Trie树和DFA,确定有限状态自动机

trie树实际上是一个DFA,通常用转移矩阵表示。行表示状态,列表示输入字符,(行,列)位置表示转移状态。这种方式的查询效率很高,但由于稀疏的现象严重,空间利用效率很低。也可以采用压缩的存储方式即链表来表示状态转移,但由于要线性查询,会造成效率低下。

Trie树的实现

Trie树的创建要考虑的是父节点如何保存孩子节点,主要有链表和数组两种方式:

  1. 使用节点数组,因为是英文字符,可以用Node[26]来保存孩子节点(如果是数字我们可以用Node[10]),这种方式最快,但是并不是所有节点都会有很多孩子,所以这种方式浪费的空间太多
  1. 用一个链表根据需要动态添加节点。这样我们就可以省下不小的空间,但是缺点是搜索的时候需要遍历这个链表,增加了时间复杂度。

查询操作

如何构建

双数组Trie树(DoubleArrayTrie)Java实现

Trie 树的以下几个特点

  • 根节点不包含字符,除根节点外每个节点只包含一个字符
  • 从根节点到某一节点,路径上经过的字符连接起来,为该节点对应的字符串。
  • 每个节点的所有子节点包含的字符都不相同,这一点也就保证了相同的前缀能够得到复用