期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于改进的Trie树和DFA的敏感词过滤算法 被引量:13
1
作者 吴珊 李英祥 +2 位作者 徐鸿雁 张仕霞 施宜军 《计算机应用研究》 CSCD 北大核心 2021年第6期1678-1682,1688,共6页
通过对文本内容中敏感词过滤方法及相关技术的研究,提出了一种基于改进的Trie树和DFA的敏感词过滤算法,解决了敏感词过滤技术中的人工干扰、分词障碍等关键问题,提高了文本中敏感词过滤的准确性和有效性。提出的算法包括三个步骤:基于... 通过对文本内容中敏感词过滤方法及相关技术的研究,提出了一种基于改进的Trie树和DFA的敏感词过滤算法,解决了敏感词过滤技术中的人工干扰、分词障碍等关键问题,提高了文本中敏感词过滤的准确性和有效性。提出的算法包括三个步骤:基于排列组合的数学原理对中文词向中拼混合词进行扩充;采用改进的Trie树结构来存储DFA的所有状态,构建敏感词树;根据构建的敏感词树结构以及采用最小匹配规则对文本内容中的敏感词进行检测和过滤。通过分析得到构建敏感词树算法的时间复杂度为O(n×len),敏感词检测及过滤算法时间复杂度为O(L)。实验结果表明,本算法其查准率为100%,查全率约为87%~100%。 展开更多
关键词 改进的Trie树 确定有穷自动机(dfa) 敏感词过滤 最小匹配规则
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部