期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
文本语义哈希技术研究进展
1
作者 孙宇清 黄钿 +2 位作者 郑威 汤庸 《华南师范大学学报(自然科学版)》 CAS 北大核心 2024年第3期93-105,共13页
文本语义哈希是在满足语义相似性约束下将文本转化为低维二值数据的神经编码技术,支持基于汉明距离的高效检索,以解决有限计算资源约束下海量文本的相似性计算问题。文本语义哈希技术存在诸多挑战,包括如何在低维二值编码中融入类别信... 文本语义哈希是在满足语义相似性约束下将文本转化为低维二值数据的神经编码技术,支持基于汉明距离的高效检索,以解决有限计算资源约束下海量文本的相似性计算问题。文本语义哈希技术存在诸多挑战,包括如何在低维二值编码中融入类别信息、如何丰富编码的语义信息以提升模型鲁棒性、如何解决离散输出的模型梯度估计等关键问题。文章首先综述文本语义哈希任务的重要研究发展,详细讨论了无监督文本语义哈希模型和融合类别信息的有监督文本语义哈希模型的技术细节,分析基于近邻文本、隐式主题等信息的语义增强技术以及模型优化等关键技术;然后,综述文本语义哈希任务相关数据集和评估指标,对比了各类文本语义哈希技术的特点和性能;最后,讨论了文本语义哈希技术的未来发展方向。 展开更多
关键词 文本语义哈希 信息检索 协同编码
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部