期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
文本语义哈希技术研究进展
1
作者
孙宇清
黄钿
+2 位作者
李
呈
韬
郑威
汤庸
《华南师范大学学报(自然科学版)》
CAS
北大核心
2024年第3期93-105,共13页
文本语义哈希是在满足语义相似性约束下将文本转化为低维二值数据的神经编码技术,支持基于汉明距离的高效检索,以解决有限计算资源约束下海量文本的相似性计算问题。文本语义哈希技术存在诸多挑战,包括如何在低维二值编码中融入类别信...
文本语义哈希是在满足语义相似性约束下将文本转化为低维二值数据的神经编码技术,支持基于汉明距离的高效检索,以解决有限计算资源约束下海量文本的相似性计算问题。文本语义哈希技术存在诸多挑战,包括如何在低维二值编码中融入类别信息、如何丰富编码的语义信息以提升模型鲁棒性、如何解决离散输出的模型梯度估计等关键问题。文章首先综述文本语义哈希任务的重要研究发展,详细讨论了无监督文本语义哈希模型和融合类别信息的有监督文本语义哈希模型的技术细节,分析基于近邻文本、隐式主题等信息的语义增强技术以及模型优化等关键技术;然后,综述文本语义哈希任务相关数据集和评估指标,对比了各类文本语义哈希技术的特点和性能;最后,讨论了文本语义哈希技术的未来发展方向。
展开更多
关键词
文本语义哈希
信息检索
协同编码
下载PDF
职称材料
题名
文本语义哈希技术研究进展
1
作者
孙宇清
黄钿
李
呈
韬
郑威
汤庸
机构
山东大学软件学院
华南师范大学计算机学院
出处
《华南师范大学学报(自然科学版)》
CAS
北大核心
2024年第3期93-105,共13页
基金
国家自然科学基金项目(62376138)
山东省自然科学基金项目(ZR2022LZH007)。
文摘
文本语义哈希是在满足语义相似性约束下将文本转化为低维二值数据的神经编码技术,支持基于汉明距离的高效检索,以解决有限计算资源约束下海量文本的相似性计算问题。文本语义哈希技术存在诸多挑战,包括如何在低维二值编码中融入类别信息、如何丰富编码的语义信息以提升模型鲁棒性、如何解决离散输出的模型梯度估计等关键问题。文章首先综述文本语义哈希任务的重要研究发展,详细讨论了无监督文本语义哈希模型和融合类别信息的有监督文本语义哈希模型的技术细节,分析基于近邻文本、隐式主题等信息的语义增强技术以及模型优化等关键技术;然后,综述文本语义哈希任务相关数据集和评估指标,对比了各类文本语义哈希技术的特点和性能;最后,讨论了文本语义哈希技术的未来发展方向。
关键词
文本语义哈希
信息检索
协同编码
Keywords
text semantic hashing
information retrieval
collaborative coding
分类号
TP319 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
文本语义哈希技术研究进展
孙宇清
黄钿
李
呈
韬
郑威
汤庸
《华南师范大学学报(自然科学版)》
CAS
北大核心
2024
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部