-
题名基于对比学习的无监督三元哈希方法
被引量:1
- 1
-
-
作者
李玉强
陆子微
刘春
-
机构
武汉理工大学计算机与人工智能学院
-
出处
《计算机应用研究》
CSCD
北大核心
2023年第5期1434-1440,共7页
-
文摘
为了解决现有无监督二元哈希方法由于存在较大量化损失而导致检索精度较低的问题,在CIBHash方法的基础上,提出了一种新的基于对比学习的无监督三元哈希方法——CUTHash,将三元哈希编码用于图像检索。具体来说,首先,使用融合了解耦对比损失的对比学习框架,在目标数据集上进行无监督的图像特征学习;接着,为了得到三元哈希编码,对学习到的图像特征使用平滑函数进行量化操作,解决离散函数量化后导致的零梯度问题;最后,应用改进后的对比损失,约束同属一张图像的增强视图的特征在哈希空间中尽可能地接近,从而使得三元哈希编码具有一定的辨识力,使其更好地应用于无监督图像检索任务。在CIFAR-10、NUS-WIDE、MSCOCO以及ImageNet100数据集上进行了大量对比实验,取得了较当前主流的无监督哈希方法更好的检索性能,从而验证了CUTHash方法的有效性。
-
关键词
图像检索
无监督哈希
对比学习
三元哈希编码
哈希量化
-
Keywords
image retrieval
unsupervised hash
contrastive learning
ternary hash code
hash quantization
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于机器学习模型的客服短文本分类技术研究
被引量:1
- 2
-
-
作者
李艳
朱倩倩
董秀萍
-
机构
兰考三农职业学院信息工程系
郑州科技学院信息工程学院
开封大学电子电气工程学院
-
出处
《现代计算机》
2023年第15期64-68,共5页
-
基金
河南省高等学校重点科研项目(23B460019):智能型果蔬分选专家系统训练平台。
-
文摘
客服的本质工作是对用户登记的问题进行分类,并根据分类结果将其转发对应的部门进行处理,分类通常依赖人工分析,处理效率较低。为了提高客服人员的工作效率,对基于机器学习模型帮助客服自动分类用户反映问题的方法进行研究,准确进行文本分类和识别。研究选取某公司登记的用户问题数据,分别采用哈希向量化(HashVectorizer)和词频-逆文档频率(TF-IDF)等技术构建文本向量,对比分析多种机器分类模型,选取最优模型,且取得较好分类效果。
-
关键词
机器学习
文本分类
哈希向量化
TF-IDF
-
Keywords
machine learning
text classification
HashVectorizer
TF-IDF
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
TP391.1
[自动化与计算机技术—控制科学与工程]
-