开放环境下的模式识别与文字识别应用中,新数据、新模式和新类别不断涌现,要求算法具备应对新类别模式的能力。针对这一问题,研究者们开始聚焦开放集文字识别(open-set text recognition,OSTR)任务。该任务要求,算法在测试(推断)阶段,...开放环境下的模式识别与文字识别应用中,新数据、新模式和新类别不断涌现,要求算法具备应对新类别模式的能力。针对这一问题,研究者们开始聚焦开放集文字识别(open-set text recognition,OSTR)任务。该任务要求,算法在测试(推断)阶段,既能识别训练集见过的文字类别,还能够识别、拒识或发现训练集未见过的新文字。开放集文字识别逐步成为文字识别领域的研究热点之一。本文首先对开放集模式识别技术进行简要总结,然后重点介绍开放集文字识别的研究背景、任务定义、基本概念、研究重点和技术难点。同时,针对开放集文字识别三大问题(未知样本发现、新类别识别和上下文信息偏差),从方法的模型结构、特点优势和应用场景的角度对相关工作进行了综述。最后,对开放集文字识别技术的发展趋势和研究方向进行了分析展望。展开更多
开集分类识别是近10多年来模式识别领域研究的热点,它能够识别训练集中已知类别的测试样本,同时还能够有效“拒识”未知类别的测试样本;这些未知类别样本不包含在训练集中。现有的开集分类识别算法主要是基于Support Vector Machine(SVM...开集分类识别是近10多年来模式识别领域研究的热点,它能够识别训练集中已知类别的测试样本,同时还能够有效“拒识”未知类别的测试样本;这些未知类别样本不包含在训练集中。现有的开集分类识别算法主要是基于Support Vector Machine(SVM)和深度学习网络框架进行改进,并且主要应用在自然景物图像领域中;在光谱分析领域中还鲜有报道。将传统的闭集框架下的模糊推理分类器进行模型改进,提出了开集框架下的改进模糊推理分类器,并将其应用到木材树种近红外光谱分类识别中。首先,使用Flame-NIR近红外微型光谱仪采集木材样本横切面的近红外光谱曲线,采用Metric Learning算法进行光谱向量维度约简降维至4维(4D)。其次,改进闭集框架下的模糊推理分类器,根据模糊规则置信度和各维度隶属度概率的乘积构建Generalized Basic Probability Assignment(GBPA),再根据GBPA进行分类处理。在20个树种的具有不同的Openness指标下的近红外光谱数据集的分类识别对比实验表明,改进的开集模糊推理分类器(fuzzy reasoning classifier in an open set,FRCOS)优于现有的基于机器学习和深度学习的开集分类识别主流算法,具有较好的评价指标F-Score,Kappa系数及总体识别率。展开更多
文摘开放环境下的模式识别与文字识别应用中,新数据、新模式和新类别不断涌现,要求算法具备应对新类别模式的能力。针对这一问题,研究者们开始聚焦开放集文字识别(open-set text recognition,OSTR)任务。该任务要求,算法在测试(推断)阶段,既能识别训练集见过的文字类别,还能够识别、拒识或发现训练集未见过的新文字。开放集文字识别逐步成为文字识别领域的研究热点之一。本文首先对开放集模式识别技术进行简要总结,然后重点介绍开放集文字识别的研究背景、任务定义、基本概念、研究重点和技术难点。同时,针对开放集文字识别三大问题(未知样本发现、新类别识别和上下文信息偏差),从方法的模型结构、特点优势和应用场景的角度对相关工作进行了综述。最后,对开放集文字识别技术的发展趋势和研究方向进行了分析展望。
文摘开集分类识别是近10多年来模式识别领域研究的热点,它能够识别训练集中已知类别的测试样本,同时还能够有效“拒识”未知类别的测试样本;这些未知类别样本不包含在训练集中。现有的开集分类识别算法主要是基于Support Vector Machine(SVM)和深度学习网络框架进行改进,并且主要应用在自然景物图像领域中;在光谱分析领域中还鲜有报道。将传统的闭集框架下的模糊推理分类器进行模型改进,提出了开集框架下的改进模糊推理分类器,并将其应用到木材树种近红外光谱分类识别中。首先,使用Flame-NIR近红外微型光谱仪采集木材样本横切面的近红外光谱曲线,采用Metric Learning算法进行光谱向量维度约简降维至4维(4D)。其次,改进闭集框架下的模糊推理分类器,根据模糊规则置信度和各维度隶属度概率的乘积构建Generalized Basic Probability Assignment(GBPA),再根据GBPA进行分类处理。在20个树种的具有不同的Openness指标下的近红外光谱数据集的分类识别对比实验表明,改进的开集模糊推理分类器(fuzzy reasoning classifier in an open set,FRCOS)优于现有的基于机器学习和深度学习的开集分类识别主流算法,具有较好的评价指标F-Score,Kappa系数及总体识别率。