期刊文献+
共找到12篇文章
< 1 >
每页显示 20 50 100
基于密度特征的维吾尔文离线签名识别 被引量:9
1
作者 库尔班.吾布力 热依买.阿不力克木 +2 位作者 努尔毕亚.亚地卡尔 阿力木江.艾沙 吐尔根.依布拉音 《计算机工程与设计》 北大核心 2016年第8期2200-2205,共6页
对维吾尔文签名图像进行预处理(含灰度化、平滑、二值化、归一化、细化等)的基础上,提出基于密度特征的维吾尔文离线签名识别方法,结合签名样本的空间地位信息,对离线签名进行有效处理和识别。从维吾尔文签名样本库中选取75个签名者的(2... 对维吾尔文签名图像进行预处理(含灰度化、平滑、二值化、归一化、细化等)的基础上,提出基于密度特征的维吾尔文离线签名识别方法,结合签名样本的空间地位信息,对离线签名进行有效处理和识别。从维吾尔文签名样本库中选取75个签名者的(20个样本/人)1500个签名样本进行分类实验,得到最高为96%的识别率,实验结果表明,密度特征是维吾尔文手写签名的一种有效特征,能较全面地描述与捕捉维吾尔文手写签名的书写特点。 展开更多
关键词 维吾尔文 签名识别 密度特征 特征距离 向量间距离
下载PDF
连体段特征聚类的维吾尔文文档图像单词切分 被引量:6
2
作者 阿丽亚.巴吐尔 木特力铺.马木提 +2 位作者 努尔毕亚.亚地卡尔 阿力木江.艾沙 库尔班.吾布力 《计算机工程与设计》 北大核心 2018年第3期774-779,共6页
为有效解决文档图像中单词漏切分和过切分问题,分析维吾尔文文档图像的无嵌入式双栏版面特性和文字特点。综合考虑连体段位置信息、密度及高宽特征和相邻连体段重叠性,提出一种文档图像中精确切分完整单词块的方法。将图文混排的版面分... 为有效解决文档图像中单词漏切分和过切分问题,分析维吾尔文文档图像的无嵌入式双栏版面特性和文字特点。综合考虑连体段位置信息、密度及高宽特征和相邻连体段重叠性,提出一种文档图像中精确切分完整单词块的方法。将图文混排的版面分析与重叠域合并相结合,采用两级K-means分类策略,有效避免标点符号的影响,增强完整单词块的被切分能力。实验结果表明,该算法比连通域搜索算法和投影算法具有更高的切分精度,在多文种图像单词切分中具有更高的有效性。 展开更多
关键词 双栏复杂文档图像 版面分析 连体段特征 单词切分 重叠率
下载PDF
融合RoBERTa和注意力机制的隐喻方面级情感分析 被引量:2
3
作者 马圆圆 禹龙 +2 位作者 田生伟 钱梦莹 张立强 《小型微型计算机系统》 CSCD 北大核心 2023年第10期2236-2241,共6页
针对目前大多数隐喻情感分析方法存在对方面情感注意力引入不足的问题,提出一种用于隐喻方面级情感分类的模型.模型首先通过RoBERTa对具有方面情感信息的文本进行编码,将编码后的方面信息和多层情感注意力信息融合,形成多层方面注意力... 针对目前大多数隐喻情感分析方法存在对方面情感注意力引入不足的问题,提出一种用于隐喻方面级情感分类的模型.模型首先通过RoBERTa对具有方面情感信息的文本进行编码,将编码后的方面信息和多层情感注意力信息融合,形成多层方面注意力表征向量.将该表征向量与隐喻句的关联结果作为文本原始特征,利用注意力机制和方面信息对其解码,然后通过卷积网络计算隐喻句与方面词的关联度.将池化层输出结果和卷积计算结果合并,最后计算隐喻句不同方面词的情感极性的概率,完成隐喻情感分析.实验结果表明该模型对3种情感极性的平均判断准确率分别达到了83.26%,81.69%和56.68%,与基线实验相比均有所提升. 展开更多
关键词 隐喻情感分析 方面级情感分析 多层注意力机制 RoBERTa
下载PDF
基于离散曲波变换的多文种文档图像文种识别 被引量:4
4
作者 李顺 木特力铺.马木提 +2 位作者 吾尔尼沙.买买提 阿力木江.艾沙 库尔班.吾布力 《计算机工程与设计》 北大核心 2019年第5期1376-1382,共7页
为提高文种识别效果,提出一种基于离散曲波变换的文种识别方法。利用文档图像经过曲波变换后得到的cell矩阵中的实数曲波系数,提取共82维能量特征;使用贝叶斯、KNN和判别分析3种分类器进行训练和分类。对两个数据库进行实验,数据库1包含... 为提高文种识别效果,提出一种基于离散曲波变换的文种识别方法。利用文档图像经过曲波变换后得到的cell矩阵中的实数曲波系数,提取共82维能量特征;使用贝叶斯、KNN和判别分析3种分类器进行训练和分类。对两个数据库进行实验,数据库1包含8种文字共1600幅图片,使用3种分类器得到平均大于99%的识别准确率;数据库2包含10种文字共10 000幅图片,得到平均大于98%的识别准确率。实验结果表明,该方法运算速度快,具有良好的鲁棒性,识别效果优于基于小波变换的文种识别方法和基于二元复数小波变换的文种识别方法。 展开更多
关键词 文种识别 离散曲波变换 实数曲波系数 判别分析 鲁棒性
下载PDF
纹理特征加权融合的中亚多文种文档图像文种识别 被引量:4
5
作者 布阿加姑丽.米吉提 库尔班.吾布力 +2 位作者 努尔毕亚.亚地卡尔 吐尔根.依不拉因 阿力木江.艾沙 《计算机工程与应用》 CSCD 北大核心 2017年第20期187-194,共8页
全球各地目前使用很多种相似的文种,相似文种的识别是模式识别领域内难点并迫切需要解决的问题之一。然而,针对中亚文种文本文档和少数民族文种也就是相似文种分类识别方面的文献报道几乎没有。首先建立了两个多文种文档图像数据库,分别... 全球各地目前使用很多种相似的文种,相似文种的识别是模式识别领域内难点并迫切需要解决的问题之一。然而,针对中亚文种文本文档和少数民族文种也就是相似文种分类识别方面的文献报道几乎没有。首先建立了两个多文种文档图像数据库,分别有1 600幅和2 200幅纯文本整篇文档图像,包含英文,汉文,俄文,蒙文,阿拉伯文,藏文,维吾尔文,土耳其文,乌兹别克文,塔吉克文和哈萨克文等共有11种文档图像。其次分别提取文档图像的均值,标准差,熵,一致性,三阶矩,平滑度等六个纹理特征,利用不同7种分类器分类。在找到各个特征对多文种文本文档图像的灵敏度的基础上,采用加权特征融合方法提取融合特征,确定了适合中亚多文种文档图像识别的最佳权值。最后用不同分类器分类识别,通过多特征以系数加权融合之后,以建立的两个数据库基础下获得平均的识别率分别为99.38%和95.69%。实验结果表明,提取的纹理特征和加权融合的纹理特征能较好地描述文档图像特征,并且它们可以有效地分类以上所述的11个文种。 展开更多
关键词 文种识别 纹理特征 判别分析 马氏距离 加权融合
下载PDF
基于动态主题模型的舆情本体概念抽取 被引量:3
6
作者 赵美玲 刘胜全 +2 位作者 刘艳 郭竹为 符贤哲 《计算机工程与设计》 北大核心 2018年第4期1174-1179,共6页
对现有领域本体学习方法不能直接移植在舆情本体学习方法上的问题进行研究,根据舆情本体的动态主题性提出一种基于动态主题模型的舆情本体概念抽取的方法。结合舆情周期内词语的前驱增速和后继增速提取主题特征词,主题度选取主题词;对... 对现有领域本体学习方法不能直接移植在舆情本体学习方法上的问题进行研究,根据舆情本体的动态主题性提出一种基于动态主题模型的舆情本体概念抽取的方法。结合舆情周期内词语的前驱增速和后继增速提取主题特征词,主题度选取主题词;对主题词通过主题相关度进行聚类,形成主题词簇;对主题词簇下候选概念进行主题概念隶属度的过滤得到舆情本体概念;以上述概念作为种子词寻找左右邻接词得到复合词,过滤得到舆情本体复合概念。实验结果验证了该方法具有更高的准确率和召回率。 展开更多
关键词 舆情本体 动态主题 舆情周期 主题相关度 主题概念隶属度
下载PDF
改进SURF特征的维吾尔文复杂文档图像匹配检索 被引量:3
7
作者 阿丽亚·巴吐尔 努尔毕亚·亚地卡尔 +2 位作者 吾尔尼沙·买买提 阿力木江·艾沙 库尔班·吾布力 《智能系统学报》 CSCD 北大核心 2019年第2期296-305,共10页
针对图像局部特征的词袋模型(Bag-of-Word, BOW)检索研究中聚类中心的不确定性和计算复杂性问题,提出一种由不同种类的距离进行相似程度测量的检索和由匹配点数来检索的方法。这种方法首先需要改进文档图像的SURF特征,有效降低特征提取... 针对图像局部特征的词袋模型(Bag-of-Word, BOW)检索研究中聚类中心的不确定性和计算复杂性问题,提出一种由不同种类的距离进行相似程度测量的检索和由匹配点数来检索的方法。这种方法首先需要改进文档图像的SURF特征,有效降低特征提取复杂度;其次,对FAST+SURF特征实现FLANN双向匹配与KD-Tree+BBF匹配,在不同变换条件下验证特征鲁棒性;最后,基于这两种检索方法对已收集整理好的各类维吾尔文文档图像数据库进行检索。实验结果表明:基于距离的相似性度量复杂度次于基于匹配数目的检索,而且两种检索策略都能满足快速、精确查找需求。 展开更多
关键词 复杂文档 维吾尔文档图像 文档图像分割 特征提取 SURF特征 FLANN双向匹配 KD-Tree+BBF匹配 图像检索
下载PDF
高维统计特征融合的维吾尔文脱机手写签名识别 被引量:2
8
作者 艾海提.伊敏 木特力甫.马木提 +2 位作者 阿力木江.艾沙 吐尔根.依不拉音 库尔班.吾布力 《计算机科学与探索》 CSCD 北大核心 2018年第2期308-317,共10页
签名识别作为一种身份认证方法,在现代社会的各行业各领域中普遍使用,并且发挥了重要的作用。主要针对使用单一低维签名特征进行签名识别准确率不够高的问题,提出了一种基于高维统计特征的维吾尔文手写签名识别方法。首先根据特征提取... 签名识别作为一种身份认证方法,在现代社会的各行业各领域中普遍使用,并且发挥了重要的作用。主要针对使用单一低维签名特征进行签名识别准确率不够高的问题,提出了一种基于高维统计特征的维吾尔文手写签名识别方法。首先根据特征提取的需求,对每幅签名图像进行平滑处理、二值化、归一化和细化等预处理操作;然后提取每一幅签名的128维局部中心点特征和112维ETDT特征,将得到的两种特征组合形成新的高维特征;最后分别利用距离度量和相似性度量算法进行训练和识别。实验结果显示该算法比以前算法提取的识别结果更好,有效地提高了维吾尔文手写签名的识别率。 展开更多
关键词 手写签名 局部中心点特征 绝对距离 cosine距离
下载PDF
基于改进K-means聚类与图模型相结合的多文本自动文摘研究 被引量:2
9
作者 赵美玲 刘胜全 +2 位作者 刘艳 郭竹为 符贤哲 《现代计算机(中旬刊)》 2017年第6期26-30,共5页
目前多文档文摘大多数对同一主题下的文本进行摘要,不同主题下的文本自动文摘的研究相对较少。已有的多文本自动摘要或多或少有不足,使用聚类方法存在初始质心k无法确定以及构造图模型时句子相似度计算没有考虑语义特征等现象。对不同... 目前多文档文摘大多数对同一主题下的文本进行摘要,不同主题下的文本自动文摘的研究相对较少。已有的多文本自动摘要或多或少有不足,使用聚类方法存在初始质心k无法确定以及构造图模型时句子相似度计算没有考虑语义特征等现象。对不同主题的多文档进行主题划分,然后依据主题进行多文本自动摘要,针对以上多文档文摘方法存在的不足,改进K-means聚类、句子相似度计算等缺陷,提出改进K-means聚类和图模型相结合的方法。通过实验表明,该方法的准确率高于基于聚类或者基于图排序的算法。 展开更多
关键词 自动文摘 多文本 聚类 图模型
下载PDF
基于形态学梯度算法的维文文档图像单词切分 被引量:2
10
作者 周文杰 木特力铺·马木提 +2 位作者 吾尔尼沙·买买提 阿力木江·艾沙 库尔班·吾布力 《计算机工程与设计》 北大核心 2019年第9期2552-2557,共6页
为提高文档图像字符的识别率,提出一种利用形态学梯度算法实现维吾尔文单词切分的方法。对维文文字的特点进行分析,综合利用形态学算法的基本特性,将文档图像中标点与单词分离开来,避免关键词与标点的误切。将形态学梯度算法用于文档图... 为提高文档图像字符的识别率,提出一种利用形态学梯度算法实现维吾尔文单词切分的方法。对维文文字的特点进行分析,综合利用形态学算法的基本特性,将文档图像中标点与单词分离开来,避免关键词与标点的误切。将形态学梯度算法用于文档图像分割,更好地寻找每个单词的边缘轮廓和边界,对单词进行有效切分。实验结果表明,该方法能很好地对维吾尔文单词进行切分,切分的准确率达到了97.96%,后续的多文种文档图像的对比实验验证了该方法在单词切分中的实用性。 展开更多
关键词 文档图像 腐蚀膨胀 倾斜校正 形态学梯度算法 单词切分
下载PDF
NSCT子带纹理特征融合的中亚文种识别 被引量:1
11
作者 韩兴坤 阿力木江.艾沙 +2 位作者 努尔毕亚.亚地卡尔 朱亚俐 库尔班.吾布力 《计算机工程与设计》 北大核心 2018年第9期2848-2855,共8页
由于中亚地区某些文种相似度较高,单一纹理特征不能充分描述它们的纹理特点。为此,提出基于NSCT子带纹理特征融合的文种识别方法,即先对预处理后的文档图像进行非下采样Contourlet变换。对变换产生的子带分别提取局部二值模式和灰度共... 由于中亚地区某些文种相似度较高,单一纹理特征不能充分描述它们的纹理特点。为此,提出基于NSCT子带纹理特征融合的文种识别方法,即先对预处理后的文档图像进行非下采样Contourlet变换。对变换产生的子带分别提取局部二值模式和灰度共生矩阵特征,生成高维融合特征向量,通过主成分分析法对其进行降维生成低维特征向量。通过对阿拉伯文、俄文、藏文、中文、维吾尔文、英文、蒙古文、吉尔吉斯斯坦文、哈萨克斯坦文、土耳其文进行实验,验证了该方法能更准确地提取文档图像多尺度、多方向的纹理特征,有效提高识别率。 展开更多
关键词 文种识别 融合纹理特征 非下采样CONTOURLET变换 局部二值模式 灰度共生矩阵 支持向量机
下载PDF
基于Ridgelet变换的多文种文档图像文种识别
12
作者 热依汗古丽·卡森木 木特力铺·马木提 +2 位作者 吾尔尼沙·买买提 阿力木江·艾沙 库尔班·吾布力 《计算机工程与设计》 北大核心 2020年第11期3137-3142,共6页
为提高多文种文档图像的文种识别的效率,提出基于Ridgelet变换的多文种识别方法。对文档图像数据库进行Ridgelet变换,对得到的Ridgelet(脊波变换)系数矩阵提取脊波能量特征,生成特征向量。在分类决策中选择KNN、线性判别分析以及贝叶斯... 为提高多文种文档图像的文种识别的效率,提出基于Ridgelet变换的多文种识别方法。对文档图像数据库进行Ridgelet变换,对得到的Ridgelet(脊波变换)系数矩阵提取脊波能量特征,生成特征向量。在分类决策中选择KNN、线性判别分析以及贝叶斯3种分类模型分别对所提特征进行训练和分类。在包括英文、中文、阿拉伯文、土耳其文、吉尔吉斯斯坦文、俄文和国内少数民族文种(蒙文,藏文,维吾尔文)的9个文种共9000张文档图像数据库中进行实验,最高识别率为99.23%,验证了所提算法对多文种识别有较高的识别率和良好的鲁棒性。 展开更多
关键词 文种识别 RIDGELET变换 纹理特征 Ridgelet系数 KNN(K最近邻算法)
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部