期刊文献+
共找到12篇文章
< 1 >
每页显示 20 50 100
一种基于曲线匹配的印鉴图像自动检索方法 被引量:7
1
作者 宋勇 刘宏 《北京大学学报(自然科学版)》 CAS CSCD 北大核心 2004年第1期85-90,共6页
从汉字笔划横平竖直这一特点出发 ,提出了汉字图像中适合于印鉴图像检索的两种特征 :汉字的外边缘轮廓和汉字的方向投影密度。进而用函数曲线对这两种特征进行量化描述 ,将对汉字的匹配归结为对函数曲线的匹配。最后通过实验验证了这两... 从汉字笔划横平竖直这一特点出发 ,提出了汉字图像中适合于印鉴图像检索的两种特征 :汉字的外边缘轮廓和汉字的方向投影密度。进而用函数曲线对这两种特征进行量化描述 ,将对汉字的匹配归结为对函数曲线的匹配。最后通过实验验证了这两种特征的稳定性以及基于这两种特征的曲线匹配方法的有效性。 展开更多
关键词 印章 图像检索 汉字特征 曲线匹配
下载PDF
基于汉字形音义多元知识和标签嵌入的文本语义匹配模型 被引量:1
2
作者 赵云肖 李茹 +5 位作者 李欣杰 苏雪峰 施艳蕊 乔雪妮 胡志伟 闫智超 《中文信息学报》 CSCD 北大核心 2024年第3期42-55,共14页
文本语义匹配指基于给定的文本判别文本之间的语义关系。针对该任务,现有模型的信息编码未考虑利用除汉字字符外的潜在语义信息,且在分类时未考虑标签信息对模型性能的影响。因此,该文提出了一种使用汉字形音义多元知识和标签嵌入的文... 文本语义匹配指基于给定的文本判别文本之间的语义关系。针对该任务,现有模型的信息编码未考虑利用除汉字字符外的潜在语义信息,且在分类时未考虑标签信息对模型性能的影响。因此,该文提出了一种使用汉字形音义多元知识和标签嵌入的文本语义匹配方法。首先,通过信息编码层对汉字的形音义的多元知识进行编码;其次,通过信息整合层获取融合汉字形音义多元知识的联合表示;然后,经过标签嵌入层利用编码后的分类标签与汉字形音义的联合表示生成信号监督标签;最后,经过标签预测层获取文本层面与标签层面的联合信息表示,进而对文本语义关系进行最终的判别。在多个数据集上的实验结果显示,该文提出的模型优于多个基线模型,验证了模型的有效性。 展开更多
关键词 汉字形音义多元知识 标签嵌入 文本语义匹配
下载PDF
改进SURF算法在图像汉字识别中的应用 被引量:2
3
作者 孟伟 钟娜 《计算机工程与应用》 CSCD 北大核心 2015年第12期156-160,共5页
针对复杂背景下汉字匹配准确率较低的问题,提出一种改进的SURF算法。该算法利用灰度分级的字符分割方法,先进行灰度分割增强图像的对比度,采用灰度分级树将图像中的所有像素处理为树的模式进行计算,根据灰度分级确定主节点,根据主节点... 针对复杂背景下汉字匹配准确率较低的问题,提出一种改进的SURF算法。该算法利用灰度分级的字符分割方法,先进行灰度分割增强图像的对比度,采用灰度分级树将图像中的所有像素处理为树的模式进行计算,根据灰度分级确定主节点,根据主节点的级别所对应的灰度值对图像进行分割。同时,根据汉字结构的特殊性,取消了SURF算法的旋转不变性。实验结果表明,与未使用改进的SURF算法相比,对图像质量较差的文本图像,改进的SURF算法能有效地提高其匹配的准确率。 展开更多
关键词 复杂背景 汉字匹配 快速鲁棒特征(SURF)算法 灰度分级 字符分割
下载PDF
基于汉字部件组合的关键词过滤技术 被引量:1
4
作者 朱文轩 刘功申 李生红 《信息技术》 2008年第10期1-3,10,共4页
关键词过滤是基于文本内容过滤中最为常用的一种方法,有着广泛的应用。汉字由部件组成,将汉字拆成部件给关键词过滤造成了困难。提出了基于汉字部件组合的关键词过滤技术,依托于汉字结构标注库,运用改进的多模式匹配算法处理海量文本内... 关键词过滤是基于文本内容过滤中最为常用的一种方法,有着广泛的应用。汉字由部件组成,将汉字拆成部件给关键词过滤造成了困难。提出了基于汉字部件组合的关键词过滤技术,依托于汉字结构标注库,运用改进的多模式匹配算法处理海量文本内容。实验结果证明,该方法能够找出被故意拆分的关键词。 展开更多
关键词 汉字部件 多模式匹配 过滤
下载PDF
包含高阶统计量的手写汉字分类尺度 被引量:1
5
作者 任俊玲 郭军 《电子学报》 EI CAS CSCD 北大核心 2005年第10期1876-1878,共3页
在实际应用系统中,由于得到的信号往往不服从高斯分布,因而基于高阶统计量的信号处理方法越来越受到重视和应用.对于手写文字特征而言,它的分散特性很难用高斯分布描述,因而本文提出了一种通过高阶统计量来描述文字分散特性的方法,文中... 在实际应用系统中,由于得到的信号往往不服从高斯分布,因而基于高阶统计量的信号处理方法越来越受到重视和应用.对于手写文字特征而言,它的分散特性很难用高斯分布描述,因而本文提出了一种通过高阶统计量来描述文字分散特性的方法,文中给出了三种不同形式的高阶统计量,并且通过在脱机手写汉字数据库HCL2004[1]上进行实验,比较了基于这三种方法的模板匹配汉字识别系统的性能,同时也证实了该方法的有效性. 展开更多
关键词 汉字识别 高阶统计量 模板匹配 距离测度
下载PDF
基于骨架图匹配的汉字变形技术 被引量:1
6
作者 刘敏 詹华年 +1 位作者 梁晓辉 胡佳佳 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2015年第2期364-368,共5页
不同时代的汉字变化较大,自动产生它们之间的变形动画是一个具有挑战性的任务.为此尝试使用一个新方法解决该问题.首先将源汉字和目标汉字分割成对应的部件,然后根据部件的骨架和特征点将其分解为笔画并建立图模型,用笔画路径的相似度... 不同时代的汉字变化较大,自动产生它们之间的变形动画是一个具有挑战性的任务.为此尝试使用一个新方法解决该问题.首先将源汉字和目标汉字分割成对应的部件,然后根据部件的骨架和特征点将其分解为笔画并建立图模型,用笔画路径的相似度进行图模型的匹配来产生对应关系.最后根据匹配的结果为源汉字和目标汉字的轮廓建立同构三角形,并计算插值产生动画.实验当中将新方法的汉字匹配的效果与现有方法进行对比,并展示了所产生的变形动画,结果表明本文所提出的方法可以产生不同时代的汉字间的对应关系,并能生成平滑的变形动画. 展开更多
关键词 汉字 对应 图模型匹配 形状插值 变形动画
下载PDF
扩展内容过滤应对新型垃圾邮件
7
作者 康李 王远哲 《计算机安全》 2010年第9期22-25,共4页
随着信息的迅猛增长,垃圾邮件问题日益严重。如何有效地过滤垃圾邮件成为研究的热点问题。介绍了目前比较常见的几种垃圾邮件过滤技术,分析了垃圾邮件制造者采用的各种新型手段,如简繁体混编、汉字拆分、词间加入特殊字符等,试图绕过基... 随着信息的迅猛增长,垃圾邮件问题日益严重。如何有效地过滤垃圾邮件成为研究的热点问题。介绍了目前比较常见的几种垃圾邮件过滤技术,分析了垃圾邮件制造者采用的各种新型手段,如简繁体混编、汉字拆分、词间加入特殊字符等,试图绕过基于内容的关键词检查。针对其中几种典型的新型垃圾邮件编写手段,提出改进的中文分词策略,结合基于内容的关键词检查,提出基于特征词扩展的内容检查过滤机制。实验验证改进后的过滤模型可在一定程度上提高对新型垃圾邮件的识别率。最后,对基于特征词扩展思想在网络内容安全和健康过滤上的应用做了展望。 展开更多
关键词 垃圾邮件 特征词扩展 汉字拆分 中文分词 关键词匹配 内容过滤
下载PDF
模糊数学理论在汉字识别中的应用
8
作者 马宏艳 《电脑知识与技术》 2012年第7X期5176-5177,5180,共3页
模糊数学自诞生以来取得了快速的发展,随着计算机应用技术的发展,特别是网络的普及,人们越来越离不开计算机,计算机获取各种信息的主要工具,大量的信息处理工作也离不开计算机。在日常生活和工作中,存在着大量的文字信息处理工作,必须... 模糊数学自诞生以来取得了快速的发展,随着计算机应用技术的发展,特别是网络的普及,人们越来越离不开计算机,计算机获取各种信息的主要工具,大量的信息处理工作也离不开计算机。在日常生活和工作中,存在着大量的文字信息处理工作,必须交由计算机处理。汉字识别是模式识别领域的一个重要方向,涉及到很多方面的知识,同时它的实践意义也很深远。 展开更多
关键词 模糊数学 汉字识别 模糊匹配
下载PDF
《魏晋南北朝字音研究》音义匹配指误 被引量:1
9
作者 岳利民 姚青琳 《长沙理工大学学报(社会科学版)》 2011年第2期114-118,共5页
《魏晋南北朝字音研究》在音义匹配上存在大量失误。一是把不是用来注音的直音误认为是用来注音的直音,一是把不是为字头注音的音切误认为是为字头注音的音切,一是把异义异音字的音义搭配关系弄错了。
关键词 魏晋南北朝字音研究 音义匹配 指误
下载PDF
离线手写印刷体汉字识别技术
10
作者 郑毅 刘昌辉 《襄樊学院学报》 2000年第5期59-62,共4页
运用松弛匹配方法的基本思想,给出了用汉字轮廓点的差分作为轮廓跟踪及折断点选择的算法,提高了轮廓折线化速度;分类按汉字四周的外轮廓线分三级进行匹配,提出了动态有序弹性匹配方法,使全域松弛匹配得以在局部区域进行,从而有效... 运用松弛匹配方法的基本思想,给出了用汉字轮廓点的差分作为轮廓跟踪及折断点选择的算法,提高了轮廓折线化速度;分类按汉字四周的外轮廓线分三级进行匹配,提出了动态有序弹性匹配方法,使全域松弛匹配得以在局部区域进行,从而有效地提高了匹配速度;在进行第一级初分类时,采用多个模块,有效地提高了按偏旁位置分布进行分类的正确率;最后利用内轮廓折线与字典逐字匹配,达到对离线手写印刷体汉字识别的目的. 展开更多
关键词 手写印刷体汉字识别 松弛匹配法 动态有序弹性匹配法 匹配速度 汉字轮廓点 轮廓折线化 折断点选择
下载PDF
基于模板匹配及曲线拟合的视频字幕细化研究
11
作者 李钦瑞 都云程 +1 位作者 刘坤 吕学强 《计算机应用与软件》 CSCD 北大核心 2014年第1期144-147,共4页
在视频字幕识别过程中,由于字幕像素比较低,使得二值化后,汉字边缘出现不规整的锯齿。针对该类汉字的细化,提出基于模板匹配及曲线拟合的方法。用角度为0°、45°、90°、135°的线段作为模板,分别匹配汉字中"横&q... 在视频字幕识别过程中,由于字幕像素比较低,使得二值化后,汉字边缘出现不规整的锯齿。针对该类汉字的细化,提出基于模板匹配及曲线拟合的方法。用角度为0°、45°、90°、135°的线段作为模板,分别匹配汉字中"横"、"撇"、"竖"、"捺"笔划,实现笔划提取;用二次Bezier曲线拟合"撇"、"捺"笔划,实现笔划重绘。对比实验表明,该方法对视频字幕的细化是有效的,且结果可以更好地被识别。 展开更多
关键词 视频字幕汉字细化 笔划 模板匹配 二次Bezier曲线
下载PDF
一种基于米字形窗口的区域立体匹配算法
12
作者 张志华 霍家道 刘会 《科学技术与工程》 北大核心 2014年第12期236-239,共4页
立体匹配是立体视觉中的关键技术之一。针对Baris的基于能量函数最小的立体匹配算法计算量大,难以兼顾速度和精度的问题,提出一种基于米字形窗口的区域立体匹配算法进行改进。首先,利用连通标记法将图像分为若干个区域;其次,在米字型窗... 立体匹配是立体视觉中的关键技术之一。针对Baris的基于能量函数最小的立体匹配算法计算量大,难以兼顾速度和精度的问题,提出一种基于米字形窗口的区域立体匹配算法进行改进。首先,利用连通标记法将图像分为若干个区域;其次,在米字型窗口内,仅对标记值相同的邻域进行聚合;最后,对获得的视差图采用能量均值阈值机制剔除不可靠点。通过实验验证,该算法与Baris算法相比较,其在精度与速度方面都有所提高。 展开更多
关键词 米字型窗口 连通标记 中值滤波 立体匹配
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部