期刊文献+
共找到11篇文章
< 1 >
每页显示 20 50 100
基于重复模式的自动Web信息抽取 被引量:8
1
作者 胡仁龙 袁春风 +1 位作者 武港山 濮小佳 《计算机工程》 CAS CSCD 北大核心 2008年第22期73-76,共4页
互联网上存在很多在线购物网站,抽取这类网站页面里的商品信息可以为电子商务、Web查询提供增值服务。该文针对这类网站提出一种自动的Web信息抽取方法,通过检测网页中的重复模式以及分析主题内容的特征获取网页的主题内容,该方法在抽... 互联网上存在很多在线购物网站,抽取这类网站页面里的商品信息可以为电子商务、Web查询提供增值服务。该文针对这类网站提出一种自动的Web信息抽取方法,通过检测网页中的重复模式以及分析主题内容的特征获取网页的主题内容,该方法在抽取过程中不需要人工干预。对10个在线购物网站进行了测试,实验结果表明提出的方法是有效的。 展开更多
关键词 WEB信息抽取 DOM树 重复模式
下载PDF
基于迭代算法的新词识别 被引量:7
2
作者 赵小宝 张华平 《计算机工程》 CAS CSCD 2014年第7期154-158,164,共6页
新词识别是中文信息处理的重要基础,但中文字符极强的构词能力给新词检测带来较大困难。受对偶原理的启发,提出一种基于迭代算法的新词识别算法。对目标语料进行分词和词性标注,通过两遍扫描进行字符串统计并提取重复模式。结合词语结... 新词识别是中文信息处理的重要基础,但中文字符极强的构词能力给新词检测带来较大困难。受对偶原理的启发,提出一种基于迭代算法的新词识别算法。对目标语料进行分词和词性标注,通过两遍扫描进行字符串统计并提取重复模式。结合词语结构的特征,迭代使用重复模式互信息、左(右)熵,左(右)邻右(左)平均熵等特征进行新词识别,获得候选新词列表。利用中文词语搭配库对候选新词列表进行最后一次过滤得到最终新词列表。实验结果表明,利用该方法进行新词识别,P@10值达到100%,P@100值提高至90%,左(右)邻右(左)平均熵可在一定程度上提高新词识别的准确率。 展开更多
关键词 对偶原理 新词识别 迭代算法 信息熵 重复模式 中文词语搭配库
下载PDF
DnaReSM:一个基于多支持度的DNA重复序列挖掘算法 被引量:4
3
作者 熊赟 陈越 朱扬勇 《计算机科学》 CSCD 北大核心 2007年第2期211-212,F0004,共3页
DNA序列分析研究是生物信息学的重要内容之一。基因组的基因相关区域和基因外区域中含有大量重复序列,尽管目前大多数重复序列的功能还没能肯定,但它们在遗传分析中已起重要作用。挖掘DNA重复序列成为DNA序列分析的关键。自底向上的挖... DNA序列分析研究是生物信息学的重要内容之一。基因组的基因相关区域和基因外区域中含有大量重复序列,尽管目前大多数重复序列的功能还没能肯定,但它们在遗传分析中已起重要作用。挖掘DNA重复序列成为DNA序列分析的关键。自底向上的挖掘算法中间过程产生很多短的、甚至单字符的模式,使得挖掘效率降低;另一方面,目前序列模式挖掘算法在多序列挖掘中表现出高效性,但由于单支持度定义的局限导致无法在挖掘过程中同时找到单条DNA序列中的重复序列,因此不能很好地适用于DNA重复序列挖掘。本文基于新的多支持度序列模式挖掘框架,提出了一种融合自底向上和自顶向下策略挖掘DNA重复序列的新算法DnaReSM,其结果为生物学相关实验提供基础。实验结果表明,DnaReSM探测算法能有效挖掘DNA重复序列。 展开更多
关键词 数据挖掘 DNA序列 重复序列 序列模式
下载PDF
基于近似距离序的重复模式图像匹配算法 被引量:3
4
作者 唐俊 周洪伟 +1 位作者 梁栋 王年 《电子与信息学报》 EI CSCD 北大核心 2012年第12期3034-3039,共6页
由于重复模式图像局部信息的歧义性,即使在视角变化很小的情况下,仅通过比较局部描述子之间的相似性得到的匹配结果往往并不可靠。为了解决这个问题,该文根据特征点空间的分布特性,给出了一种新颖的几何相容性表示方法——近似距离序;... 由于重复模式图像局部信息的歧义性,即使在视角变化很小的情况下,仅通过比较局部描述子之间的相似性得到的匹配结果往往并不可靠。为了解决这个问题,该文根据特征点空间的分布特性,给出了一种新颖的几何相容性表示方法——近似距离序;结合利用局部描述子获得的匹配代价,定义了一种混合形式的目标函数,将匹配问题转化为一对一约束下的优化问题;最后,通过概率松弛法求解目标函数的极大值,获得特征点之间的对应关系。在不同类型图像上的比较实验表明,所提出的方法能够有效地解决重复模式图像匹配问题。 展开更多
关键词 图像处理 图像匹配 重复模式 几何相容性 概率松弛
下载PDF
TYPICAL STRUCTURES FOR LEARNING CONTROL
5
作者 Cai Zixing 《Journal of Central South University》 SCIE EI CAS 1998年第1期61-64,共4页
Some typical structural schemes of learning control have been investigated.The schemes involve the pattern recognitionbased learning control,iterative learning control,repetitive learning control,and connectionist lea... Some typical structural schemes of learning control have been investigated.The schemes involve the pattern recognitionbased learning control,iterative learning control,repetitive learning control,and connectionist learning control,etc.This study focuses on the control mechanism and provides a basis for potential applications.Most of the structural schemes have been applied to various control fields. 展开更多
关键词 LEARNING CONTROL pattern recognition ITERATIVE LEARNING repetitive LEARNING CONNECTIONIST LEARNING
下载PDF
论《诗经》四言建构中音节的重复模式与音律意趣
6
作者 周义平 《嘉应学院学报》 2019年第5期72-78,共7页
《诗经》是中国上古成熟的、最早的四言诗总集,其四言句达到92%之多,为了促成四言建构的格局,《诗经》作者采取了添加音节衬字、紧缩句子成分、重复语辞音节等手段。在全面考察《诗经》重复语辞音节建构四言这一重要手段时,发现这种手... 《诗经》是中国上古成熟的、最早的四言诗总集,其四言句达到92%之多,为了促成四言建构的格局,《诗经》作者采取了添加音节衬字、紧缩句子成分、重复语辞音节等手段。在全面考察《诗经》重复语辞音节建构四言这一重要手段时,发现这种手段建构的四言句有三种的独特模式,即相同音节隔字重复、相同音节紧相重叠、相同音节跨句相应。而这三种独特模式因语辞音节在四言诗句的相应位置重复出现,却产生独特的音情效应和音律意趣。 展开更多
关键词 《诗经》 四言 音节 重复模式 音律意趣
下载PDF
面向数字印花图像的重复模式发现方法
7
作者 王爽 袁苇航 《计算机应用与软件》 北大核心 2020年第12期32-36,82,共6页
工业印染中的印花图样,个性化创作要求高,印染企业设计成本负担重。为了更加智能化辅助印花图样生成,降低印花企业设计成本,提出一种针对多类别多尺度问题的对象重复模式发现方法。定义印花图样的重复模式基本表示;运用对象“内容一致... 工业印染中的印花图样,个性化创作要求高,印染企业设计成本负担重。为了更加智能化辅助印花图样生成,降低印花企业设计成本,提出一种针对多类别多尺度问题的对象重复模式发现方法。定义印花图样的重复模式基本表示;运用对象“内容一致性”与“空间结构一致性”发现印花图像中的重复模式;经过多次迭代计算得到印花图像中的重复对象,从而生成印花图样。实验表明,该方法解决了印花图像中重复对象之间存在的类别和尺度问题,并能够准确地发现印花图像中重复模式实例。 展开更多
关键词 重复模式 对象发现 数字印花 内容一致性 空间结构一致性
下载PDF
安徽蒙城方言的“可”字句 被引量:19
8
作者 胡利华 《方言》 CSSCI 北大核心 2008年第3期263-267,共5页
蒙城方言的疑问副词"可"主要是和谓词性成分构成"可VP"反复问句,同时"可"又有些灵活运用的形式,表示非疑问的意义。
关键词 蒙城方言 副词“可” “可VP”式反复问句 “可”其他格式
原文传递
改进仿射尺度不变特征变换算法的图像配准 被引量:6
9
作者 范雪婷 张磊 赵朝贺 《计算机应用》 CSCD 北大核心 2014年第5期1449-1452,共4页
为了更好地处理匹配效率、重复纹理匹配和仿射不变性匹配等问题,对完全仿射不变特征变换(ASIFT)算法进行两方面改进。匹配框架中特征提取的改进提高了ASIFT算法的匹配效率;利用优化随机采样算法(ORSA)结合以单应矩阵为几何线性约束模型... 为了更好地处理匹配效率、重复纹理匹配和仿射不变性匹配等问题,对完全仿射不变特征变换(ASIFT)算法进行两方面改进。匹配框架中特征提取的改进提高了ASIFT算法的匹配效率;利用优化随机采样算法(ORSA)结合以单应矩阵为几何线性约束模型的随机抽样一致性(RANSAC)改进匹配算法,提高了匹配精度和重复纹理结构的适应能力。实验结果表明,提出的改进算法能较好地匹配高度相似纹理,计算量小,计算速度快且精度高。 展开更多
关键词 图像配准 仿射尺度不变特征变换算法 单应矩阵 重复纹理匹配
下载PDF
基于广义后缀树的最长重复子模式算法
10
作者 柳渤 李建中 《航天控制》 CSCD 北大核心 2008年第2期74-78,共5页
最长重复子串问题是字符串处理中的一个经典问题,是许多应用的基础。但有些时候人们不只关心相等的子串对,还要查找具有某种其他关系的子串对。例如在DNA序列中通常关心字符串和它的补串。这种联系可以看成是一个字符串经过某种置换后... 最长重复子串问题是字符串处理中的一个经典问题,是许多应用的基础。但有些时候人们不只关心相等的子串对,还要查找具有某种其他关系的子串对。例如在DNA序列中通常关心字符串和它的补串。这种联系可以看成是一个字符串经过某种置换后与另一个字符串相等。因此本文定义了单一置换下的最长重复子模式和最长重复子模式两个问题,提出了基于广义后缀树的算法来解决这两个问题,并在理论上分析了它们的时间复杂性和空间复杂性。 展开更多
关键词 最长重复子模式 后缀树 置换
下载PDF
一种基于逆序匹配重复模式的主题信息提取方法
11
作者 伍杰华 倪振声 陈有青 《计算机应用与软件》 CSCD 北大核心 2013年第4期88-91,共4页
网页中的信息主要以重复的HTML结构进行组织并形成一致的展现形式,主要研究具备复杂重复模式的网页主题信息块识别,提出一种改进的基于逆序匹配重复模式的算法。该算法依据HTML标签结构和class属性改进DOM树,重构页面的向量空间模型,逆... 网页中的信息主要以重复的HTML结构进行组织并形成一致的展现形式,主要研究具备复杂重复模式的网页主题信息块识别,提出一种改进的基于逆序匹配重复模式的算法。该算法依据HTML标签结构和class属性改进DOM树,重构页面的向量空间模型,逆序匹配重复结构模式并完成对主题信息的提取。实验结果表明,该方法能准确识别复杂页面结构中主题重复模式,有效避免非主题重复模式的干扰,有较好的召回率和准确率。 展开更多
关键词 信息提取 重复模式 主题识别 逆序匹配
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部