期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
基于集成学习和二维关联边条件随机场的Web数据语义标注方法 被引量:6
1
作者 丁艳辉 李庆忠 +1 位作者 董永权 彭朝晖 《计算机学报》 EI CSCD 北大核心 2010年第2期267-278,共12页
大规模Web信息抽取需要准确、自动地从众多相关网站上抽取Web数据对象.现有的Web信息抽取方法主要针对单个网站进行处理,无法适应大规模Web信息抽取的需要.调查研究表明,有效地实现Web数据语义自动标注,结合现有的包装器生成技术,可以... 大规模Web信息抽取需要准确、自动地从众多相关网站上抽取Web数据对象.现有的Web信息抽取方法主要针对单个网站进行处理,无法适应大规模Web信息抽取的需要.调查研究表明,有效地实现Web数据语义自动标注,结合现有的包装器生成技术,可以满足大规模Web信息抽取的要求.文中提出一种基于集成学习和二维关联边条件随机场的Web数据语义自动标注方法,首先,利用已抽取的信息和目标网站训练页面中呈现的特征构造多个分类器,使用Dempster合成法则合并分类器结果,区分训练页面中的属性标签和数据元素;然后,利用二维关联边条件随机场模型对Web数据元素间的长距离依赖联系和短距离依赖联系进行建模,实现数据元素的自动语义标注.通过在多个领域真实数据集上的实验结果表明,所提出的方法可以高效地解决Web数据语义自动标注问题,满足大规模Web信息抽取的需要. 展开更多
关键词 WEB信息抽取 语义标注 集成学习 条件随机场 长距离依赖
下载PDF
基于复杂性度量与多尺度运动编码的图像动作识别算法 被引量:6
2
作者 邬厚民 程谆 《光学技术》 CAS CSCD 北大核心 2018年第4期427-434,共8页
人体动作的识别与理解是人机交互、机器人应用的关键技术之一,为了提高人体各种复杂动作的识别精度与鲁棒性,研究了基于复杂性度量与多尺度运动编码的动作识别技术。通过不同长度的滑动窗口对视频序列获取子序列;通过时间序列复杂性来... 人体动作的识别与理解是人机交互、机器人应用的关键技术之一,为了提高人体各种复杂动作的识别精度与鲁棒性,研究了基于复杂性度量与多尺度运动编码的动作识别技术。通过不同长度的滑动窗口对视频序列获取子序列;通过时间序列复杂性来度量人体运动轨迹,设计了一种多尺度的滑动窗口,从而选择出有效子序列;基于有效子序列,引入k-均值聚类分析算法,对人体运动进行编码,获取运动编码直方图;引入条件随机场对动作分类学习,完成动作识别与理解。所提出的算法在人机交互、智能家居、视频监控等领域具有较好的参考价值。 展开更多
关键词 图像动作识别 复杂性度量 多尺度运动 运动编码 K-均值聚类 条件随机场分类
原文传递
基于分治策略的组块分析 被引量:6
3
作者 周俏丽 刘新 +1 位作者 郎文静 蔡东风 《中文信息学报》 CSCD 北大核心 2012年第5期120-128,共9页
组块分析的主要任务是语块的识别和划分,它使句法分析的任务在某种程度上得到简化。针对长句子组块分析所遇到的困难,该文提出了一种基于分治策略的组块分析方法。该方法的基本思想是首先对句子进行最长名词短语识别,根据识别的结果,将... 组块分析的主要任务是语块的识别和划分,它使句法分析的任务在某种程度上得到简化。针对长句子组块分析所遇到的困难,该文提出了一种基于分治策略的组块分析方法。该方法的基本思想是首先对句子进行最长名词短语识别,根据识别的结果,将句子分解为最长名词短语部分和句子框架部分;然后,针对不同的分析单元选用不同的模型加以分析,再将分析结果进行组合,完成整个组块分析过程。该方法将整句分解为更小的组块分析单元,降低了句子的复杂度。通过在宾州中文树库CTB4数据集上的实验结果显示,各种组块识别结果平均F1值结果为91.79%,优于目前其他的组块分析方法。 展开更多
关键词 汉语组块分析 分治策略 句法分析 最长名词短语 条件随机场 支持向量机
下载PDF
基于单字提示特征的中文命名实体识别快速算法 被引量:24
4
作者 冯元勇 孙乐 +1 位作者 李文波 张大鲲 《中文信息学报》 CSCD 北大核心 2008年第1期104-110,共7页
近年来条件随机场(CRF)模型在自然语言处理中的应用越来越广泛。标准的线性链(Linear-chain)模型一般采用L-BFGS参数估计方法,收敛速度慢。本文在分析模型复杂度的基础上提出了一种改进的快速CRF算法。该算法通过引入小规模单字特征降... 近年来条件随机场(CRF)模型在自然语言处理中的应用越来越广泛。标准的线性链(Linear-chain)模型一般采用L-BFGS参数估计方法,收敛速度慢。本文在分析模型复杂度的基础上提出了一种改进的快速CRF算法。该算法通过引入小规模单字特征降低特征的规模,并通过在推理过程中引入任务相关的人工知识压缩Viterbi和Baum-Welch格搜索空间,提高了训练的速度。在中文863命名实体识别评测语料和SIGHAN06语料集上进行的实验表明,该算法在不影响中文命名实体识别精度的同时,有效地降低了模型的训练代价。 展开更多
关键词 计算机应用 中文信息处理 中文命名实体识别 条件随机场 自然语言处理 机器学习
下载PDF
词位标注汉语分词中特征模板定量研究 被引量:4
5
作者 于江德 王希杰 樊孝忠 《计算机工程与设计》 CSCD 北大核心 2012年第3期1239-1244,共6页
基于字的词位标注的方法能极大地提高汉语分词的性能,该方法将汉语分词转化为字的词位标注问题,词位标注汉语分词中特征模板的设定至关重要,为了更加准确地设定特征模板,从多个角度进行了定量分析,并在国际汉语分词评测Bakeoff2005的PKU... 基于字的词位标注的方法能极大地提高汉语分词的性能,该方法将汉语分词转化为字的词位标注问题,词位标注汉语分词中特征模板的设定至关重要,为了更加准确地设定特征模板,从多个角度进行了定量分析,并在国际汉语分词评测Bakeoff2005的PKU和MSRA两种语料上进行了封闭测试,得到如下结论:同等条件下,训练出的模型大小与扩展出的特征数成正比;不同的单字特征模板在同一语料中扩展出的特征数基本相同,单字特征模板对分词性能的贡献要比双字特征模板小得多;增加B特征模板之后,训练时间大大增加,模型大小基本不变,对分词性能都是正增长。 展开更多
关键词 汉语分词 词位标注 特征模板 定量分析 条件随机场
下载PDF
基于条件随机场的语气词用法自动识别研究 被引量:1
6
作者 周溢辉 昝红英 穆玲玲 《计算机工程与设计》 CSCD 北大核心 2011年第11期3929-3932,F0003,共5页
研究了基于条件随机场的语气词用法自动识别,把语气词用法识别问题看作序列标注任务,将语气词上下文的词语、词性以及词语和词性的复合作为特征建立特征模板来确定语气词的用法。实验数据表明,与规则方法相比,大部分常用语气词的常用用... 研究了基于条件随机场的语气词用法自动识别,把语气词用法识别问题看作序列标注任务,将语气词上下文的词语、词性以及词语和词性的复合作为特征建立特征模板来确定语气词的用法。实验数据表明,与规则方法相比,大部分常用语气词的常用用法的识别准确率有了明显的提升,该方法在语气词用法识别任务中具有一定的有效性。 展开更多
关键词 自然语言处理 虚词知识库 语气词 用法识别 统计 条件随机场
下载PDF
基于生成对抗网络的漫画草稿图简化 被引量:12
7
作者 卢倩雯 陶青川 +1 位作者 赵娅琳 刘蔓霄 《自动化学报》 EI CSCD 北大核心 2018年第5期840-854,共15页
在漫画绘制的过程中,按草稿绘制出线条干净的线稿是很重要的一环.现有的草图简化方法已经具有一定的线条简化能力,然而由于草图的绘制方式的多样性以及画面复杂程度的不同,这些方法适用范围有限且效果不理想.本文提出了一种新颖的草图... 在漫画绘制的过程中,按草稿绘制出线条干净的线稿是很重要的一环.现有的草图简化方法已经具有一定的线条简化能力,然而由于草图的绘制方式的多样性以及画面复杂程度的不同,这些方法适用范围有限且效果不理想.本文提出了一种新颖的草图简化方法,利用条件随机场(Conditional random field,CRF)和最小二乘生成式对抗网络(Least squares generative adversarial networks,LSGAN)理论搭建了深度卷积神经网络的草图简化模型,通过该网络生成器与判别器之间的零和博弈与条件约束,得到更加接近真实的简化线稿图.同时,为了训练对抗模型的草图简化能力,本文建立了包含更多绘制方式与不同内容的草图与简化线稿图对的训练数据集.实验表明,本文算法对于复杂情况下的草图,相比于目前的方法,具有更好的简化效果. 展开更多
关键词 草图简化 最小二乘生成式对抗网络 深度学习 条件随机场
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部