期刊文献+
共找到553篇文章
< 1 2 28 >
每页显示 20 50 100
基于奇异值分解的数字图像水印方法 被引量:217
1
作者 刘瑞祯 谭铁牛 《电子学报》 EI CAS CSCD 北大核心 2001年第2期168-171,共4页
随着计算机和网络技术的飞速发展 ,数字图像、音频和视频产品愈来愈需要一种有效的版权保护方法 ,另外通信系统在网络环境下的信息安全问题也日益显露出来 .数字图像水印技术为上述问题提供了一个潜在的解决方案 .所谓水印技术就是将数... 随着计算机和网络技术的飞速发展 ,数字图像、音频和视频产品愈来愈需要一种有效的版权保护方法 ,另外通信系统在网络环境下的信息安全问题也日益显露出来 .数字图像水印技术为上述问题提供了一个潜在的解决方案 .所谓水印技术就是将数字、序列号、文字、图像标志等版权信息嵌入到多媒体数据中 ,以起到版权保护、秘密通信、数据文件的真伪鉴别和产品标志等作用 .本文提出了一种新的基于奇异值分解的数字水印算法并且对该方法的理论基础给出分析 . 展开更多
关键词 数字水印 奇异值分解 鲁棒性 数字图像水印
下载PDF
基于语义理解的文本相似度算法 被引量:79
2
作者 金博 史彦军 滕弘飞 《大连理工大学学报》 EI CAS CSCD 北大核心 2005年第2期291-297,共7页
相似度的计算在信息检索及文档复制检测等领域具有广泛的应用前景.研究了文本相似度的计算方法,在知网语义相似度的基础上,将基于语义理解的文本相似度计算推广到段落范围,进而可以将这种段落相似度推广到篇章相似度计算.给出了文本(包... 相似度的计算在信息检索及文档复制检测等领域具有广泛的应用前景.研究了文本相似度的计算方法,在知网语义相似度的基础上,将基于语义理解的文本相似度计算推广到段落范围,进而可以将这种段落相似度推广到篇章相似度计算.给出了文本(包括词语、句子、段落)相似度的计算公式及算法,用于计算两文本之间的相似度.实例验证表明,该算法与现有典型的相似度计算方法相比,计算准确性得到提高. 展开更多
关键词 语义理解 相似度算法 相似度计算 计算方法 文本相似度 语义相似度 信息检索 实例验证 计算公式 准确性 文档 知网
下载PDF
微博文本处理研究综述 被引量:55
3
作者 张剑峰 夏云庆 姚建民 《中文信息学报》 CSCD 北大核心 2012年第4期21-27,42,共8页
微博是一个基于关系的信息分享、传播以及获取平台。用户可以通过WEB、WAP以及各种客户端组件,以140字左右的文字更新信息,并实现即时分享。由于微博发展迅猛,微博文本已经形成了大规模积累,针对微博文本的研究已经成为了一个十分重要... 微博是一个基于关系的信息分享、传播以及获取平台。用户可以通过WEB、WAP以及各种客户端组件,以140字左右的文字更新信息,并实现即时分享。由于微博发展迅猛,微博文本已经形成了大规模积累,针对微博文本的研究已经成为了一个十分重要的课题。该文对微博文本进行了定义,阐述了微博文本研究的重要性,并从微博文本的不同应用领域出发,对微博文本的研究现状进行了综述,介绍了目前已经存在的微博文本数据集和应用系统。 展开更多
关键词 微博文本 语言分析 文本处理
下载PDF
用神经阵列网络进行文本无关的说话人识别 被引量:14
4
作者 岳喜才 伍晓宇 郑崇勋 《声学学报》 EI CSCD 北大核心 2000年第3期230-234,共5页
提出了一种可用于说话人识别的神经阵列网络,它以仅完成两类模式区分的小型网络作为子网络,再将单个子网络组合成阵列形式来完成多类模式的区分。文中给出了阵列网络的构成及搜索算法,并使用径向基函数(RBF)阵列网络进行了文本... 提出了一种可用于说话人识别的神经阵列网络,它以仅完成两类模式区分的小型网络作为子网络,再将单个子网络组合成阵列形式来完成多类模式的区分。文中给出了阵列网络的构成及搜索算法,并使用径向基函数(RBF)阵列网络进行了文本无关的说话人识别的研究。实验显示,对 20名说话人,用 5秒语音训练, 2秒语音识别时,该方法可达到 98%的正确识别率。 展开更多
关键词 神经阵列网络 文本 说话人识别 语音识别
下载PDF
基于融合的数据隐藏算法 被引量:20
5
作者 柳葆芳 平西建 邓宇虹 《电子学报》 EI CAS CSCD 北大核心 2001年第11期1445-1448,共4页
本文在讨论基于融合的数字图像隐藏技术算法的基础上 ,提出了一种基于融合的数据隐藏算法 .该算法利用一次B啨zier曲线 ,将秘密数据隐藏在原始图像中 .该算法可以在数字图像中嵌入任意形式的数字化数据 ,在选取适当的参数时 ,可以... 本文在讨论基于融合的数字图像隐藏技术算法的基础上 ,提出了一种基于融合的数据隐藏算法 .该算法利用一次B啨zier曲线 ,将秘密数据隐藏在原始图像中 .该算法可以在数字图像中嵌入任意形式的数字化数据 ,在选取适当的参数时 ,可以完全正确地恢复出数字化数据 .该算法的特点是数据隐藏能力强 ,在以灰度图像为原始图像的情况下 ,其最大隐藏能力可以达到 3bits/pixel. 展开更多
关键词 信息隐藏 数据隐藏 融合 算法 信息安全技术
下载PDF
基于灰度直方图和谱聚类的文本图像二值化方法 被引量:28
6
作者 吴锐 黄剑华 +1 位作者 唐降龙 刘家锋 《电子与信息学报》 EI CSCD 北大核心 2009年第10期2460-2464,共5页
在自动文本提取中,经定位获得的字符区域需二值化后方能有效识别,由于背景的复杂,常用的阈值化方法不能有效分割自然环境下的字符图像。该文提出了一种基于谱聚类的图像二值化方法,该方法利用规范化切痕(Normalizedcut,Ncut)作为谱聚类... 在自动文本提取中,经定位获得的字符区域需二值化后方能有效识别,由于背景的复杂,常用的阈值化方法不能有效分割自然环境下的字符图像。该文提出了一种基于谱聚类的图像二值化方法,该方法利用规范化切痕(Normalizedcut,Ncut)作为谱聚类测度,结合灰度直方图计算相似性矩阵,并通过实验确定最佳的直方图等级数,与通常基于像素级相似矩阵相比,算法的空间复杂度和计算复杂性都大为降低。实验结果表明,针对自然场景下的字符图像,该文方法的二值化结果优于常用的阈值分割结果。 展开更多
关键词 图像处理 文本图像 二值化 图分割 谱聚类
下载PDF
几种常用文本分类算法性能比较与分析 被引量:31
7
作者 卢苇 彭雅 《湖南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2007年第6期67-69,共3页
分析了几种典型的文本分类算法的特点,并基于中文文本数据集和英文文本数据集对算法性能进行了综合评价.实验结果表明:对于英文文本数据,支持向量机具有最优的性能,但时间开销最大,贝叶斯算法速度较快;对于中文文本数据,由于分词的困难... 分析了几种典型的文本分类算法的特点,并基于中文文本数据集和英文文本数据集对算法性能进行了综合评价.实验结果表明:对于英文文本数据,支持向量机具有最优的性能,但时间开销最大,贝叶斯算法速度较快;对于中文文本数据,由于分词的困难,使得算法性能普遍低于同等规模下在英文数据集上的性能.几种算法性能均随训练集规模的增大而有改善. 展开更多
关键词 文本分类 支持向量机 K近邻 贝叶斯算法 TFIDF算法
下载PDF
基于Web数据的农业网络信息自动采集与分类系统 被引量:34
8
作者 段青玲 魏芳芳 +1 位作者 张磊 肖晓琰 《农业工程学报》 EI CAS CSCD 北大核心 2016年第12期172-178,共7页
为了快速、高效地获取农业Web信息,解决信息孤岛和信息不对称的问题,重点研究了农业Web数据自动采集与抽取、基于SVM(support vector machine)的文本分类、物联网异构数据采集等技术,并采用统一建模语言(unified modeling language,UML... 为了快速、高效地获取农业Web信息,解决信息孤岛和信息不对称的问题,重点研究了农业Web数据自动采集与抽取、基于SVM(support vector machine)的文本分类、物联网异构数据采集等技术,并采用统一建模语言(unified modeling language,UML)描述了农业网络信息自动采集与分类系统。该系统实现了农业网站、物联网数据的自动抓取和共享,为用户提供农业资讯、农产品市场行情、供求信息在线查询,环境数据实时监测和个性化信息服务等功能。应用结果表明,该系统对样本集网站的信息抓取准确率为98.2%,资讯分类准确率为92.5%,具有数据采集实时性强、用户参与度好、通用性高等特点,该系统为农业信息整合和服务提供参考。 展开更多
关键词 农业 文本处理 采集系统 信息 物联网
下载PDF
文本自动分类技术研究综述 被引量:33
9
作者 庞观松 蒋盛益 《情报理论与实践》 CSSCI 北大核心 2012年第2期123-128,共6页
文章从文本表示、特征选择、分类算法、常用基准语料以及评估指标等方面对近年来的研究成果进行综述并讨论。认为短文本分类和多语言文本分类管理是新出现的重要且紧迫的问题,并对这两个问题以及数据集偏斜、多层分类、标注瓶颈等几个... 文章从文本表示、特征选择、分类算法、常用基准语料以及评估指标等方面对近年来的研究成果进行综述并讨论。认为短文本分类和多语言文本分类管理是新出现的重要且紧迫的问题,并对这两个问题以及数据集偏斜、多层分类、标注瓶颈等几个关键问题进行重点讨论。最后总结并展望这些研究内容。 展开更多
关键词 自动分类 文本分类 文本处理 综述
原文传递
一种基于内容的信息过滤改进模型 被引量:22
10
作者 苏贵洋 马颖华 李建华 《上海交通大学学报》 EI CAS CSCD 北大核心 2004年第12期2030-2034,共5页
根据过滤系统的不同过滤目的,将信息过滤分为两类:(1)基于满足用户信息需求的用户兴趣过滤;(2)基于保障数据安全和社会安全的安全过滤.在详细分析了这两类信息过滤的异同之后,指出了安全过滤研究的特殊性及其主要研究内容.在现有用户兴... 根据过滤系统的不同过滤目的,将信息过滤分为两类:(1)基于满足用户信息需求的用户兴趣过滤;(2)基于保障数据安全和社会安全的安全过滤.在详细分析了这两类信息过滤的异同之后,指出了安全过滤研究的特殊性及其主要研究内容.在现有用户兴趣过滤系统模型的基础上,提出了一个基于内容的信息过滤模型,并对模型中新增模块进行了试验.研究结果表明,新增模块能够很好地实现基于内容过滤系统的高精度,证明了该过滤模型具有一定的实用价值. 展开更多
关键词 信息过滤 网络内容安全 用户过滤 安全过滤
下载PDF
文本阅读双加工理论与实验证据 被引量:27
11
作者 莫雷 王瑞明 冷英 《心理学报》 CSSCI CSCD 北大核心 2012年第5期569-584,共16页
文本阅读信息加工过程研究一直是国内外心理学界高度重视和关注的领域,形成了建构主义理论、最低限度假设理论和记忆基础文本加工理论等派别百家争鸣的局面。这些理论争议的焦点在于自然阅读是主动的、积极的、目标策略驱动的过程,还是... 文本阅读信息加工过程研究一直是国内外心理学界高度重视和关注的领域,形成了建构主义理论、最低限度假设理论和记忆基础文本加工理论等派别百家争鸣的局面。这些理论争议的焦点在于自然阅读是主动的、积极的、目标策略驱动的过程,还是被动的、消极的、自动的过程。在全面总结国内外心理学界有关文本阅读的研究成果的基础上,文本阅读双加工理论提出并对文本阅读的主要争议进行了整合。该理论的核心观点是文本的自然阅读过程是连贯阅读与焦点阅读的双加工过程。文本阅读中读者所阅读的材料特点不同,引发的阅读信息加工活动也不同,而不同性质的阅读过程,又会引发不同的推理整合,从而会建构不同类型的文本表征。文本阅读双加工理论已经形成了比较完整的理论框架,并获得了很多实验证据的支持。当然,文本阅读双加工理论作为一个新的理论,其中的有些观点还需要进一步检验。在未来的文本阅读研究领域,有很多问题还需要研究者进一步关注。 展开更多
关键词 文本阅读 信息加工 连贯阅读 焦点阅读
下载PDF
文本阅读研究百年回顾 被引量:20
12
作者 莫雷 王穗苹 王瑞明 《华南师范大学学报(社会科学版)》 CSSCI 北大核心 2006年第5期128-140,共13页
文本阅读理解是阅读心理研究的核心内容,是心理学界长期重视和关注的重要课题。一个世纪以来,研究者们发展了各种精细的、实时的研究方法和技术,对文本阅读过程中静态的表征与动态的加工过程进行深入探索,提出了许多理论与模型。近年来... 文本阅读理解是阅读心理研究的核心内容,是心理学界长期重视和关注的重要课题。一个世纪以来,研究者们发展了各种精细的、实时的研究方法和技术,对文本阅读过程中静态的表征与动态的加工过程进行深入探索,提出了许多理论与模型。近年来,围绕着读者在阅读过程中如何激活与整合信息,更形成了文本阅读的双加工模型与风景模型两个综合性理论。这些理论与模型,除了能极大地深化人们对文本阅读加工过程的认识,还将有助于未来文本信息处理技术的开发和应用。 展开更多
关键词 文本阅读 阅读心理 表征 加工
下载PDF
自然场景文本定位 被引量:17
13
作者 欧文武 朱军民 刘昌平 《中文信息学报》 CSCD 北大核心 2004年第5期42-47,63,共7页
随着自然场景文本识别研究的不断深入 ,建立标准的场景文本图像库和了解该领域的研究现状变得越来越重要。为此 ,2 0 0 3年国际文档分析和识别大会专门建立了一个这样的图像库 ,并组织了自然场景文本识别比赛 ,我们参加了其中的自然场... 随着自然场景文本识别研究的不断深入 ,建立标准的场景文本图像库和了解该领域的研究现状变得越来越重要。为此 ,2 0 0 3年国际文档分析和识别大会专门建立了一个这样的图像库 ,并组织了自然场景文本识别比赛 ,我们参加了其中的自然场景文本定位分赛。本文对我们参加这次比赛的算法做了介绍并给出了比赛结果 ,在文章最后 ,对参赛算法做了比较 。 展开更多
关键词 人工智能 模式识别 文本定位 边缘密度 字符识别 图像处理
下载PDF
基于特征信息增益权重的文本分类算法 被引量:19
14
作者 李文斌 刘椿年 陈嶷瑛 《北京工业大学学报》 EI CAS CSCD 北大核心 2006年第5期456-460,共5页
为了在分类精度不受损失的情况下提高训练速度,设计了3种基于信息增益(information gain,简称IG) 特征权重的分类算法,分别被命名为:IG-C1、IG-C2、IG-C.它们根据特征对IG贡献的大小及在新文本中出现的次数进行分类.这3种算法都具有... 为了在分类精度不受损失的情况下提高训练速度,设计了3种基于信息增益(information gain,简称IG) 特征权重的分类算法,分别被命名为:IG-C1、IG-C2、IG-C.它们根据特征对IG贡献的大小及在新文本中出现的次数进行分类.这3种算法都具有较低的时间复杂度和实现简单的特点.实验结果表明,其中IG-C的分类效果最为理想. 展开更多
关键词 文本处理 信息分类 特征提取
下载PDF
自动术语抽取研究综述 被引量:23
15
作者 张雪 孙宏宇 +2 位作者 辛东兴 李翠平 陈红 《软件学报》 EI CSCD 北大核心 2020年第7期2062-2094,共33页
自动术语抽取是从文本集合中自动抽取领域相关的词或短语,是本体构建、文本摘要、知识图谱等领域的关键基础问题和研究热点.特别是,随着近年来对非结构化文本大数据研究的兴起,使得自动术语抽取技术进一步得到学者的广泛关注,取得了较... 自动术语抽取是从文本集合中自动抽取领域相关的词或短语,是本体构建、文本摘要、知识图谱等领域的关键基础问题和研究热点.特别是,随着近年来对非结构化文本大数据研究的兴起,使得自动术语抽取技术进一步得到学者的广泛关注,取得了较为丰富的研究成果.以术语排序算法为主线,对自动术语抽取方法的理论、技术、现状及优缺点进行研究综述:首先概述了自动术语抽取问题的形式化定义和解决框架.然后围绕"浅层语言分析"中基础语言信息和关系结构信息两个层面的特征对近年来国内外的研究成果进行分类,系统总结了现有自动术语抽取方法的研究进展和面临的挑战.最后对术语抽取使用的数据资源及实验评价进行分析,并对自动术语抽取未来可能的研究趋势进行了探讨与展望. 展开更多
关键词 自动术语抽取 术语识别 文本处理 机器学习
下载PDF
视频中的文字探测 被引量:13
16
作者 王辰 老松杨 胡晓峰 《小型微型计算机系统》 CSCD 北大核心 2002年第4期478-481,共4页
视频中出现的文字往往包含大量的信息 ,是视频分析的重要语义线索 ,探测并识别出来的文字可以为基于内容的视频检索提供索引 .本文简要介绍了目前现有的一些文字探测的方法 ,结合视频中出现的文字的特点 ,提出了一种较为高效的视频文字... 视频中出现的文字往往包含大量的信息 ,是视频分析的重要语义线索 ,探测并识别出来的文字可以为基于内容的视频检索提供索引 .本文简要介绍了目前现有的一些文字探测的方法 ,结合视频中出现的文字的特点 ,提出了一种较为高效的视频文字探测方法 ,该方法在一般图像质量的条件下对中、英文文字都有较好的探测效果 . 展开更多
关键词 文字探测 视频分析 边缘检测 图像处理 视频检索
下载PDF
术语自动抽取方法研究综述 被引量:19
17
作者 袁劲松 张小明 李舟军 《计算机科学》 CSCD 北大核心 2015年第8期7-12,共6页
术语抽取是文本处理领域的一项基础性研究工作,好的术语自动抽取方法能够提高本体构建的质量和语义检索的精度。首先,对术语的定义、特性以及术语抽取效果的评价方法进行了概述。然后,在分析和总结近20年术语自动抽取相关文献的基础上,... 术语抽取是文本处理领域的一项基础性研究工作,好的术语自动抽取方法能够提高本体构建的质量和语义检索的精度。首先,对术语的定义、特性以及术语抽取效果的评价方法进行了概述。然后,在分析和总结近20年术语自动抽取相关文献的基础上,对术语自动抽取的各种方法进行了详细的综述。介绍了这些方法的研究进展,分析了其优缺点,并详细描述了部分经典算法。最后,对术语自动抽取未来研究的趋势进行了展望。 展开更多
关键词 术语抽取 文本处理 评价方法 自动抽取方法
下载PDF
文本处理中的MapReduce技术 被引量:18
18
作者 李锐 王斌 《中文信息学报》 CSCD 北大核心 2012年第4期9-20,共12页
用于文本处理的很多数据集已经达到TB、PB甚至更大规模,传统的单机方法难以对这些数据进行有效处理。近年来出现的MapReduce计算框架能够以简洁的形式和分布式的方案来解决大规模数据的并行处理问题,得到了学术界和工业界的广泛认可和... 用于文本处理的很多数据集已经达到TB、PB甚至更大规模,传统的单机方法难以对这些数据进行有效处理。近年来出现的MapReduce计算框架能够以简洁的形式和分布式的方案来解决大规模数据的并行处理问题,得到了学术界和工业界的广泛认可和使用。目前,MapReduce已经被用于自然语言处理、机器学习及大规模图处理等领域。该文首先对MapReduce做了简单的介绍,并分析了其特点、优势还有不足;然后对MapReduce近年来在文本处理各个方面的应用进行分类总结和整理;最后对MapReduce的系统和性能方面的研究也做了一些介绍与展望。 展开更多
关键词 文本处理 MAPREDUCE 分布式计算 综述 HADOOP
下载PDF
基于OLDA的热点话题演化跟踪模型 被引量:18
19
作者 陈兴蜀 高悦 +3 位作者 江浩 杜敏 王海舟 何建云 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2016年第5期130-136,共7页
为了发现论坛数据中感兴趣的话题并对话题进行演化跟踪,文中首先利用潜在狄利克雷分配(LDA)模型将文本由词汇空间降维到主题空间,然后采用聚类算法在主题空间对文本集进行聚类,并利用文中提出的热点话题检测方法得出热点话题.基于发现... 为了发现论坛数据中感兴趣的话题并对话题进行演化跟踪,文中首先利用潜在狄利克雷分配(LDA)模型将文本由词汇空间降维到主题空间,然后采用聚类算法在主题空间对文本集进行聚类,并利用文中提出的热点话题检测方法得出热点话题.基于发现的热点话题,文中提出了基于在线LDA(OLDA)话题模型的论坛热点话题演化跟踪模型(HTOLDA),该模型只选择热点话题进行先验传递,并通过设置同一话题相邻时间片的语义距离来判断话题的状态.实验结果表明,HTOLDA模型对各个时间片的论坛数据集的建模能力优于OLDA模型,并能够有效地对论坛中的热点话题进行演化跟踪. 展开更多
关键词 文本处理 LDA话题模型 话题演化 话题跟踪 HTOLDA话题模型
下载PDF
DF还是IDF?主特征模型在Web信息检索中的使用 被引量:13
20
作者 张敏 马少平 宋睿华 《软件学报》 EI CSCD 北大核心 2005年第5期1012-1020,共9页
Web信息检索的难点之一就是简短、模糊的用户查询与存在大量冗余和噪声的文档之间的不匹配.对Web文档信息特征进行分析,提出Web文档主特征词、主特征域和主特征空间的概念,在该空间上使用文档频度DF(document frequency)信息而非传统意... Web信息检索的难点之一就是简短、模糊的用户查询与存在大量冗余和噪声的文档之间的不匹配.对Web文档信息特征进行分析,提出Web文档主特征词、主特征域和主特征空间的概念,在该空间上使用文档频度DF(document frequency)信息而非传统意义上的IDF(inverse document frequency)信息进行权值计算,并给出一个改进的相似度计算模型.使用该模型在10G和19G的两个大规模Web文档集合上进行了3组标准测试.比较实验表明,与传统IDF思想相比,在各项评价指标上,DF相关的主特征权值计算方法都能始终较大幅度地提高系统性能,最大达到18.6%的性能改善. 展开更多
关键词 WEB信息检索 主特征模型 权值计算 文档频度
下载PDF
上一页 1 2 28 下一页 到第
使用帮助 返回顶部