期刊文献+
共找到68篇文章
< 1 2 4 >
每页显示 20 50 100
结合MSCRs与MSERs的自然场景文本检测 被引量:18
1
作者 易尧华 申春辉 +1 位作者 刘菊华 卢利琼 《中国图象图形学报》 CSCD 北大核心 2017年第2期154-160,共7页
目的目前,基于MSERs(maximally stable extremal regions)的文本检测方法是自然场景图像文本检测的主流方法。但是自然场景图像中部分文本的背景复杂多变,MSERs算法无法将其准确提取出来,降低了该类方法的鲁棒性。本文针对自然场景图像... 目的目前,基于MSERs(maximally stable extremal regions)的文本检测方法是自然场景图像文本检测的主流方法。但是自然场景图像中部分文本的背景复杂多变,MSERs算法无法将其准确提取出来,降低了该类方法的鲁棒性。本文针对自然场景图像文本背景复杂多变的特点,将MSCRs(maximally stable color regions)算法用于自然场景文本检测,提出一种结合MSCRs与MSERs的自然场景文本检测方法。方法首先采用MSCRs算法与MSERs算法提取候选字符区域;然后利用候选字符区域的纹理特征训练随机森林字符分类器,对候选字符区域进行分类,从而得到字符区域;最后,依据字符区域的彩色一致性和几何邻接关系对字符进行合并,得到最终文本检测结果。结果本文方法在ICDAR 2013上的召回率、准确率和F值分别为71.9%、84.1%和77.5%,相对于其他方法的召回率和F值均有所提高。结论本文方法对自然场景图像文本检测具有较强的鲁棒性,实验结果验证了本文方法的有效性。 展开更多
关键词 自然场景 复杂背景 文本检测 MSCRs MSERs
原文传递
一种基于复杂网络的短文本语义相似度计算 被引量:14
2
作者 詹志建 杨小平 《中文信息学报》 CSCD 北大核心 2016年第4期71-80,89,共11页
将传统的文本相似度量方法直接移植到短文本时,由于短文本内容简短的特性会导致数据稀疏而造成计算结果出现偏差。该文通过使用复杂网络表征短文本,提出了一种新的短文本相似度量方法。该方法首先对短文本进行预处理,然后对短文本建立... 将传统的文本相似度量方法直接移植到短文本时,由于短文本内容简短的特性会导致数据稀疏而造成计算结果出现偏差。该文通过使用复杂网络表征短文本,提出了一种新的短文本相似度量方法。该方法首先对短文本进行预处理,然后对短文本建立复杂网络模型,计算短文本词语的复杂网络特征值,再借助外部工具计算短文本词语之间的语义相似度,然后结合短文本语义相似度定义计算短文本之间的相似度。最后在基准数据集上进行聚类实验,验证本文提出的短文本相似度计算方法在基于F-度量值标准上,优于传统的TF-IDF方法和另一种基于词项语义相似度的计算方法。 展开更多
关键词 复杂网络 综合特征值 短文本 语义相似度
下载PDF
小句复合体的语篇功能 被引量:10
3
作者 陈安玲 《外语与外语教学》 北大核心 2000年第5期15-17,共3页
小句复合体乃语篇的基本语义单位 ,其句内、外的功能组织在语篇的发展过程中扮演了重要的语义角色。语篇中小句复合体内逻辑语义系统的组合方式在一定程度上描述了语篇语境的部分特征 ,而语篇中全局性主位模式的组合特点则影响着语篇发... 小句复合体乃语篇的基本语义单位 ,其句内、外的功能组织在语篇的发展过程中扮演了重要的语义角色。语篇中小句复合体内逻辑语义系统的组合方式在一定程度上描述了语篇语境的部分特征 ,而语篇中全局性主位模式的组合特点则影响着语篇发展的风格。 展开更多
关键词 小句复合体 语篇 逻辑语义 主位结构
下载PDF
国内外专利网络研究进展 被引量:11
4
作者 关鹏 王曰芬 《数据分析与知识发现》 CSSCI CSCD 北大核心 2020年第1期26-39,共14页
【目的】分析国内外专利网络研究进展,梳理研究现状、发现研究问题和研判研究趋势。【文献范围】分别以"Patent Network"和"专利网络"为主题在Web of Science核心集和CNKI核心期刊库中检索,通过去重、去除不相关文... 【目的】分析国内外专利网络研究进展,梳理研究现状、发现研究问题和研判研究趋势。【文献范围】分别以"Patent Network"和"专利网络"为主题在Web of Science核心集和CNKI核心期刊库中检索,通过去重、去除不相关文献后,共检索到英文论文465篇,中文论文196篇,分析其中代表性论文106篇。【方法】首先,利用团渗透重叠社区发现算法对"专利网络"关键词共现网络进行主题挖掘,分析中英文热点研究主题;其次,对热点研究主题下的高被引论文进行述评。【结果】综合现有研究,专利网络构建方法主要有合作关系、引用关系、技术转移关系、技术相似关系等,主流研究方法有社会网络分析、复杂网络和文本挖掘等。【局限】仅对热点研究领域的高被引代表性论文进行分析,未能覆盖全部研究主题和文献。【结论】专利网络研究尚未形成系统性的理论和方法体系,新兴研究方法的应用仍处于探索阶段。专利网络分析需向中观层面深入,网络演化机制、模型和仿真实验研究还需进一步加强。专利网络语义化分析倾向越来越明显;基于多种关系的综合性专利网络构建和分析,获得越来越多的关注,未来有可能成为新兴研究方向。 展开更多
关键词 专利网络 社会网络分析 复杂网络 文本挖掘
原文传递
基于文本挖掘与神经网络的复杂产品装配工时估算方法 被引量:9
5
作者 刘子文 刘检华 +1 位作者 程益 庄存波 《机械工程学报》 EI CAS CSCD 北大核心 2021年第15期199-210,共12页
针对卫星等复杂产品装配工时定额主要依靠人工经验确定导致的准确性低、制定速度慢、管理不规范等问题,提出一种基于文本挖掘与神经网络模型的复杂产品装配工时估算方法。以卫星为例分析了装配工艺数据的特点,总结了装配工时的影响因素... 针对卫星等复杂产品装配工时定额主要依靠人工经验确定导致的准确性低、制定速度慢、管理不规范等问题,提出一种基于文本挖掘与神经网络模型的复杂产品装配工时估算方法。以卫星为例分析了装配工艺数据的特点,总结了装配工时的影响因素,并根据工艺特点划分了工艺类别。借助文本挖掘技术对工艺文本特征进行了提取并分类;在此基础上构建了工时预测神经网络模型,实现了面向复杂产品装配的定额工时准确估算。设计开发了复杂产品装配工时定额与管理系统,并在航天某所上线试运行,应用效果良好,验证了所提方法的可行性和实用性。 展开更多
关键词 复杂产品 装配 工时定额估算 文本挖掘 神经网络 工时管理
原文传递
一种基于GN算法的文本概念聚类新方法 被引量:7
6
作者 安娜 谢福鼎 +1 位作者 张永 刘绍海 《计算机工程与应用》 CSCD 北大核心 2008年第14期142-144,180,共4页
文本聚类是当前文本信息挖掘的基础和研究的重点。给出一种新的文本聚类方法,它将概念格和复杂网络有机地结合起来,以达到更优的聚类效果。首先计算关键词特征权值并对特征向量进行降维处理,然后根据关键词权值大小映射到形式背景中,通... 文本聚类是当前文本信息挖掘的基础和研究的重点。给出一种新的文本聚类方法,它将概念格和复杂网络有机地结合起来,以达到更优的聚类效果。首先计算关键词特征权值并对特征向量进行降维处理,然后根据关键词权值大小映射到形式背景中,通过本文所给出的新的相似度公式,计算出形式背景中概念相似度的大小,从而构造GN网络并应用GN算法进行文本概念聚类。最后通过实例,验证了方法的可行性。 展开更多
关键词 复杂网络 GN算法 文本聚类 概念格
下载PDF
一种基于复杂网络的中文文本分类算法 被引量:8
7
作者 赵辉 刘怀亮 张倩 《情报学报》 CSSCI 北大核心 2012年第11期1179-1186,共8页
为解决向量空间模型中文本结构和语义信息的缺失问题,本文提出将复杂网络应用到中文文本分类过程中,将文本表示为以特征词为节点,以词语语义相关关系为边,以其相关关系强弱作为边权重的加权复杂网络,利用网络节点的综合特性对文本... 为解决向量空间模型中文本结构和语义信息的缺失问题,本文提出将复杂网络应用到中文文本分类过程中,将文本表示为以特征词为节点,以词语语义相关关系为边,以其相关关系强弱作为边权重的加权复杂网络,利用网络节点的综合特性对文本进行特征选择,以降低文本网络的复杂性。给出基于复杂网络的中文文本分类算法并对其进行实验验证。结果表明,该算法是可行的,且有较好的分类效果。 展开更多
关键词 复杂网络 特征选择 文本分类
下载PDF
Structural organization and scale-free properties in Chinese Phrase Networks 被引量:6
8
作者 LIYong WEILuoxia +1 位作者 NIUYi YINJunxun 《Chinese Science Bulletin》 SCIE EI CAS 2005年第13期1304-1308,共5页
Monkey language models are defined for Chi-nese Phrase Networks, and scale-free features of Chinese Phrase Networks are uncovered. It is pointed out that the ratio of average degree to the total number of nodes ( k /N... Monkey language models are defined for Chi-nese Phrase Networks, and scale-free features of Chinese Phrase Networks are uncovered. It is pointed out that the ratio of average degree to the total number of nodes ( k /N ) is close to a constant. Simulation for the evolution of phrase networks indicates that one of the important reasons for power law distributions is the word selection frequency, which, when tuned aptly, can make the monkey language present similar statistic traits as that of natural languages. Power law tails emerge at large k, and the exponent is about 6. Comparison between monkey model and natural language shows that humans are able to use Chinese words resources in more effective and compact ways to express their inten-tions. All the results demonstrate an important fact that the least effort principle is the basis of Chinese Phrase Networks. 展开更多
关键词 综合网络 网络语言 自由度 程度分布 随机测试 中国
原文传递
在Qt上实现蒙文显示的设计与实现 被引量:1
9
作者 杨文霞 孙玉芳 吴健 《计算机工程与设计》 CSCD 北大核心 2005年第7期1707-1709,1711,共4页
随着软件产业国际化进程的发展,在操作系统中实现对我国少数民族文字的显示是一项具有挑战性和刻不容缓的任务,针对这项任务先分析了少数民族文字中蒙古文的语法特点和书写特点、桌面系统平台库QT的体系结构特点以及OpenType字体文件的... 随着软件产业国际化进程的发展,在操作系统中实现对我国少数民族文字的显示是一项具有挑战性和刻不容缓的任务,针对这项任务先分析了少数民族文字中蒙古文的语法特点和书写特点、桌面系统平台库QT的体系结构特点以及OpenType字体文件的特点,在此基础之上提出在QT中使用OpenType字体文件来实现蒙古文显示的详细实现方案,最后给出了目前该方案在项目中的实现情况和效果,并阐述了还有哪些地方需要进一步研究和改进。 展开更多
关键词 名义字符 显现字符 复杂文本 替换
下载PDF
基于复杂关联网络的生物医学研究结构的挖掘 被引量:5
10
作者 闵波 刘爱中 +2 位作者 郑萍 史艳莉 唐春霞 《中华医学图书情报杂志》 CAS 2015年第8期1-4,共4页
基于免费开放的Pub Med文献数据集,利用文献的知识发现,通过挖掘文献中隐含的关联,构建了生物医学实体关联演化网络。它能帮助科研人员形成新的科学假设,分析关联网络的拓扑特征,从系统层面上研究科学文献富集的知识结构、相关性与发展... 基于免费开放的Pub Med文献数据集,利用文献的知识发现,通过挖掘文献中隐含的关联,构建了生物医学实体关联演化网络。它能帮助科研人员形成新的科学假设,分析关联网络的拓扑特征,从系统层面上研究科学文献富集的知识结构、相关性与发展规律,为文献的知识发现引入新的视角与方法,提高知识发现的效率。 展开更多
关键词 复杂网络 文本挖掘 知识发现 关联知识网络
下载PDF
基于复杂网络的中文文本关键词提取研究 被引量:4
11
作者 赵京胜 张丽 肖娜 《青岛理工大学学报》 CAS 2018年第3期102-108,共7页
关键词提取技术是文本信息挖掘领域的一项关键技术.将单篇文档作为研究对象提出1种基于复杂网络的中文文本关键词提取算法.算法以复杂网络为基础构建文本词语共现网络;以网络节点的度中心性、特征向量中心性和节点介数中心性为基础构造... 关键词提取技术是文本信息挖掘领域的一项关键技术.将单篇文档作为研究对象提出1种基于复杂网络的中文文本关键词提取算法.算法以复杂网络为基础构建文本词语共现网络;以网络节点的度中心性、特征向量中心性和节点介数中心性为基础构造节点综合特征值公式;网络节点按综合特征值降序输出,去除单字词节点,提取前K个词语作为文本关键词语.改进方法提取的关键词能够表达文本主题,相比于传统的TF-IDF算法提升了关键词提取的准确性. 展开更多
关键词 复杂网络 中文文本 综合特征值
下载PDF
三维分析框架下的郑州市医养结合政策优化研究——基于2010-2023年的文本分析
12
作者 陶永奎 姜捷 《平顶山学院学报》 2024年第5期110-117,共8页
医养结合是积极应对健康老龄化,实现健康养老的重要举措.选取郑州市2010-2023年发布的30份医养结合政策文本作为研究对象,构建政策工具、医养结合模式和发展阶段三维分析框架,借助Nvivo12软件进行文本分析,探索郑州市推进医养结合发展... 医养结合是积极应对健康老龄化,实现健康养老的重要举措.选取郑州市2010-2023年发布的30份医养结合政策文本作为研究对象,构建政策工具、医养结合模式和发展阶段三维分析框架,借助Nvivo12软件进行文本分析,探索郑州市推进医养结合发展相关政策工具类型、结构和内容及不足之处.通过交叉分析发现郑州市医养结合发文数量呈上升趋势,发文主体逐渐多元化,形成四种医养结合模式协同推进格局.但存在政策工具整体结构失衡、内部结构不合理、发展方向不明确等问题.基于此,建议调整政策工具比例,优化政策工具内部结构,逐步形成以“医进社区”为主导的医养结合模式,促进医养结合政策体系不断完善. 展开更多
关键词 医养结合 政策工具 文本分析
下载PDF
基于文本挖掘的中国乡村振兴与田园综合体政策热点与趋势研究 被引量:4
13
作者 张燕刚 成全 《合肥工业大学学报(社会科学版)》 2021年第5期104-109,共6页
以2017年至今我国乡村振兴与田园综合体政策文本为样本,以词共现网络分析、多维尺度分析(MDS)等方法为技术手段,进行乡村振兴与田园综合体相关政策文本中政策热点的挖掘与政策趋势的预测分析。研究表明,围绕着国家提出的“田园综合体”... 以2017年至今我国乡村振兴与田园综合体政策文本为样本,以词共现网络分析、多维尺度分析(MDS)等方法为技术手段,进行乡村振兴与田园综合体相关政策文本中政策热点的挖掘与政策趋势的预测分析。研究表明,围绕着国家提出的“田园综合体”“乡村振兴”,相关政策制定的重点在于,第一,基础设施与公共服务是乡村振兴战略的重要保障;第二,现代化特色农业农产品生产及质量安全是关键;第三,新型农业经营主体是动力。与此同时,在科技创新助力资源环境保护与高效利用、绿色农产品安全生产与质量控制、新型农业经营主体利益联结及监管机制等方面尚存在政策空位现象,将成为下阶段政策制定的重点。 展开更多
关键词 乡村振兴 田园综合体 文本挖掘 政策热点 政策趋势
下载PDF
多语言复杂文本布局引擎分析及应用 被引量:1
14
作者 林民 萨日娜 嘎日迪 《内蒙古师范大学学报(自然科学汉文版)》 CAS 2008年第1期67-70,共4页
分析了微软多语言复杂文本布局引擎Uniscribe的主要工作机制,说明了Uniscribe主要接口函数的功能及用法.基于Uniscribe接口实现了支持Unicode编码和OpenType字体的蒙古文竖向文本编辑器,解决了其中的一些技术难题.
关键词 多语言 复杂文本 布局引擎 OPENTYPE Uniscribe
下载PDF
基于LDA的复杂网络整体研究态势主题分析 被引量:4
15
作者 赵紫娟 李小珂 +2 位作者 郭强 杨凯 刘建国 《电子科技大学学报》 EI CAS CSCD 北大核心 2019年第6期931-938,共8页
复杂网络的研究发展非常迅速,已经对自动控制、统计物理、计算机及管理等学科产生了深刻的影响.然而,国内的主题发展态势一直缺乏系统、直观的分析.本文以2017年第十三届全国复杂网络大会的会议摘要文本为研究对象,从会议摘要主题分析... 复杂网络的研究发展非常迅速,已经对自动控制、统计物理、计算机及管理等学科产生了深刻的影响.然而,国内的主题发展态势一直缺乏系统、直观的分析.本文以2017年第十三届全国复杂网络大会的会议摘要文本为研究对象,从会议摘要主题分析的角度研究了国内复杂网络科研领域的整体发展态势.研究过程中首先对摘要文本进行预处理,通过建立自定义词典和停用词库对文本进行jieba分词,得到一个文档-词矩阵.然后用LDA主题模型对摘要主题进行挖掘,通过SVD分解确定主题数目,并基于摘要间的JS距离进行凝聚层次聚类,基于机构间的JS距离用Blondel算法对机构进行社团划分,最终得到10类会议主题和4类科研社团.实证结果不仅能分析出复杂网络宏观上的研究趋势与不同研究方向的热门程度;也能基于聚出的4类科研社团,为新进入复杂网络的研究者寻找对应研究方向的文献提供参考机构. 展开更多
关键词 复杂网络 社团结构 研究态势 文本分析
下载PDF
面向阅读理解复杂问题的句子融合 被引量:3
16
作者 谭红叶 赵红红 李茹 《中文信息学报》 CSCD 北大核心 2017年第1期8-16,共9页
阅读理解是目前NLP领域的一个研究热点。阅读理解中好的复杂问题解答策略不仅要进行答案句的抽取,还要对答案句进行融合、生成相应的答案,但是目前的研究大多集中在前者。该文针对复杂问题解答中的句子融合进行研究,提出了一种兼顾句子... 阅读理解是目前NLP领域的一个研究热点。阅读理解中好的复杂问题解答策略不仅要进行答案句的抽取,还要对答案句进行融合、生成相应的答案,但是目前的研究大多集中在前者。该文针对复杂问题解答中的句子融合进行研究,提出了一种兼顾句子重要信息、问题关联度与句子流畅度的句子融合方法。该方法的主要思想为:首先,基于句子拆分和词重要度选择待融合部分;然后,基于词对齐进行句子相同信息的合并;最后,利用基于依存关系、二元语言模型及词重要度的整数线性规划优化生成句子。在历年高考阅读理解数据集上的测试结果表明,该方法取得了82.62%的F值,同时更好地保证了结果的可读性及信息量。 展开更多
关键词 阅读理解 复杂问题 句子融合 文本生成
下载PDF
国外文本细读:理论、课程、内容、取向及启示——基于课程论语境下的中外文本细读综述及其思考 被引量:3
17
作者 朱建军 《乌鲁木齐职业大学学报》 2014年第1期69-75,共7页
课程论语境下的文本细读,迥异于新批评主义理论视野下的文本细读。前者追求公共知识,即是在课程标准框架下以课程或指南的形式出现,可以在实践中进行操作和重复使用;而后者多为个体知识,强调启蒙、见解和认同,即其主要目的还不在产生文... 课程论语境下的文本细读,迥异于新批评主义理论视野下的文本细读。前者追求公共知识,即是在课程标准框架下以课程或指南的形式出现,可以在实践中进行操作和重复使用;而后者多为个体知识,强调启蒙、见解和认同,即其主要目的还不在产生文本意义,而在于揭示所有可能类型的歧义和反讽。课程论语境下的文本细读,面临诸多挑战、争议与问题,但其概念、课程规划与追求逐渐明晰,文本细读是产生性阅读,强调文本的复杂性。但是,我国文本细读的研究现状不容乐观,许多概念缺乏课程论意义,为此,可以依据语言工具,尝试设计一个文本细读案例。 展开更多
关键词 文本细读 课程规划 文本复杂性 产生性阅读
下载PDF
一种基于形态运算的快速文字分割算法 被引量:2
18
作者 何家颖 黎绍发 《计算机工程与科学》 CSCD 2005年第9期64-65,76,共3页
本文针对复杂背景图像中文字与背景区域的形态特征,提出了一种基于形态运算和区域生长的快速文字分割算法MOSA,同时将之与LLT分割算法进行了比较。实验结果表明,该算法能较快和较准确地定位复杂背景图像中的文字区域,并且相对于LLT算法... 本文针对复杂背景图像中文字与背景区域的形态特征,提出了一种基于形态运算和区域生长的快速文字分割算法MOSA,同时将之与LLT分割算法进行了比较。实验结果表明,该算法能较快和较准确地定位复杂背景图像中的文字区域,并且相对于LLT算法,该算法在速度与分割效果方面都有所提高。 展开更多
关键词 复杂图像背景 文字分割 形态运算 区域生长
下载PDF
萧红小说《呼兰河传》的文本复调性 被引量:2
19
作者 耿庆伟 《重庆邮电大学学报(社会科学版)》 2018年第5期128-135,共8页
"天涯孤女"萧红对于故乡有着剪不断理还乱的复杂情绪,故乡留给她的不仅有苦涩的创伤,也有记忆的芬芳。其写作背景从未离开过故乡,不过她的故乡情绪却是复调的,思乡的蛊惑使其作品始终回荡着还乡的旋律,对家的失望又让其作品... "天涯孤女"萧红对于故乡有着剪不断理还乱的复杂情绪,故乡留给她的不仅有苦涩的创伤,也有记忆的芬芳。其写作背景从未离开过故乡,不过她的故乡情绪却是复调的,思乡的蛊惑使其作品始终回荡着还乡的旋律,对家的失望又让其作品深寓着不绝如缕的深深叹息。作为一位执着于现实的作家,小说《呼兰河传》的书写在温情脉脉的叙述中始终隐藏着一颗焦虑不安的痛苦灵魂,文本叙事中交织着批判与诗意的叙事张力,主题指向上则将民族国家的内容嵌入多元多质的文本深处。由于采用了复调叙事,萧红将深情的乡土眷顾与无望的精神皈依、国民性批判与启蒙主义、女性意识与国家意识融入文本之中。批判的意识与咏叹的声音同时迸发,从而使小说产生了仿佛复调音乐一样的审美效应。不同主题的融进形成了隐在的内文本间性,生成了小说文本的多声解读的批评景观。 展开更多
关键词 《呼兰河传》 复调叙事 故乡情结 文本张力 主题指向
下载PDF
基于卷积神经网络多特征融合的复杂背景字符识别 被引量:2
20
作者 陈太阳 《电脑知识与技术》 2021年第10期192-193,共2页
近年来,计算机视觉领域的一个研究热点就是基于深度学习的文字识别。通过在深度网络中融合对字符图像采用K均值和PCA提取的特征信息,本文提出一种基于卷积神经网络多特征融合的复杂背景字符识别方法。该方法对测试集进行分组实验,实验... 近年来,计算机视觉领域的一个研究热点就是基于深度学习的文字识别。通过在深度网络中融合对字符图像采用K均值和PCA提取的特征信息,本文提出一种基于卷积神经网络多特征融合的复杂背景字符识别方法。该方法对测试集进行分组实验,实验结果表明该方法对复杂背景字符识别有较高的正确率。 展开更多
关键词 卷积神经网络 多特征融合 复杂背景 字符识别
下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部