期刊文献+
共找到111篇文章
< 1 2 6 >
每页显示 20 50 100
国内外信息检索研究热点分析——基于Z-Score标准化的词频 被引量:13
1
作者 苍宏宇 谭宗颖 《图书馆建设》 CSSCI 北大核心 2009年第1期93-98,共6页
通过利用基于Z-Score标准化的词频统计分析法,从研究主题、关键技术和学科特点对国内外信息检索领域研究的热点进行分析,可以看出国内外基于网络环境的研究成为重要主题;研究的关键技术大体相同,但侧重点不同;国外的研究集中在计算机领... 通过利用基于Z-Score标准化的词频统计分析法,从研究主题、关键技术和学科特点对国内外信息检索领域研究的热点进行分析,可以看出国内外基于网络环境的研究成为重要主题;研究的关键技术大体相同,但侧重点不同;国外的研究集中在计算机领域,国内集中在图书情报领域。而未来信息检索中,网络信息检索将得到进一步的发展,知识、多媒体等将成为信息检索的关键主题,新信息检索技术将会成为日后关注的重点。 展开更多
关键词 词频统计法 Z-SCORE 信息检索 对比分析
下载PDF
一种改进的基于词频统计的中文分词算法研究 被引量:2
2
作者 崔虹燕 《信息技术》 2008年第4期124-125,共2页
在分析传统FMM分词算法的原理与特点的基础上,利用词频统计结果,提出了一种改进的FMM算法,通过分析,改进的FMM算法可以进一步提高分词的效率。
关键词 FMM 词频统计 中文分词效率
下载PDF
基于科技报告的电动汽车技术现状及发展趋势研究 被引量:5
3
作者 雷孝平 陈亮 +1 位作者 刘玉琴 张英杰 《中国科技资源导刊》 2017年第3期83-90,共8页
科技报告作为科技计划及技术项目的直接产出成果,包含了重要的前沿技术信息。如何将其中隐含的知识挖掘出来,展示技术发展方向是一个难题。本文基于电动汽车领域的科技报告数据,采用文献计量学中的词频统计及科学计量学中的社会网络共... 科技报告作为科技计划及技术项目的直接产出成果,包含了重要的前沿技术信息。如何将其中隐含的知识挖掘出来,展示技术发展方向是一个难题。本文基于电动汽车领域的科技报告数据,采用文献计量学中的词频统计及科学计量学中的社会网络共现分析方法,对电动汽车领域的技术现状及未来发展趋势进行了研究。研究结果表明,电动汽车技术目前主要是混合动力、动力电池、燃料电池等方面的相关研究,未来的研发将主要集中在电力系统、电池的安全性及可靠性、电池系统、电机的控制及仿真优化、控制策略及稳定性等方面。另外,电动汽车的产业化生产一直是研发中需要考虑的重点。 展开更多
关键词 科技报告 电动汽车 技术预测 词频统计 社会网络分析 文献计量学 科学计量学
下载PDF
自适应不良网页过滤模式的研究与实践 被引量:1
4
作者 唐坚刚 熊国萍 《计算机工程与设计》 CSCD 北大核心 2008年第20期5324-5326,共3页
基于语义的文本过滤方法往往具有较大的时空开销,为了设计实用快捷而有效的过滤系统,创造性地提出了一个基于字频统计和数据挖掘技术的自适应不良网页过滤模式。以校园网作为研究环境,利用自适应语料库构建智能化的分类模式,通过模式识... 基于语义的文本过滤方法往往具有较大的时空开销,为了设计实用快捷而有效的过滤系统,创造性地提出了一个基于字频统计和数据挖掘技术的自适应不良网页过滤模式。以校园网作为研究环境,利用自适应语料库构建智能化的分类模式,通过模式识别过滤校园网中的不良网页。实验结果表明,该模式能以较快的速度和较为满意的准确率过滤测试文档集中的不良网页,具有较强的实用性。 展开更多
关键词 网页过滤 校园网 特征字 字频统计 过滤模式
下载PDF
基于改进的KMP算法的词频统计 被引量:4
5
作者 杨俊丽 吕晓燕 满晰 《微计算机信息》 2010年第27期161-162,共2页
针对词频统计中模式匹配的问题,提出一种基于改进的KMP算法。该算法在词频统计的模式匹配中,能够使目标词更快的向右移动到待测文本串的定位点,并且可以实现从外设边读入庞大数据边进行匹配操作。实验证明,改进的KMP算法提高了模式匹配... 针对词频统计中模式匹配的问题,提出一种基于改进的KMP算法。该算法在词频统计的模式匹配中,能够使目标词更快的向右移动到待测文本串的定位点,并且可以实现从外设边读入庞大数据边进行匹配操作。实验证明,改进的KMP算法提高了模式匹配速度,检索性能良好。 展开更多
关键词 KMP算法 词频统计 模式匹配
下载PDF
基于字频统计和数据挖掘技术的不良网页过滤模式的构建与应用
6
作者 唐坚刚 熊国萍 《厦门大学学报(自然科学版)》 CAS CSCD 北大核心 2007年第A02期69-71,共3页
为快速有效地过滤不良网页以保障校园网信息安全,创造性地提出了一个基于字频统计和数据挖掘技术的不良网页过滤模式,通过自适应样本库构建不良类类别特征字库,并以此为基础构建智能化的不良类类别模式,用以实现不良网页的过滤.实验表明... 为快速有效地过滤不良网页以保障校园网信息安全,创造性地提出了一个基于字频统计和数据挖掘技术的不良网页过滤模式,通过自适应样本库构建不良类类别特征字库,并以此为基础构建智能化的不良类类别模式,用以实现不良网页的过滤.实验表明,该模式能以较快的速度和较高的准确率过滤测试文档集中的不良网页. 展开更多
关键词 网页过滤 字频统计 特征字 数据挖掘
下载PDF
智能型文本过滤的创新模式与系统设计
7
作者 熊国萍 唐敏 《电脑知识与技术》 2010年第4X期3277-3278,共2页
为增强校园网的信息安全,研究基于文本的自适应的智能型不良网页过滤关键技术,提出一种创新模式并开发设计了实验系统。该模式是通过自适应样本库构建不良类类别特征字库,并以此为基础构建智能化的不良类类别模式,用以实现不良网页的过... 为增强校园网的信息安全,研究基于文本的自适应的智能型不良网页过滤关键技术,提出一种创新模式并开发设计了实验系统。该模式是通过自适应样本库构建不良类类别特征字库,并以此为基础构建智能化的不良类类别模式,用以实现不良网页的过滤。实验表明,该模式能以较快的速度和较高的准确率过滤测试文档集中的不良网页。 展开更多
关键词 文本过滤 字频统计 自适应 特征字
下载PDF
基于字频统计的子同步码盲检测方法研究
8
作者 吕喜在 苏绍璟 黄芝平 《西安电子科技大学学报》 EI CAS CSCD 北大核心 2011年第3期189-196,共8页
为了获取数字通信中未知线路的帧同步信息,提出了一种子同步码盲检测方法.通过对帧同步问题进行建模,得出了不同字宽的字频统计中子同步码检出概率与数据长度的关系.据此关系,通过对原始数据进行字频统计并调整字宽和数据长度,实现了误... 为了获取数字通信中未知线路的帧同步信息,提出了一种子同步码盲检测方法.通过对帧同步问题进行建模,得出了不同字宽的字频统计中子同步码检出概率与数据长度的关系.据此关系,通过对原始数据进行字频统计并调整字宽和数据长度,实现了误码环境中具有任意比特起点的未知线路子同步码的全盲检测,从而使完整帧同步信息的获取成为可能. 展开更多
关键词 数字通信 字频统计 同步码 盲检测
下载PDF
链式统频方法
9
作者 师军 曹菡 高晓娟 《现代电子技术》 1996年第2期45-46,共2页
提出了一种拉链式字频统计程序设计方法,并在TW386机上用C语言编程实现。
关键词 古籍整理 链式统频法 C语言 程序设计
下载PDF
数字化转型、知识溢出与企业全要素生产率——来自制造业上市公司的经验证据 被引量:144
10
作者 涂心语 严晓玲 《产业经济研究》 CSSCI 北大核心 2022年第2期43-56,共14页
在当前中国数字经济和实体经济逐渐融合的发展背景下,深入探索企业数字化转型与全要素生产率的关系对于经济实现高质量发展具有重要意义。基于2007—2019年制造业上市公司年报文本数据构建了企业数字化指数,在此基础上研究了数字化转型... 在当前中国数字经济和实体经济逐渐融合的发展背景下,深入探索企业数字化转型与全要素生产率的关系对于经济实现高质量发展具有重要意义。基于2007—2019年制造业上市公司年报文本数据构建了企业数字化指数,在此基础上研究了数字化转型对企业全要素生产率的影响,并采用倾向得分匹配法为数字化转型程度高的企业构造了各种特征相似的数字化转型程度低的企业对照样本,通过反事实方法实证检验了数字化转型对企业间知识溢出的影响。主要结论如下:(1)企业数字化转型对其全要素生产率有显著的提升作用,在进行一系列稳健性检验后此结论仍然成立。(2)随着时间推移,数字化转型对企业全要素生产率的影响更为明显,这一方面可能表明当期所进行的数字化转型举措对企业的影响存在一定滞后,另一方面可能意味着测算得到的数字化指数部分反映了企业对数字化转型的预期或前期投入。(3)数字化转型能够通过加速企业间知识溢出进而促进其全要素生产率的提升,因此数字化增强了经济内生增长动力。研究结论为数字经济与实体经济的融合效果提供了微观证据,具有重要的政策含义:政府应通过政策倾斜等方式鼓励企业进行数字化转型,同时采取各项措施降低知识溢出的外部门槛,通过数字化转型与知识溢出的良性互动,推动经济实现高质量发展。 展开更多
关键词 数字经济 高质量发展 生产率 技术溢出 文本分析 词频统计
原文传递
国内竞争情报领域研究论文的共词聚类分析 被引量:40
11
作者 曹玲 杨静 夏严 《情报科学》 CSSCI 北大核心 2010年第6期923-925,930,共4页
利用《CNKI中国期刊全文数据库》中收录的1997~2008年与竞争情报相关的期刊论文为基础,采用Bibexcel进行词频统计以及SPSS软件进行共词聚类分析,研究各高频关键词之间的内在联系,分析竞争情报领域的研究热点,管窥国内竞争情报领域的研... 利用《CNKI中国期刊全文数据库》中收录的1997~2008年与竞争情报相关的期刊论文为基础,采用Bibexcel进行词频统计以及SPSS软件进行共词聚类分析,研究各高频关键词之间的内在联系,分析竞争情报领域的研究热点,管窥国内竞争情报领域的研究现状。 展开更多
关键词 竞争情报 Bibexcel 词频统计 SPSS 共词分析 聚类分析
原文传递
基于篇章结构相似度的复制检测算法 被引量:28
12
作者 金博 史彦军 滕弘飞 《大连理工大学学报》 EI CAS CSCD 北大核心 2007年第1期125-130,共6页
学术论文的复制检测研究对于知识产权保护和抑制抄袭侵权等行为有重要意义.国内外主要用数字指纹及关键词匹配等技术进行论文的复制检测.为解决目前中文复制检测难题,给出了一种基于篇章结构相似度的中文学术论文复制检测算法及其问题... 学术论文的复制检测研究对于知识产权保护和抑制抄袭侵权等行为有重要意义.国内外主要用数字指纹及关键词匹配等技术进行论文的复制检测.为解决目前中文复制检测难题,给出了一种基于篇章结构相似度的中文学术论文复制检测算法及其问题的数学模型.在分析论文篇章结构的基础上,利用数字指纹和词频统计等技术,经编程实现,用于论文的全抄、部分抄袭和拼抄等抄袭现象的初步检测.与基于全文数字指纹和基于全文词频统计的检测方法相比较,更适用于要求较准确的论文复制检测. 展开更多
关键词 学术论文 复制检测 抄袭识别 数字指纹 词频统计 篇章结构
下载PDF
网络语境下官方目的地宣传形象与游客感知形象的差异——以南京市为例 被引量:31
13
作者 吴林芝 周春林 +2 位作者 黄子璇 曹芳东 谢倩倩 《地域研究与开发》 CSSCI CSCD 北大核心 2018年第3期90-94,100,共6页
通过网络数据研究旅游目的地形象成为热点,但目前大都停留在游客感知或目的地宣传形象的单向研究上,缺乏对比且传播渠道单一。结合内容与对应分析,从供需2个视角出发研究微博、网站、游记3种不同传播渠道下国内游客感知与官方宣传的南... 通过网络数据研究旅游目的地形象成为热点,但目前大都停留在游客感知或目的地宣传形象的单向研究上,缺乏对比且传播渠道单一。结合内容与对应分析,从供需2个视角出发研究微博、网站、游记3种不同传播渠道下国内游客感知与官方宣传的南京旅游目的地形象差异。结果表明:(1)网络语境下南京旅游目的地形象可归纳为城市历史文化、城市景观、美食、乡村风光、休闲度假、保障设施、游客体验7个主题,其中城市历史文化主题是双方共同认知。(2)除城市历史文化主题外,两者有很大区别,政府层面试图建立的传播形象与现阶段游客的感知情况不符。(3)对应分析横轴方向的特征词主要反映了南京旅游目的地形象的总体特征,纵轴方向的特征词体现了南京旅游目的地形象的差异性。(4)游客感知形象与官方宣传形象区别较大而官方样本间区别较小,游客感知侧重传统城市景观主题,官方微博侧重宣传乡村风光,官方网站侧重宣传休闲度假,但官方都强调对乡村风光的宣传,只是宣传对象有所区别。在此基础上提出建议。 展开更多
关键词 游客感知形象 官方宣传形象 旅游目的地形象 词频统计 形象差异 南京市
下载PDF
SegT:一个实用的藏文分词系统 被引量:25
14
作者 刘汇丹 诺明花 +2 位作者 赵维纳 吴健 贺也平 《中文信息学报》 CSCD 北大核心 2012年第1期97-103,共7页
在分析现有藏文分词方法的基础上,该文重点研究了藏文分词中的格助词分块、临界词识别、词频统计、交集型歧义检测和消歧等问题并提出了相应的方法。应用这些方法,设计实现了一个藏文分词系统SegT。该系统采用格助词分块并识别临界词,... 在分析现有藏文分词方法的基础上,该文重点研究了藏文分词中的格助词分块、临界词识别、词频统计、交集型歧义检测和消歧等问题并提出了相应的方法。应用这些方法,设计实现了一个藏文分词系统SegT。该系统采用格助词分块并识别临界词,然后采用最大匹配方法分词,并进行紧缩词识别。系统采用双向切分检测交集型歧义字段并使用预先统计的词频信息进行消歧。实验结果表明,该文设计的格助词分块和临界词识别方法可以将分词速度提高15%左右,但格助词分块对分词效果没有明显提高或降低。系统最终分词正确率为96.98%,基本达到了实用的水平。 展开更多
关键词 藏文分词 格助词 临界词识别 词频统计 藏文信息处理 中文信息处理
下载PDF
国内知识图谱研究综述与评估:2004-2010年 被引量:21
15
作者 汤建民 余丰民 《情报资料工作》 CSSCI 北大核心 2012年第1期16-21,共6页
文章综合运用词频统计、共词分析及可视化技术等文献计量方法,分析了国内知识图谱研究的整体现状,包括论文的总量分布、发表期刊分布、作者分布、机构分布、基金资助分布及论文研究热点等,并综合归纳了论文研究的主要内容。在此基础上,... 文章综合运用词频统计、共词分析及可视化技术等文献计量方法,分析了国内知识图谱研究的整体现状,包括论文的总量分布、发表期刊分布、作者分布、机构分布、基金资助分布及论文研究热点等,并综合归纳了论文研究的主要内容。在此基础上,对该研究领域的现状和存在的问题进行了综述和评估,并提出了相应的对策。 展开更多
关键词 知识图谱 文献计量 可视化 词频统计 共词分析
原文传递
论数据挖掘技术在文本分析中的应用 被引量:15
16
作者 毛文伟 《日语学习与研究》 CSSCI 2019年第1期1-9,共9页
数据挖掘技术能够帮助我们从规模庞大、内容纷繁的文本数据中准确、高效地提炼出研究者难以通过遍览有效捕捉的隐含信息或趋势。其中,词频统计帮助我们获取分析对象的词汇总量、高频词汇以及词汇构成等信息,并据此对文体特征进行较为准... 数据挖掘技术能够帮助我们从规模庞大、内容纷繁的文本数据中准确、高效地提炼出研究者难以通过遍览有效捕捉的隐含信息或趋势。其中,词频统计帮助我们获取分析对象的词汇总量、高频词汇以及词汇构成等信息,并据此对文体特征进行较为准确的判断。词表比对揭示了对象文本的叙事方式、所含关键人物、场所和物品等。词语共现网络使我们能够直观地观察到文本中的高频人物、组织等,并揭示这些热词之间的潜在联系,从而快速构建热点事件的基本框架。而通过计算共现强度,我们可以轻松、准确地挖掘出与特定关键词关系密切的共现词,从而有效捕捉与之相关的热点话题和媒体动向。 展开更多
关键词 数据挖掘 词频统计 词语共现网络 MI-score 语料库语言学
原文传递
改革开放以来我国研究生教育改革政策的变迁——基于词频统计方法和政策工具的视角 被引量:15
17
作者 王梅 张琪佩 程玲 《当代教育论坛》 北大核心 2020年第2期83-91,共9页
改革开放以来,随着我国研究生教育改革政策的陆续出台,研究生教育政策体系初步形成。借助词频统计方法,发现改革开放以来我国研究生教育改革政策的变迁历经了四个阶段,即:1978—1985年的恢复重建阶段,1986—1998年的调整发展阶段,1999—... 改革开放以来,随着我国研究生教育改革政策的陆续出台,研究生教育政策体系初步形成。借助词频统计方法,发现改革开放以来我国研究生教育改革政策的变迁历经了四个阶段,即:1978—1985年的恢复重建阶段,1986—1998年的调整发展阶段,1999—2012年的深化改革阶段,2013年至今的内涵发展阶段。各个阶段具有较好的连贯性和一致性,同时呈现出独特的阶段性特征。在政策变迁的过程中,政策体系趋于完备,政策主体日渐多元。从政策工具理论的视角来看,供给型、环境型、需求型政策工具均有涉及,但不同阶段发挥的作用不均衡,供给型政策工具比例明显高于其他两类政策工具比例。建议深化教育体制改革,强化教育政策制定与施行办法,优化并综合运用政策工具。 展开更多
关键词 研究生教育改革政策 政策变迁 词频统计 政策工具
下载PDF
我国个人信息法律保护现状、主要问题及完善路径--基于《中华人民共和国个人信息保护法》的词频统计与分析 被引量:13
18
作者 文禹衡 于琳 《图书馆理论与实践》 CSSCI 2022年第4期12-21,28,共11页
文章运用词频统计分析法分析《中华人民共和国个人信息保护法》(以下简称《个人信息保护法》)文本的主题分布规律,借助社会网络分析软件对核心词与法条之间的关系进行可视化分析。研究发现,《个人信息保护法》初步建立了完整的个人信息... 文章运用词频统计分析法分析《中华人民共和国个人信息保护法》(以下简称《个人信息保护法》)文本的主题分布规律,借助社会网络分析软件对核心词与法条之间的关系进行可视化分析。研究发现,《个人信息保护法》初步建立了完整的个人信息法律保护框架,个人信息热点问题的立法回应还较为模糊,与其他法律欠缺法秩序的一致性。未来,需要对《个人信息保护法》作出精细化调整,并加快出台《个人信息保护法实施条例》等配套法律法规,为执法提供指导依据。 展开更多
关键词 个人信息 《中华人民共和国个人信息保护法》 词频统计 社会网络分析
下载PDF
基于关键词词频统计的学科研究热点漂移程度模型构建及实证分析 被引量:13
19
作者 余丰民 林彦汝 《情报理论与实践》 CSSCI 北大核心 2020年第2期100-105,共6页
[目的/意义]学科研究热点的发掘有助于了解其发展动向,把握研究方向。热点漂移程度旨在用数据关系描述某一学科某一时间段内的研究热点在接下来一段时期内的变化程度,揭示其热点研究的持续性和规律性。[方法/过程]通过基于学术论文关键... [目的/意义]学科研究热点的发掘有助于了解其发展动向,把握研究方向。热点漂移程度旨在用数据关系描述某一学科某一时间段内的研究热点在接下来一段时期内的变化程度,揭示其热点研究的持续性和规律性。[方法/过程]通过基于学术论文关键词词频统计的文献计量方法,初步构建了研究热点漂移程度计算模型,并通过对"高等教育理论""艺术理论""史学史""自动控制理论""外科护理学"和"建筑经济学"6个学科的实证分析,计算出了这些学科2010年研究热点5年漂移程度。[结果/结论]研究表明,"建筑经济学""史学史"两个学科漂移程度较高,"自动控制理论"和"艺术理论"两个学科居中,"高等教育理论"和"外科护理学"两个学科较低。研究结果具有显著的差异性。热点漂移程度揭示了各学科研究热点的变化程度和关键词词频的分布规律,并在一定程度上体现出了学科的交叉性。 展开更多
关键词 研究热点 热点漂移程度 词频统计 实证分析 模型构建
原文传递
一种基于段落词频统计的论文抄袭判定算法 被引量:12
20
作者 赵俊杰 胡学钢 《计算机技术与发展》 2009年第4期231-233,238,共4页
解决论文抄袭的判定问题不但可以减轻审稿人员的工作负担,而且对于提高学术论文质量、净化学术领域、防止学术腐败都有很重要的意义。从抄袭的定义和法律规定出发,在分析比较国内外主要的论文抄袭判定方法基础上,提出存在的问题和改进策... 解决论文抄袭的判定问题不但可以减轻审稿人员的工作负担,而且对于提高学术论文质量、净化学术领域、防止学术腐败都有很重要的意义。从抄袭的定义和法律规定出发,在分析比较国内外主要的论文抄袭判定方法基础上,提出存在的问题和改进策略,然后给出一种基于段落词频统计的论文抄袭判定算法。此算法不但可以检测出抄袭者成段抄袭的情况,而且可以检测出段落中语句顺序改变、段落内容压缩和扩充的情况,若疑似抄袭还可以将抄袭论文和被抄袭论文的相似内容输出,方便用户进一步审查。 展开更多
关键词 抄袭判定 词频统计 段落相似度 中文分词
下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部