期刊文献+
共找到1,792篇文章
< 1 2 90 >
每页显示 20 50 100
文档中词语权重计算方法的改进 被引量:120
1
作者 鲁松 李晓黎 +1 位作者 白硕 王实 《中文信息学报》 CSCD 北大核心 2000年第6期8-13,20,共7页
文本的形式化表示一直是文本检索、自动文摘和搜索引擎等信息检索领域关注的基础性问题。向量空间模型 (VectorSpaceModel)中的tf.idf文本表示是该领域里得到广泛应用并且取得较好效果的一种文本表示方法。词语在文本集合中的分布比例... 文本的形式化表示一直是文本检索、自动文摘和搜索引擎等信息检索领域关注的基础性问题。向量空间模型 (VectorSpaceModel)中的tf.idf文本表示是该领域里得到广泛应用并且取得较好效果的一种文本表示方法。词语在文本集合中的分布比例量上的差异是决定词语表达文本内容的重要因素之一 ,但现在tf.idf方法无法把握这一因素。针对这个问题 ,本文引入信息论中信息增益的概念 ,提出一种对tf.idf的改进方法tf.idf.IG文本表示方法。该方法将词语的信息增益作为一个文本表示的一个因子 ,来衡量词语在文本集合中分布比例在量上的差异。在文本分类实验中 ,tf.idf.IG文本表示的向量空间模型的分类效果要好于tf.idf方法 ,验证了改进方法tf.idf.IG的有效性和可行性。 展开更多
关键词 文本表示 向量空间模型 词语分布比例 信息增益
下载PDF
基于内容的垃圾邮件过滤技术综述 被引量:129
2
作者 王斌 潘文锋 《中文信息学报》 CSCD 北大核心 2005年第5期1-10,共10页
垃圾邮件问题日益严重,受到研究人员的广泛关注。基于内容的过滤是当前解决垃圾邮件问题的主流技术之一。目前基于内容的垃圾邮件过滤主要包括基于规则的方法和基于概率统计的方法。本文综述了目前用于垃圾邮件过滤研究的各种语料和评... 垃圾邮件问题日益严重,受到研究人员的广泛关注。基于内容的过滤是当前解决垃圾邮件问题的主流技术之一。目前基于内容的垃圾邮件过滤主要包括基于规则的方法和基于概率统计的方法。本文综述了目前用于垃圾邮件过滤研究的各种语料和评价方法,并总结了目前使用的垃圾邮件过滤技术以及它们之间的对比实验,包括Ripper、决策树、Rough Set、Rocchio、Boosting、Bayes、kNN、SVM、Winnow等等。实验结果表明,Boosting、Flexible Bayes、SVM、Winnow方法是目前较好的垃圾邮件过滤方法,它们在评测语料上的结果已经达到很高水平,但是,要走向真正实用化,还有很多的工作要做。 展开更多
关键词 计算机应用 中文信息处理 综述 垃圾邮件 反垃圾邮件 信息过滤 文本分类
下载PDF
电气设备局部放电模式识别研究综述 被引量:90
3
作者 唐志国 唐铭泽 +3 位作者 李金忠 王健一 吴超 汪可 《高电压技术》 EI CAS CSCD 北大核心 2017年第7期2263-2277,共15页
电气设备局部放电模式识别是指对电气设备的放电故障类型进行识别。作为局部放电故障诊断技术的基础,它为局部放电风险程度评估提供重要的参考信息。对国内外在电气设备局部放电模式识别技术方面的研究现状进行梳理,分别从局部放电模式... 电气设备局部放电模式识别是指对电气设备的放电故障类型进行识别。作为局部放电故障诊断技术的基础,它为局部放电风险程度评估提供重要的参考信息。对国内外在电气设备局部放电模式识别技术方面的研究现状进行梳理,分别从局部放电模式构造、特征量提取以及分类器选择3方面进行归纳总结。讨论了目前局部放电模式识别各环节研究及实践中存在的问题,最后从融合多种放电模式的特征量信息、优化改进分类器以及寻优分类决策等方面对局部放电模式识别技术的发展进行展望。 展开更多
关键词 局部放电 模式识别 局部放电模式 特征量 分类器 信息融合 分类决策
下载PDF
网络新媒体信息披露的经济后果研究——基于股价同步性的视角 被引量:80
4
作者 何贤杰 王孝钰 +1 位作者 孙淑伟 朱红军 《管理科学学报》 CSSCI CSCD 北大核心 2018年第6期43-59,共17页
近年来,微博等网络新媒体的出现对公众信息的传播方式和及时性产生了重大的影响.尤其在资本市场中,这些网络新媒体丰富了上市公司发布信息的内容,增加了投资者获取信息的渠道,在一定程度上促进了证券市场的定价效率.文章通过手工搜集并... 近年来,微博等网络新媒体的出现对公众信息的传播方式和及时性产生了重大的影响.尤其在资本市场中,这些网络新媒体丰富了上市公司发布信息的内容,增加了投资者获取信息的渠道,在一定程度上促进了证券市场的定价效率.文章通过手工搜集并逐条阅读上市公司在新浪微博上发布的信息,从股价同步性的视角对上市公司披露的微博信息内容的经济后果进行了考察.研究结果显示,微博信息中经营活动及策略类信息占比越高的公司的股价同步性越低,并且这个结果在考虑内生性影响后依旧存在.文章还发现,聘请十大会计师事务所、信息透明度越高以及分析师跟踪人数越多的公司,其微博有用信息降低股价同步性的作用更强.这些结果说明,投资者并非接收所有微博信息并做出反应,只有当公司透明度较高、发布信息质量较高,并且微博信息内容具有价值的情况下,公司层面信息才能通过微博有效地传递给投资者,从而影响资本市场. 展开更多
关键词 微博 信息披露 信息内容 股价同步性
下载PDF
对地理信息分类编码的认识与思考 被引量:34
5
作者 何建邦 李新通 《地理学与国土研究》 CSSCI CSCD 北大核心 2002年第3期1-7,共7页
面向GIS的地理信息分类编码是在概念水平上解决空间信息分层组织与属性数据库结构设计的重要方法。该文从地理实体、地理数据与地理信息概念角度 ,探讨地理信息分类编码对象的本质特征 ;简要分析大多数商品化GIS软件中属性数据的表达方... 面向GIS的地理信息分类编码是在概念水平上解决空间信息分层组织与属性数据库结构设计的重要方法。该文从地理实体、地理数据与地理信息概念角度 ,探讨地理信息分类编码对象的本质特征 ;简要分析大多数商品化GIS软件中属性数据的表达方式 ,指出地理信息分类编码实质上是从GIS数据组织的概念层次上对属性信息的分类分级 ;提出地理信息分类粒度概念 ,并建立地理信息分类模型 ,列举了在不同视图下的粗粒地理信息分类方案和代码用途 ;提出并讨论地理信息分类编码尚待进一步研究的问题 ,以及国内长期以来难以形成地理信息分类标准的原因。 展开更多
关键词 地理信息 分类模型 分类粒度 编码方法 GIS 地理实体 地理数据
下载PDF
基于BP神经网络的多源遥感影像分类 被引量:30
6
作者 贾永红 张春森 王爱平 《西安科技学院学报》 北大核心 2001年第1期58-60,共3页
在研究人工神经网络理论的基础上 ,应用动量法和学习率自适应调整的策略 ,改进了BP神经网络法。并用于对同一地区的LandsatTM3,4,5影像和航空SAR影像融合进行分类和分类融合结果进行了比较。结果表明 :同标准的BP神经网络、传统的Bayes... 在研究人工神经网络理论的基础上 ,应用动量法和学习率自适应调整的策略 ,改进了BP神经网络法。并用于对同一地区的LandsatTM3,4,5影像和航空SAR影像融合进行分类和分类融合结果进行了比较。结果表明 :同标准的BP神经网络、传统的Bayes融合分类法相比 ,改进的BP神经网络融合法不仅获得了标准BP网络高的分类精度 ,可同Bayes融合媲美 ,而且提高了学习率 ,增强了算法的可靠性 ,因而提高了影像分类速度 ,更适用于遥感影像分类。 展开更多
关键词 BP神经网络 信息融合 分类
下载PDF
基于CSP与SVM算法的运动想象脑电信号分类 被引量:49
7
作者 刘冲 赵海滨 +1 位作者 李春胜 王宏 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2010年第8期1098-1101,共4页
针对基于两种不同意识任务(想象左手运动和想象右手运动)的脑机接口,使用共空间模式(common spatial pattern,CSP)算法对BCI 2003竞赛数据进行特征提取;基于滑动时间窗,利用CSP方法对C3,Cz和C4位置的脑电信号进行处理.利用支持向量机对... 针对基于两种不同意识任务(想象左手运动和想象右手运动)的脑机接口,使用共空间模式(common spatial pattern,CSP)算法对BCI 2003竞赛数据进行特征提取;基于滑动时间窗,利用CSP方法对C3,Cz和C4位置的脑电信号进行处理.利用支持向量机对特征进行分类,获得最大分类正确率82.86%,最佳时间点4.09 s,最大互信息0.47 bit,最大互信息陡度0.431 bit/s.与BCI 2003竞赛结果相比,最大互信息陡度有了显著提高,证明该方法更适合BCI实时系统的要求. 展开更多
关键词 脑电信号 脑机接口 共空间模式 支持向量机 互信息 分类时间
下载PDF
地震应急信息的特征、分类与作用 被引量:38
8
作者 苏桂武 聂高众 高建国 《地震》 CSCD 北大核心 2003年第3期27-35,共9页
在讨论地震应急信息概念内涵的基础上,首先分析了地震应急信息的基本特征,认为地震应急除具有信息的一般性质外,还具有复杂性、时效性、等级层次性、不完全性和动态变化等特点。之后讨论了地震应急信息的分类体系,认为依据不同的分类标... 在讨论地震应急信息概念内涵的基础上,首先分析了地震应急信息的基本特征,认为地震应急除具有信息的一般性质外,还具有复杂性、时效性、等级层次性、不完全性和动态变化等特点。之后讨论了地震应急信息的分类体系,认为依据不同的分类标准,可得到不同的应急信息分类体系,如信息的生成领域分类、信息的综合水平分类和信息的记录符号分类等;但对于实际工作而言,使用最多的也是实际指导意义最大的分类则是以信息所反映的客观对象或所表达的地震应急某方面问题的不同为分类标准。依据这一标准,地震应急信息可分为基础背景类、地震灾害和救灾背景类、法律法规类、预案与规划类、地震对策类、防震减灾示范与演习经验类、地震台网类、应急联络类、历史地震类、地震救灾案例类、救灾能力储备类、震情类、灾情类、应急决策和应急辅助决策类、灾害现场类、救灾物资及人员调配和调动类、社会反应类共17个主要类别。最后分析了信息在地震应急中的作用,表明不同类型的地震应急信息,其在地震应急中的具体功能和主要作用具有明显差别。 展开更多
关键词 地震应急信息 信息特征 信息分类 地震灾害 防震 救灾
下载PDF
基于信息熵分段聚合近似和谱聚类的负荷分类方法 被引量:45
9
作者 林顺富 田二伟 +3 位作者 符杨 汤晓栋 李东东 王群京 《中国电机工程学报》 EI CSCD 北大核心 2017年第8期2242-2252,共11页
居民和商业负荷参与需求响应项目时,负荷数据日趋多维化和海量化,需要对其进行降维分类处理。提出一种基于信息熵分段聚合近似(information entropy piecewise aggregate approximation,IEPAA)和谱聚类的负荷分类方法。首先采用IEPAA对... 居民和商业负荷参与需求响应项目时,负荷数据日趋多维化和海量化,需要对其进行降维分类处理。提出一种基于信息熵分段聚合近似(information entropy piecewise aggregate approximation,IEPAA)和谱聚类的负荷分类方法。首先采用IEPAA对典型日负荷数据集进行可变时间分辨率重表达,进一步采用基于距离和曲线形态的双尺度相似性度量谱聚类算法进行聚类处理,从而获得合理的负荷分类结果。利用商业办公楼宇中央空调机组的典型日负荷数据对所提方法进行了验证,表明该方法在数据降维、负荷分类有效性、稳定性和降低运算量等方面均具有优势。 展开更多
关键词 需求响应 信息熵 聚合近似 谱聚类 负荷分类
下载PDF
网络文本数据分类技术与实现算法 被引量:29
10
作者 李勇 桑艳艳 《情报学报》 CSSCI 北大核心 2002年第1期21-26,共6页
本文主要论述网络文本数据挖掘中的文本分类技术原理、方法 ,同时给出实现文档分类和类型匹配的若干算法 ,最后介绍文本分类正确率评价指标以及网络文本数据检索系统应用实证测评分析。
关键词 数据挖掘 网络文本数据 文本分类技术 信息检索 模型 类型匹配 算法
下载PDF
《个人信息保护法》视角下侵犯公民个人信息罪要件的调整 被引量:41
11
作者 刘宪权 何阳阳 《华南师范大学学报(社会科学版)》 CSSCI 北大核心 2022年第1期141-154,207,208,共16页
有关侵犯公民个人信息罪"公民个人信息"定义的司法解释与《个人信息保护法》规定,本质上不存在冲突。侵犯公民个人信息罪中的"个人信息"不包含死者个人信息。司法解释很难将融合度较高的信息精准归入某一类别的信... 有关侵犯公民个人信息罪"公民个人信息"定义的司法解释与《个人信息保护法》规定,本质上不存在冲突。侵犯公民个人信息罪中的"个人信息"不包含死者个人信息。司法解释很难将融合度较高的信息精准归入某一类别的信息之中,且对生物识别信息缺乏明确规定和归类。《个人信息保护法》在个人信息的分类上归纳性较强,且突出了对生物识别信息的保护。应参考《个人信息保护法》中对个人信息的"二分法",及时调整司法解释对个人信息的分类。合法获取个人信息后非法使用个人信息的行为相比非法获取个人信息的行为社会危害性更大,理应归入刑法规制范围。应根据信息的分类,调整侵犯公民个人信息罪"情节严重"的起刑点和量刑标准,加大对敏感个人信息的刑法保护力度。 展开更多
关键词 个人信息 分类标准 敏感个人信息 行为方式 情节严重 起刑点
下载PDF
普通高校学报办刊现状调查与分析 被引量:39
12
作者 郭伟 李伟 《中国科技期刊研究》 CSSCI 北大核心 2020年第12期1486-1494,共9页
【目的】全面调查我国普通高校学报办刊现状,解决基础数据不充足、不精准的问题,为制定普通高校学报发展政策、改革方案,以及开展高校学术期刊研究提供数据支撑。【方法】通过国家新闻出版署官方网站、中国知网、学报官方网站调查统计... 【目的】全面调查我国普通高校学报办刊现状,解决基础数据不充足、不精准的问题,为制定普通高校学报发展政策、改革方案,以及开展高校学术期刊研究提供数据支撑。【方法】通过国家新闻出版署官方网站、中国知网、学报官方网站调查统计普通高校学报的数量、文种、出版地、出版周期、主办单位、刊名、学科属性、载文量变化趋势,并划分"双一流"高校、普通本科高校、高职高专院校3类主办单位层次进行对比分析。【结果】截至2020年5月26日,我国共有普通高校学报1257种(不含港澳台地区),819种为双月刊;"双一流"高校主办学报122种,普通本科高校主办992种,高职高专院校主办143种;自然科学与工程技术类学报457种,人文社会科学类456种,自然科学与工程技术和人文社会科学混合型315种;近10年整体载文量呈现明显的下降趋势。【结论】普通高校学报是极具特色的学术期刊,是我国学术期刊的重要成员,"大综合"并不是普通高校学报的主体。建议增加期刊登记信息的发布数量,促进普通高校学报专业化转型,通过政策引导加强内容建设。 展开更多
关键词 普通高校学报 办刊现状 期刊信息 载文量趋势 学科属性 学科分类
原文传递
CIMS中的信息分类编码技术及其发展 被引量:22
13
作者 皮德常 张凤林 +1 位作者 丁宗红 王宁生 《计算机集成制造系统-CIMS》 EI CSCD 北大核心 2002年第1期77-80,共4页
从CIMS对信息集成的要求出发 ,探讨了CIMS中的信息分类编码问题。在分析国内外一些主要分类编码系统的基础上 ,指出了它们的不足之处 ,并结合实际应用系统 ,提出了两个适合CIMS信息集成的分类编码系统 :一个是具有分级柔性的分类编码系... 从CIMS对信息集成的要求出发 ,探讨了CIMS中的信息分类编码问题。在分析国内外一些主要分类编码系统的基础上 ,指出了它们的不足之处 ,并结合实际应用系统 ,提出了两个适合CIMS信息集成的分类编码系统 :一个是具有分级柔性的分类编码系统模型 ,另一个是功能强大、基于面向对象思想构造的分类编码系统模型。 展开更多
关键词 编码 信息分类 CIMS 成组技术 信息集成 计算机集成制造
下载PDF
虚拟建设──新型的工程项目管理组织模式 被引量:15
14
作者 彭勇 邢文 《建筑管理现代化》 2001年第2期43-45,共3页
现代信息技术和通讯技术的高速发展对工程项目管理的思想、组织、方法和手段产生了深远的影响,并且已逐渐在改变着工程项目管理的组织模式。文章分析了虚拟建设产生的背景,提出了虚拟建设的概念和内涵,概述了虚拟建设实施过程的方法... 现代信息技术和通讯技术的高速发展对工程项目管理的思想、组织、方法和手段产生了深远的影响,并且已逐渐在改变着工程项目管理的组织模式。文章分析了虚拟建设产生的背景,提出了虚拟建设的概念和内涵,概述了虚拟建设实施过程的方法和手段,以期对虚拟建设这种新型的工程项目管理模式的实践起指导作用。 展开更多
关键词 工程项目管理 虚拟建设 信息分类 组织模式 建筑业
下载PDF
知网与同义词词林的信息融合研究 被引量:28
15
作者 梅立军 周强 +1 位作者 臧路 陈祖舜 《中文信息学报》 CSCD 北大核心 2005年第1期63-70,共8页
本文主要探讨了将知网 (HowNet)和同义词词林进行信息融合的方法。我们针对知网对词的概念描述和同义词词林对词的语义分类的特点 ,提出了一种词典信息融合的方法 :首先为词林的每个词集确定一个与知网中DEF类似的概念描述 ,在此基础上... 本文主要探讨了将知网 (HowNet)和同义词词林进行信息融合的方法。我们针对知网对词的概念描述和同义词词林对词的语义分类的特点 ,提出了一种词典信息融合的方法 :首先为词林的每个词集确定一个与知网中DEF类似的概念描述 ,在此基础上对两部词典中同时收录且均只有一个义项的词语进行双向意义联结 ,最后根据分类算法对两部词典中同时收录非单一义项的词语进行双向意义联结。实验表明 ,本文提出的处理策略达到了 93%的信息融合正确率 ,融合后形成的新词典兼有词林的分类学信息和知网的概念描述信息。 展开更多
关键词 计算机应用 中文信息处理 词典信息融合 知网 同义词词林 分类
下载PDF
基于信息增益的特征词权重调整算法研究 被引量:33
16
作者 张玉芳 陈小莉 熊忠阳 《计算机工程与应用》 CSCD 北大核心 2007年第35期159-161,共3页
传统权重公式TFIDF忽略了词语在集合中的分布比例,针对TFIDF的这个缺点,把信息增益公式引入文本集合中并提出IF*IDF*IG,取得了较好的效果。在分析中发现单纯把信息增益引入文本集合并不能完全解决词语分布对词语权重的影响。从文档类别... 传统权重公式TFIDF忽略了词语在集合中的分布比例,针对TFIDF的这个缺点,把信息增益公式引入文本集合中并提出IF*IDF*IG,取得了较好的效果。在分析中发现单纯把信息增益引入文本集合并不能完全解决词语分布对词语权重的影响。从文档类别层次上考虑,把信息论中信息增益应用到文本集合的类别层次上,提出了一种改进的权重公式tf*idf*IGc,用改进的权重公式来衡量词语在文本集合的各个类别中分布比例上的差异,进一步弥补传统公式的不足。实验对比了改进的公式tf*idf*IGc和IF*IDF*IG的实验效果,实验证明tf*idf*IGc权重公式在表现词语权重时更有效。 展开更多
关键词 信息增益 信息熵 词语分布比例 文本分类
下载PDF
信息中心网络研究综述 被引量:35
17
作者 夏春梅 徐明伟 《计算机科学与探索》 CSCD 2013年第6期481-493,共13页
网络需求由主机到主机的通信演进为主机到网络的海量信息访问。现有互联网采用以地址为中心的网络通信模型,适用于主机到主机的通信,在主机到网络的通信中效率不高。为了满足新的网络需求,信息中心网络(information-centric networking,... 网络需求由主机到主机的通信演进为主机到网络的海量信息访问。现有互联网采用以地址为中心的网络通信模型,适用于主机到主机的通信,在主机到网络的通信中效率不高。为了满足新的网络需求,信息中心网络(information-centric networking,ICN)成为研究热点。阐述了ICN的基本思想,分析了ICN的特点,并从命名、路由、分发和缓存四方面对ICN进行了分类;总结了ICN采用的五类关键技术,即信息命名、名字解析、路由转发、信息分发和信息缓存技术;对现有ICN方案进行了总结、分析和评价;给出了ICN研究中仍存在的问题和未来的研究方向。 展开更多
关键词 信息中心网络(ICN) 信息命名 信息缓存 ICN分类 内容中心网络(CCN)
下载PDF
基于深度学习的数据融合方法研究综述 被引量:35
18
作者 张红 程传祺 +1 位作者 徐志刚 李建华 《计算机工程与应用》 CSCD 北大核心 2020年第24期1-11,共11页
数据融合是最大程度发挥大数据价值的关键,深度学习是挖掘数据深层特征信息的技术利器,基于深度学习的数据融合能够充分挖掘大数据潜在价值,从新的深度和广度拓展对世界的探索和认识。综述了近几年基于深度学习的数据融合方法的相关文献... 数据融合是最大程度发挥大数据价值的关键,深度学习是挖掘数据深层特征信息的技术利器,基于深度学习的数据融合能够充分挖掘大数据潜在价值,从新的深度和广度拓展对世界的探索和认识。综述了近几年基于深度学习的数据融合方法的相关文献,以此了解深度学习在数据融合中应用所具有的优势。分类阐述常见的数据融合方法,同时指出这些方法的优点和不足。从基于深度学习特征提取的数据融合方法、基于深度学习融合的数据融合方法、基于深度学习全过程的数据融合方法三个方面对基于深度学习的数据融合方法进行分析,并做了对比研究与总结。总结全文并讨论了深度学习在数据融合中应用的难点和未来需要进一步研究的问题。 展开更多
关键词 数据融合 信息融合 深度学习 算法分类
下载PDF
网络信息的分类组织 被引量:30
19
作者 王春芳 石晓华 《图书馆论坛》 CSSCI 北大核心 2000年第6期72-74,共3页
介绍了目前国内网络信息的特点及网络信息资源管理的现状 ,分析了传统文献揭示方式———线性方式的缺陷 。
关键词 网络信息 分类组织 信息资源管理 分类检索系统
下载PDF
领域术语自动抽取及其在文本分类中的应用 被引量:31
20
作者 刘桃 刘秉权 +1 位作者 徐志明 王晓龙 《电子学报》 EI CAS CSCD 北大核心 2007年第2期328-332,共5页
本文提出了一种基于信息熵的领域术语抽取方法,在给定领域分类语料的前提下,该方法既考虑了领域术语在不同领域类别间分布的不均匀性,又考虑了其在特定领域类别内分布的均匀性,并针对语料的不平衡性进行了正规化.人工评测显示该方法能... 本文提出了一种基于信息熵的领域术语抽取方法,在给定领域分类语料的前提下,该方法既考虑了领域术语在不同领域类别间分布的不均匀性,又考虑了其在特定领域类别内分布的均匀性,并针对语料的不平衡性进行了正规化.人工评测显示该方法能更准确有效地抽取领域术语.本文还将该算法应用于文本分类,用于代替传统特征选择算法,实验表明,该算法能够显著提高文本分类的精度. 展开更多
关键词 领域术语 信息熵 正规化 文本分类 特征选择
下载PDF
上一页 1 2 90 下一页 到第
使用帮助 返回顶部