期刊文献+
共找到23篇文章
< 1 2 >
每页显示 20 50 100
基于SNM算法的大数据量中文地址清洗方法 被引量:8
1
作者 郭文龙 《计算机工程与应用》 CSCD 2014年第5期108-111,共4页
中文地址由行政区划地址和详细地址两部分组成,行政区划地址的处理可通过构建地址词典、分词、补充特征字等方式清洗,目前技术较为成熟。详细地址则随我国城镇化的发展而不断变化,且新的地址层出不穷,导致其清洗和规范化工作极其困难。... 中文地址由行政区划地址和详细地址两部分组成,行政区划地址的处理可通过构建地址词典、分词、补充特征字等方式清洗,目前技术较为成熟。详细地址则随我国城镇化的发展而不断变化,且新的地址层出不穷,导致其清洗和规范化工作极其困难。在研究大数据量中文地址的基础上,提出了中文地址清洗模型,在行政区划地址先清洗并规范的前提下,对地址进行排序,利用SNM算法将详细地址聚集在一个较小的窗口内,对窗口内的地址进行匹配和清洗,实验结果证明清洗效果良好。 展开更多
关键词 中文地址 行政区划 详细地址 特征 清洗
下载PDF
基于改进的OLDA模型话题检测及演化分析 被引量:7
2
作者 余本功 张卫春 王龙飞 《情报杂志》 CSSCI 北大核心 2017年第2期102-107,共6页
[目的/意义]话题检测和演化分析是网络舆情监控中的热点问题,对热点话题的检测和演化分析有助于挖掘热点话题和深入理解话题的演化趋势,并给以舆情监控者提供完整的话题演化路径和更为合理的决策意见。[方法/过程]OLDA(Online Latent Di... [目的/意义]话题检测和演化分析是网络舆情监控中的热点问题,对热点话题的检测和演化分析有助于挖掘热点话题和深入理解话题的演化趋势,并给以舆情监控者提供完整的话题演化路径和更为合理的决策意见。[方法/过程]OLDA(Online Latent Dirichlet Allocation)模型是用于挖掘热点话题和分析话题演化的工具,由于其存在新旧主题混合、冗余词较多的缺点,采用双通道模式对主题、词分布的遗传度进行改进,并给出了新的词分布计算方法。[结果/结论]提出的改进OLDA模型解决了新旧主题混合问题,降低冗余词的概率,更为明确地解释话题的含义。实验表明,改进的OLDA模型更为有效地对话题进行检测及演化分析。 展开更多
关键词 网络舆情 OLDA 模型 话题演化 话题检测 Gibbs 采样 特征
下载PDF
自适应不良网页过滤模式的研究与实践 被引量:1
3
作者 唐坚刚 熊国萍 《计算机工程与设计》 CSCD 北大核心 2008年第20期5324-5326,共3页
基于语义的文本过滤方法往往具有较大的时空开销,为了设计实用快捷而有效的过滤系统,创造性地提出了一个基于字频统计和数据挖掘技术的自适应不良网页过滤模式。以校园网作为研究环境,利用自适应语料库构建智能化的分类模式,通过模式识... 基于语义的文本过滤方法往往具有较大的时空开销,为了设计实用快捷而有效的过滤系统,创造性地提出了一个基于字频统计和数据挖掘技术的自适应不良网页过滤模式。以校园网作为研究环境,利用自适应语料库构建智能化的分类模式,通过模式识别过滤校园网中的不良网页。实验结果表明,该模式能以较快的速度和较为满意的准确率过滤测试文档集中的不良网页,具有较强的实用性。 展开更多
关键词 网页过滤 校园网 特征 频统计 过滤模式
下载PDF
微信业务的识别方法研究 被引量:5
4
作者 陈平 郭兰珂 方俊湘 《移动通信》 2013年第18期80-83,共4页
鉴于运营商对微信业务的识别越来越重视,以实际网络环境的测试验证为基础,分析提炼出手机上网流量中的微信业务的识别方法——"业务流程特征字+事务流"的业务识别方法,该方法不仅实现了微信业务各行为流程的识别和分析,还可... 鉴于运营商对微信业务的识别越来越重视,以实际网络环境的测试验证为基础,分析提炼出手机上网流量中的微信业务的识别方法——"业务流程特征字+事务流"的业务识别方法,该方法不仅实现了微信业务各行为流程的识别和分析,还可应用于其他采用TCP协议通信的业务识别。 展开更多
关键词 微信 业务识别 特征 事务流
下载PDF
从殷代文字正体角度谈谈历组卜辞特征字 被引量:1
5
作者 刘源 《故宫博物院院刊》 北大核心 2023年第10期4-9,131,共7页
殷代文字分为正体与变体。正体以青铜器铭文为代表,变体以甲骨文为代表。进行甲骨卜辞字体分类工作,要留意正体和变体的区别。历组卜辞特征字,整体上保持了正体的特点,历组二类尤其明显,并影响了无名组卜辞字体。历组一类字体有笔画圆... 殷代文字分为正体与变体。正体以青铜器铭文为代表,变体以甲骨文为代表。进行甲骨卜辞字体分类工作,要留意正体和变体的区别。历组卜辞特征字,整体上保持了正体的特点,历组二类尤其明显,并影响了无名组卜辞字体。历组一类字体有笔画圆转、字体简化的特点,可能是继承了师组的风格。历组倾向于正体的作风,反映了小屯村中南一系的传统。此外,研究历组卜辞的时代,需重视从戈之字的直柲特征,这是时代较早的证据。 展开更多
关键词 殷代文 正体 历组卜辞 特征
原文传递
基于HTTP协议特征字的识别研究 被引量:3
6
作者 吴欢 宋力 刘遇哲 《计算机与网络》 2015年第9期32-35,共4页
在网络应用日益膨胀的互联网时代,HTTP协议凭借自身众多的优点,应用于大部分的网络应用中,如何通过协议的载荷特征字识别出应用,是当前DPI面临的重要挑战。针对这个挑战,在当前采用的识别技术基础上,对软件更新类应用的识别方法进行了... 在网络应用日益膨胀的互联网时代,HTTP协议凭借自身众多的优点,应用于大部分的网络应用中,如何通过协议的载荷特征字识别出应用,是当前DPI面临的重要挑战。针对这个挑战,在当前采用的识别技术基础上,对软件更新类应用的识别方法进行了简要介绍,主要解决识别过程中识别率低和出现误识别2个问题,采用优化后的特征匹配顺序和资源方法顺序相结合的方法,进行应用识别测试,通过对比前后的测试结果,从而论证特征匹配顺和资源方法顺序的合理性以及识别方法的科学性。 展开更多
关键词 特征 特征匹配 资源方法 识别率 误识别 DPI HTTP
下载PDF
如何方便地查询会计科目编码 被引量:2
7
作者 阎冀恒 陈艳 《辽宁财税》 1998年第6期37-37+18,18,共2页
如何方便地查询会计科目编码阎冀恒陈艳在会计电算化系统中,建立一套科学的会计科目编码方案,对于方便输入、提高效率、减少出错、提供满足需要的会计信息至关重要。本文在讨论了现有编码所存在的不足后,提出了一种模糊查询方法。该... 如何方便地查询会计科目编码阎冀恒陈艳在会计电算化系统中,建立一套科学的会计科目编码方案,对于方便输入、提高效率、减少出错、提供满足需要的会计信息至关重要。本文在讨论了现有编码所存在的不足后,提出了一种模糊查询方法。该方法经实践证明,具有输入方便、出错... 展开更多
关键词 会计科目 科目编码 助记码 重复编码 模糊查询方法 生产成本 会计电算化 特征 开发服务 编码方案
下载PDF
P2P应用的控制
8
作者 张兰萍 《南京晓庄学院学报》 2007年第3期88-90,95,共4页
本文分析了对P2P应用的危害性,介绍了P2P应用的控制架构,提出了P2P应用控制所面临的挑战以及解决方案.
关键词 宽带接入 P2P 深度报文分析 特征
下载PDF
谈笔迹特征信息计算机管理的早期处理
9
作者 韩伟 《中国人民公安大学学报(社会科学版)》 CSSCI 1995年第3期41-44,共4页
笔迹特征信息的早期处理,是指为了实现笔迹特征的计算机信息化管理而由人工对原始档案笔迹资料所进行的信息制作和加工等,它是使笔迹特征由形象化向计算机信息化转换的一个必不可少的过程。这一过程基本上包括两大方面的内容:一是对原... 笔迹特征信息的早期处理,是指为了实现笔迹特征的计算机信息化管理而由人工对原始档案笔迹资料所进行的信息制作和加工等,它是使笔迹特征由形象化向计算机信息化转换的一个必不可少的过程。这一过程基本上包括两大方面的内容:一是对原始笔迹资料进行全面细致地调查研究,分析确定笔迹特征信息载体,合理选择使用特征字; 展开更多
关键词 笔迹特征 计算机管理 特征 笔迹检验 计算机信息化 书写习惯 信息载体 早期处理 信息分类 特征信息
下载PDF
智能型文本过滤的创新模式与系统设计
10
作者 熊国萍 唐敏 《电脑知识与技术》 2010年第4X期3277-3278,共2页
为增强校园网的信息安全,研究基于文本的自适应的智能型不良网页过滤关键技术,提出一种创新模式并开发设计了实验系统。该模式是通过自适应样本库构建不良类类别特征字库,并以此为基础构建智能化的不良类类别模式,用以实现不良网页的过... 为增强校园网的信息安全,研究基于文本的自适应的智能型不良网页过滤关键技术,提出一种创新模式并开发设计了实验系统。该模式是通过自适应样本库构建不良类类别特征字库,并以此为基础构建智能化的不良类类别模式,用以实现不良网页的过滤。实验表明,该模式能以较快的速度和较高的准确率过滤测试文档集中的不良网页。 展开更多
关键词 文本过滤 频统计 自适应 特征
下载PDF
商代甲金文中“天”字构形及用法小考
11
作者 王蕴智 赵伟 《中国文字研究》 2020年第2期1-9,共9页
殷墟甲骨卜辞中的天字具有不同的典型写法,大体可划分出四种特征字形。A形主要用作地名“天邑商”之天;B形主要用作“朕天”之天,指人首之颠;C形与商代金文族徽名用法相当,主要用作族氏名;D形主要用表祭祀对象“天某”之天。“天”或为... 殷墟甲骨卜辞中的天字具有不同的典型写法,大体可划分出四种特征字形。A形主要用作地名“天邑商”之天;B形主要用作“朕天”之天,指人首之颠;C形与商代金文族徽名用法相当,主要用作族氏名;D形主要用表祭祀对象“天某”之天。“天”或为“天某”之简称,这种用法特指祖先神,而不是天神。 展开更多
关键词 商代 特征 用法
下载PDF
深度分组检测技术数据整合思路分析
12
作者 赵金伟 《电信工程技术与标准化》 2018年第5期61-65,共5页
现有DPI系统烟囱式部署,存在重复采、重复存、重复开发、数据格式不一致等现象,无法形成全量数据的全视景,不充分体现数据价值,DPI整体依赖厂家,无法形成需求的自我感知及能力的自我培养。针对现有困境进行了深入剖析,从实际需求出发,... 现有DPI系统烟囱式部署,存在重复采、重复存、重复开发、数据格式不一致等现象,无法形成全量数据的全视景,不充分体现数据价值,DPI整体依赖厂家,无法形成需求的自我感知及能力的自我培养。针对现有困境进行了深入剖析,从实际需求出发,提出了面向多应用系统的统一DPI改造部署方案,为网络侧构建分层、解耦、标准、开放的统一DPI体系奠定了基础。 展开更多
关键词 深度分组检测 特征 识别技术
下载PDF
基于字频统计和数据挖掘技术的不良网页过滤模式的构建与应用
13
作者 唐坚刚 熊国萍 《厦门大学学报(自然科学版)》 CAS CSCD 北大核心 2007年第A02期69-71,共3页
为快速有效地过滤不良网页以保障校园网信息安全,创造性地提出了一个基于字频统计和数据挖掘技术的不良网页过滤模式,通过自适应样本库构建不良类类别特征字库,并以此为基础构建智能化的不良类类别模式,用以实现不良网页的过滤.实验表明... 为快速有效地过滤不良网页以保障校园网信息安全,创造性地提出了一个基于字频统计和数据挖掘技术的不良网页过滤模式,通过自适应样本库构建不良类类别特征字库,并以此为基础构建智能化的不良类类别模式,用以实现不良网页的过滤.实验表明,该模式能以较快的速度和较高的准确率过滤测试文档集中的不良网页. 展开更多
关键词 网页过滤 频统计 特征 数据挖掘
下载PDF
数据恢复在电子数据取证与司法鉴定中的应用 被引量:8
14
作者 马国富 马胜利 +2 位作者 王子贤 李双印 程雨丝 《河北大学学报(自然科学版)》 CAS 北大核心 2015年第5期538-545,共8页
在对电子数据恢复取证与司法鉴定应用现状进行分析的基础上,提出了一种电子数据恢复取证与司法鉴定模型,通过在电子数据恢复流程中实施多人数字签名、流程监管、介质镜像和哈希校验,提高电子数据在诉讼案件中的可采信力、证明力和法律效... 在对电子数据恢复取证与司法鉴定应用现状进行分析的基础上,提出了一种电子数据恢复取证与司法鉴定模型,通过在电子数据恢复流程中实施多人数字签名、流程监管、介质镜像和哈希校验,提高电子数据在诉讼案件中的可采信力、证明力和法律效力.模型针对数据恢复介质毁坏的不同情况,有针对性地分别利用文件定位算法、文件特征字算法、文档碎片重组算法进行精准、高效的电子数据恢复取证与司法鉴定.实验结果表明,该模型在保证正确率的基础上,具有良好的工作效率. 展开更多
关键词 数据恢复 司法鉴定 文件定位 文件特征 文档碎片
下载PDF
基于地址语义理解的中文地址识别方法 被引量:8
15
作者 李晓林 张懿 李霖 《计算机工程与科学》 CSCD 北大核心 2019年第3期551-558,共8页
互联网中中文地址文本蕴含着丰富的空间位置信息,为了更加有效地获取文本中的地址位置信息,提出一种基于地址语义理解的地址位置信息识别方法。通过对训练语料进行词频统计,制定地址要素特征字集合和字转移概率,构造特征字转移概率矩阵... 互联网中中文地址文本蕴含着丰富的空间位置信息,为了更加有效地获取文本中的地址位置信息,提出一种基于地址语义理解的地址位置信息识别方法。通过对训练语料进行词频统计,制定地址要素特征字集合和字转移概率,构造特征字转移概率矩阵,并结合字符串最大联合概率算法,设计了一种不依赖地名词典和词性标注的地址识别方法。实验结果表明,该方法对地址要素特征字突出且存在歧义的中文地址的完全匹配率为76.85%,识别准确率为93.11%。最后,与机械匹配算法和基于经验构造转移概率矩阵的方法进行对比实验,实验结果表明了该方法的可用性和有效性。 展开更多
关键词 地址语义 要素特征 转移概率 无词典
下载PDF
从手写汉字识别系统的技术方法中探讨计算机笔迹鉴别的一些途径 被引量:3
16
作者 艾小伟 吴小平 +1 位作者 王金林 付松 《河北公安警察职业学院学报》 2005年第3期22-26,共5页
本文介绍了目前国内手写汉字识别研究的现状、存在的困难、识别的过程及其技术路线和方法,探讨了计算机笔迹鉴别智能系统应包含的主要内容及其研发途径。
关键词 手写汉识别 笔迹鉴别智能系统 特征挑选 笔迹特征提取 特征价值 样品
下载PDF
一种基于特征字的FTP协议识别方法研究 被引量:3
17
作者 王景中 王伟萌 《信息网络安全》 2015年第7期26-31,共6页
互联网的普及与发展,带动了互联网宽带业务的发展,同时把网络监管技术推向业界人士关注的视野中。网络监管部门和网络服务提供商需要通过网络监管技术来准确了解日趋复杂庞大的互联网流量。随着互联网技术的发展,一些传统网络监管技术... 互联网的普及与发展,带动了互联网宽带业务的发展,同时把网络监管技术推向业界人士关注的视野中。网络监管部门和网络服务提供商需要通过网络监管技术来准确了解日趋复杂庞大的互联网流量。随着互联网技术的发展,一些传统网络监管技术逐渐失去原有作用。其中,现有网络FTP业务采用传统端口识别技术已经无法准确有效地判别出FTP协议。文章提出一种基于特征字的FTP协议识别方法,用以识别流经现有网络的FTP数据包,并准确检测出FTP协议。文章同时提出一种结合FTP协议默认端口识别与FTP协议特征字识别的方案,联合两种识别方法检测FTP流量。相比采用单一FTP协议默认端口识别方法,在不影响识别效率的情况下,联合识别方法提高了FTP协议识别准确性;相比采用单一FTP协议特征字识别方法,在不影响识别准确性的情况下,联合识别方法提高了识别效率。文章最后提出一种自动提取FTP特征的方法,用于对FTP协议自动进行分类。 展开更多
关键词 FTP协议 协议识别 特征检测 协议自动分类
下载PDF
基于TMS320C50的雷达信号环境模拟仿真器的实现
18
作者 许建忠 莫华 《河北大学学报(自然科学版)》 CAS 2003年第1期81-84,共4页
介绍了基于TMS320C50的雷达信号环境模拟仿真器的设计和实现。重点阐述了能够产生仿真雷达信号的数字仿真器的设计。通过利用TMS320C50将雷达参数转换成实时特征字数据流,由信号转换电路形成射频雷达信号,仿真复杂多变的雷达环境。
关键词 雷达信号处理 雷达信号环境模拟仿真器 TMS320C50 仿真器 实时特征数据流
下载PDF
病毒检测技术在查杀“熊猫烧香”中的实证分析
19
作者 任师尊 《长春大学学报》 2007年第12期47-50,共4页
为了更好地查杀"熊猫烧香"病毒,我们研究了常用病毒扫描器对"熊猫烧香"存在的明显不足,并指出改进办法,通过介绍几种病毒检测方法,研究其在"熊猫烧香"中的具体应用。
关键词 病毒检测 特征扫描 启发式 虚拟机
下载PDF
“信息管理系统生成器”中文数据的处理技术
20
作者 邱英汉 邱才楷 《佛山科学技术学院学报(自然科学版)》 CAS 2002年第4期43-46,共4页
使用“仿 BNF”对极其复杂的“信息管理系统”进行简洁而准确的描述。提出统一处理中文数据的解决方案。该方案引进的数字串特征字 ,状态继承性等概念 ,思路新颖 ,在中文代码识别时 ,计算量少 ,效率高。
关键词 中文数据 信息管理系统 生成器 网络通信 网页生成 数据处理 特征
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部