期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
基于PCM聚类算法的Blog社区发现 被引量:5
1
作者 柳助民 李绍滋 +2 位作者 林达 柯逍 曹冬林 《厦门大学学报(自然科学版)》 CAS CSCD 北大核心 2009年第4期508-513,共6页
针对传统的社区发现算法无法发现社区中的核心成员和边界成员的缺点,提出了基于PCM聚类算法的Blog社区发现算法,用来识别Blog社区的核心和边界.首先,使用随机行走的方法计算可以衡量两个Blog亲密度的对称社会距离;然后,在对称社区距离... 针对传统的社区发现算法无法发现社区中的核心成员和边界成员的缺点,提出了基于PCM聚类算法的Blog社区发现算法,用来识别Blog社区的核心和边界.首先,使用随机行走的方法计算可以衡量两个Blog亲密度的对称社会距离;然后,在对称社区距离的基础上使用PCM聚类算法对Blog进行聚类,得到每个社区中的成员属于社区的概率表示.最后,通过确定相应的概率阈值,确定社区的核心和边界.实验结果表明:该算法能够获得社区中的成员属于社区的概率,根据这个概率可以确定社区中的核心成员和边界成员. 展开更多
关键词 Blog社区发现 随机行走 对称社会距离 PCM聚类算法
下载PDF
基于模式分类的汉语时态确定方法研究 被引量:5
2
作者 林达 李绍滋 《中文信息学报》 CSCD 北大核心 2006年第1期67-75,共9页
汉语时态是中文信息处理领域的一个难点。基于规则的处理方法在无时态特征词的句子,多时态特征词的句子处理等方面存在很大问题。本文从统计的角度,提出一种基于模式分类的时态确定方法,该方法综合评价句子中每个词对时态确定所作的贡献... 汉语时态是中文信息处理领域的一个难点。基于规则的处理方法在无时态特征词的句子,多时态特征词的句子处理等方面存在很大问题。本文从统计的角度,提出一种基于模式分类的时态确定方法,该方法综合评价句子中每个词对时态确定所作的贡献,能够处理无时态特征词的句子和多时态特征词的句子,并且该方法使用线性判别函数,具有对多维数据分析,训练与判别速度快的特性。在开放测试环境下,对单句的汉语时态确定正确率与召回率分别为79.8%和95.3%。 展开更多
关键词 计算机应用 中文信息处理 汉语 时态 特征词 线性判别函数 感知器准则函数
下载PDF
文本检索模型综述 被引量:3
3
作者 曹冬林 林达 《心智与计算》 2007年第4期426-432,共7页
文本检索是信息检索一个重要的分支。随着互联网信息的迅速膨胀,如何检索到用户最需要的信息变得越来越关键。文本检索模型是文本检索中的核心技术,其性能直接影响到搜索引擎的检索质量。本文对当前的经典检索模型及其研究进展进行介绍... 文本检索是信息检索一个重要的分支。随着互联网信息的迅速膨胀,如何检索到用户最需要的信息变得越来越关键。文本检索模型是文本检索中的核心技术,其性能直接影响到搜索引擎的检索质量。本文对当前的经典检索模型及其研究进展进行介绍,并分析各个模型之间的优缺点。 展开更多
关键词 文本检索 检索模型
原文传递
基于模式分类的中医医案分析技术 被引量:2
4
作者 林达 李绍滋 《心智与计算》 2007年第3期385-390,共6页
中医药经历数千年的发展,已积累了大量数据,特别是从古到今的医案数据,但这些数据因没有用现代信息手段整理、分析,而不能为中医药的科学研究提供支持。本文将模式分类技术应用于医案数据的分析中,从已知的病症推断出所属的证型。该方... 中医药经历数千年的发展,已积累了大量数据,特别是从古到今的医案数据,但这些数据因没有用现代信息手段整理、分析,而不能为中医药的科学研究提供支持。本文将模式分类技术应用于医案数据的分析中,从已知的病症推断出所属的证型。该方法能够进行自动学习,不需要专家的辅助即可从医案中学习到病症和证型的联系。 展开更多
关键词 中医 医案 模式分类
原文传递
基于新型聚类算法IncreaseK-Means的Blog相似度分析 被引量:2
5
作者 吴海华 李绍滋 +2 位作者 林达 柯逍 曹冬林 《厦门大学学报(自然科学版)》 CAS CSCD 北大核心 2009年第2期194-197,共4页
针对现有聚类算法K-均值存在事先指定聚类类数及仿射传播存在计算复杂度偏高的缺陷,提出了一种新型的聚类算法IncreaseK-Means,并将其应用到Blog内容的相似度聚类分析中,较好地满足了社区发现和话题跟踪的需求.仿真结果表明:在Blog文本... 针对现有聚类算法K-均值存在事先指定聚类类数及仿射传播存在计算复杂度偏高的缺陷,提出了一种新型的聚类算法IncreaseK-Means,并将其应用到Blog内容的相似度聚类分析中,较好地满足了社区发现和话题跟踪的需求.仿真结果表明:在Blog文本聚类分析中,IncreaseK-Means在时间上与K-Means相近,在精度上与仿射传播接近,适用于大规模网络文本的分析处理. 展开更多
关键词 INCREASE K-MEANS K-MEANS 仿射传播 聚类 特征提取
下载PDF
Mining User Role in Social Community Application of Web 2.0
6
作者 林达 曹冬林 李绍滋 《Journal of Donghua University(English Edition)》 EI CAS 2010年第2期204-208,共5页
With the development of web 2.0, more and more social community applications appeared. The classical type of this kind of application is blog and facebook. The most important feature of these applications is that it i... With the development of web 2.0, more and more social community applications appeared. The classical type of this kind of application is blog and facebook. The most important feature of these applications is that it is a self-media and users can post their own ideas in Internet. By using these social community applications, a big social network is formed. To study the feature of social network, it is important to mine the individual information at the beginning. In this paper, we propose a User Role based method to mine the relation between the user and object thing. First, we extract the User Role from the semantic dictionary Wordnet. Then, the feature of User Role is also mined by considering the hypemymy and hyponymy relation. Finally, we can use these features to deduce the User Role. In our experiments, we use a big corpus from TREC 2006 to test the mining performance. The experiment results show that the User Role effectively explores the feature of user. 展开更多
关键词 User Role social network analysis User Role extraction
下载PDF
基于时间分布特征的博客突发事件检测 被引量:9
7
作者 林达 李绍滋 曹冬林 《计算机工程与科学》 CSCD 北大核心 2010年第10期145-149,共5页
博客是目前网络舆论的重要载体之一,如何自动检测博客中的突发事件对于舆情分析与疏导具有重要的研究价值。针对目前突发事件检测中存在的时间信息有歧义的虚假突发事件问题,本文提出了一种基于时间分布特征的博客突发事件检测方法。该... 博客是目前网络舆论的重要载体之一,如何自动检测博客中的突发事件对于舆情分析与疏导具有重要的研究价值。针对目前突发事件检测中存在的时间信息有歧义的虚假突发事件问题,本文提出了一种基于时间分布特征的博客突发事件检测方法。该方法通过波峰检测和计算事件文档与背景语料文档之间、事件相关文档和不相关文档之间的时间分布差异来判断该事件在时间特征上是否具有突发性和关联性。实验结果表明,该方法可有效检测博客中的突发事件并可有效去除时间信息有歧义的虚假突发事件。 展开更多
关键词 时间分布特征 KL距离 时间信息明确的事件 时间信息有歧义的事件
下载PDF
基于互联网搜索与反馈验证的图像自动标注 被引量:1
8
作者 俞建松 曹冬林 +1 位作者 李绍滋 林达 《计算机工程》 CAS CSCD 2012年第24期211-215,共5页
基于网页的图像自动标注存在图像与文本的关联假设问题,而基于内容的方法则存在数据规模小的问题。为此,将基于内容和基于网页的自动标注方法相结合,提出基于互联网搜索和反馈验证的图像自动标注方法。利用网页关联文本从互联网搜索结... 基于网页的图像自动标注存在图像与文本的关联假设问题,而基于内容的方法则存在数据规模小的问题。为此,将基于内容和基于网页的自动标注方法相结合,提出基于互联网搜索和反馈验证的图像自动标注方法。利用网页关联文本从互联网搜索结果中提取候选标注词,根据候选标注词在搜索得到图片的内容特征进行反馈验证。实验结果表明,该方法具有大规模标注能力,准确率比基于网页的图像自动标注方法提高了7.92%。 展开更多
关键词 图像自动标注 互联网搜索 网页 关联文本 图像内容特征 反馈验证
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部