-
题名利用上下文提高文本聚类的效果
被引量:9
- 1
-
-
作者
丘志宏
宫雷光
-
机构
汕头大学计算机系
IBM华生研究中心
-
出处
《中文信息学报》
CSCD
北大核心
2007年第6期109-115,共7页
-
文摘
传统文本聚类的向量空间模型中,认为词的权重只和词频有关,而与词语出现的上下文无关。本文介绍了如何借助按词语之间关系组织的本体论词典对文章进行上下文分析,得到文章中词语之间意义上的相互关系,进而用相关词语的词频以及关系的权重量化地给出一个词语受到上下文的支持程度,所以在衡量词语权重时不仅考虑其词频,而且考虑上下文的支持情况。文章还介绍了如何用自动构建的方法得到本文所需的词典,使得在本体论词典资源还不太丰富的汉语中也能应用上面的方法。实验数据表明,本文的方法能有效的消除噪音,提高文本聚类的效果。
-
关键词
计算机应用
中文信息处理
文本聚类
上下文
词语权重
本体论词典
-
Keywords
computer application
Chinese information processing
text clustering
context
weight
ontology dictionary
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名罗素悖论与多元逻辑方程组无解问题的等价性
被引量:1
- 2
-
-
作者
丘志宏
-
机构
汕头大学计算机系
-
出处
《宜春学院学报》
2010年第S1期34-38,共5页
-
文摘
讨论了无穷序列及其极限的包含、相容、等价关系,主要有如下结论:1、无穷序列包含其极限为假命题;2、无穷序列及其极限相容,潜无穷与实无穷相容;3、无穷序列与其极限不等价;4、罗素悖论与多元逻辑方程组无解问题的等价;5、无穷小数的个数为可数无穷多个,不足以表示整个实数系。
-
关键词
无穷序列
极限
罗素悖论
无穷小数
-
Keywords
infinite sequence
limit
Russell's paradox
infinite decimal number
-
分类号
O144.2
[理学—数学]
-
-
题名集合论中的无穷、维数和悖论分析
- 3
-
-
作者
丘志宏
-
机构
华为公司研究院
-
出处
《宜春学院学报》
2012年第8期40-46,共7页
-
文摘
集合论、传统数学对维数的认识是相互矛盾的,从两方面分析了这个矛盾:1)分析了集合论中空间填充曲线的证明过程,指出在该证明过程中本应使用超穷归纳法进行证明,但实际上却用归纳法进行证明,因此该证明是不严格的;2)分析得出在考虑序关系后,无穷集合中整体和部分的一一映射将包含矛盾。为了分析上述各个矛盾产生的原因,基于代数结构及方程论,建立了一个与集合论等价的代数模型,并把该代数模型与集合论模型进行了对比分析,得出结论:1)罗素悖论、哥德尔不完全性等可以转化为方程组无解的问题。因此虽然在集合论中,罗素悖论、哥德尔不完全性不可避免,但对一个具体的集合,可以判断该集合中是否包含罗素悖论或不完全性命题;2)无穷集合的整体与部分的一一对应将导致矛盾,该矛盾与高维空间物体映射到低维空间后产生的重影点带来的矛盾相同;3)相对于集合论,传统数学对维数的认识更加可靠和严格。
-
关键词
集合论
无穷
罗素悖论
代数结构
-
Keywords
set theory; infinite; Russell’s paradox; algebraic structure
-
分类号
O144
[理学—数学]
-