-
题名文本蕴涵的推理模型与识别模型
被引量:17
- 1
-
-
作者
袁毓林
王明华
-
机构
北京大学中文系汉语语言学研究中心
浙江大学国际教育学院
-
出处
《中文信息学报》
CSCD
北大核心
2010年第2期3-13,共11页
-
基金
国家社会科学基金资助项目(07AYY00A)
国家863高技术发展计划资助项目(2007AA01Z173)
-
文摘
该文首先介绍一个逼近文本蕴涵关系的推理模型,它由带有推理规则集的蕴涵型式知识库和相关的概率评价构成。接着介绍习得推理规则和蕴涵型式及其概率的几种方法,包括从平行或单一语料库中学习和从网络文件中学习。然后介绍基于词汇概率的蕴涵识别模型,包括通过构建词汇蕴涵的概率模型和基于词汇所指的语义匹配模型来逼近文本蕴涵的几种方法。最后介绍基于句法的语义分析模型,包括基于依存树节点匹配、论元结构或原子命题匹配等处理模型。
-
关键词
计算机应用
中文信息处理
文本蕴涵
推理模型
蕴涵型式
识别模型
词汇概率
句法语义
-
Keywords
computer application
Chinese information processing
textual entailment : inference model
entailment pattern
recognizing models
lexical probability
syntax and semantics
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名中文分词算法解析
被引量:15
- 2
-
-
作者
张磊
张代远
-
机构
南京邮电大学计算机学院
-
出处
《电脑知识与技术》
2009年第1期192-193,共2页
-
文摘
中文分词是计算机中文信息处理中的难题,而中文分词算法是其中的核心,但由于中英文环境中语素的不同特点,使得中文必须要解决分词的问题。这篇文章较为深刻的阐述了中分分词的算法,基于对分词算法的理解和对匹配法分词的分析,对最大匹配分词方法进行了较深入的研究探讨,提出了什么算法是解决分词效率的最佳方法以及各种方法的比较优劣等问题,及可能产生的歧义.对不同的算法给予了充分的解释,通过对各种算法的比较,总结出了比较常用和效率较高的算法。
-
关键词
中文分词
最大匹配算法
最大概率算法
算法
系统
-
Keywords
chinese lexical analysis
forward maximum matching method
maxamum probability method
algorithm
system
-
分类号
TP391
[自动化与计算机技术—计算机应用技术][自动化与计算机技术—计算机科学与技术]
-
-
题名基于多标记特征选择的英语词汇语义预测方法
- 3
-
-
作者
田烨
-
机构
咸阳师范学院外国语学院
-
出处
《信息技术》
2023年第11期87-91,98,共6页
-
基金
陕西省教育厅2020年度一般专项科学研究计划(20JK0432)。
-
文摘
为了精准预测大学生英语词汇语义掌握程度,提出基于多标记特征选择的英语词汇语义预测方法,通过多标记特征选择方法计算词汇样本相似度,构建样本相似矩阵,获取词汇样本特征,同时依靠特征参数对英语词汇的分布函数与几率密度函数进行计算,凭借计算结果优化极大似然算法,计算英语词汇语义预测的参数下线,以此确保预测的准确度,使用云计算方法对英语词汇之间的特征迭代计算。实验结果表明,所提方法能够精确预测出大学生所掌握的英语词汇语义,并且还能够分析大学生在不同语法的词汇语义掌握状况。
-
关键词
多标记特征选择
英语词汇语义
几率密度后汉书
相似度
特征提取
-
Keywords
multi-label feature selection
English lexical semantics
probability density post Chinese dictionary
similarity
feature extraction
-
分类号
TP315
[自动化与计算机技术—计算机软件与理论]
-