基于统计机器翻译模型的问句检索模型,其相关性排序机制主要依赖于词项间的翻译概率,然而已有的模型没有很好地控制翻译模型的噪声,使得当前的问句检索模型存在不完善之处.文中提出一种基于主题翻译模型的问句检索模型,从理论上说明,该...基于统计机器翻译模型的问句检索模型,其相关性排序机制主要依赖于词项间的翻译概率,然而已有的模型没有很好地控制翻译模型的噪声,使得当前的问句检索模型存在不完善之处.文中提出一种基于主题翻译模型的问句检索模型,从理论上说明,该模型利用主题信息对翻译进行合理的约束,达到控制翻译模型噪声的效果,从而提高问句检索的结果.实验结果表明,文中提出的模型在MAP(Mean Average Precision)、MRR(Mean Reciprocal Rank)以及p@1(precision at position one)等指标上显著优于当前最先进的问句检索模型.展开更多
知识图谱嵌入的目标是为知识图谱中的实体和关系生成低维连续的特征向量,以便计算机能够通过数学运算来挖掘知识的潜在语义,并将其应用于三元组补全、实体分类和实体解析等下游任务。翻译模型(Trans)是一种简单而有效的知识图谱嵌入方法...知识图谱嵌入的目标是为知识图谱中的实体和关系生成低维连续的特征向量,以便计算机能够通过数学运算来挖掘知识的潜在语义,并将其应用于三元组补全、实体分类和实体解析等下游任务。翻译模型(Trans)是一种简单而有效的知识图谱嵌入方法,其采用负采样的方法来提高知识图谱嵌入的准确性。然而,传统的负采样方法采用随机负采样,容易生成低质量的负三元组,从而导致实体和关系的嵌入向量训练不准确。针对这个问题,该文提出基于Canopy和K-means方法的相似实体负样本生成器(Negative Sampling of Similar Entities,NSSE),用于生成高质量的负样本。实验结果表明,使用NSSE的翻译模型相比原有模型在嵌入向量生成方面取得更好的效果。展开更多
文摘基于统计机器翻译模型的问句检索模型,其相关性排序机制主要依赖于词项间的翻译概率,然而已有的模型没有很好地控制翻译模型的噪声,使得当前的问句检索模型存在不完善之处.文中提出一种基于主题翻译模型的问句检索模型,从理论上说明,该模型利用主题信息对翻译进行合理的约束,达到控制翻译模型噪声的效果,从而提高问句检索的结果.实验结果表明,文中提出的模型在MAP(Mean Average Precision)、MRR(Mean Reciprocal Rank)以及p@1(precision at position one)等指标上显著优于当前最先进的问句检索模型.
文摘知识图谱嵌入的目标是为知识图谱中的实体和关系生成低维连续的特征向量,以便计算机能够通过数学运算来挖掘知识的潜在语义,并将其应用于三元组补全、实体分类和实体解析等下游任务。翻译模型(Trans)是一种简单而有效的知识图谱嵌入方法,其采用负采样的方法来提高知识图谱嵌入的准确性。然而,传统的负采样方法采用随机负采样,容易生成低质量的负三元组,从而导致实体和关系的嵌入向量训练不准确。针对这个问题,该文提出基于Canopy和K-means方法的相似实体负样本生成器(Negative Sampling of Similar Entities,NSSE),用于生成高质量的负样本。实验结果表明,使用NSSE的翻译模型相比原有模型在嵌入向量生成方面取得更好的效果。