期刊文献+
共找到11篇文章
< 1 >
每页显示 20 50 100
主题特征格分析:一种用户生成文本质量评估方法 被引量:9
1
作者 钟将 张淑芳 +1 位作者 郭卫丽 李雪 《电子学报》 EI CAS CSCD 北大核心 2018年第9期2201-2206,共6页
本文设计了一种用户生成文本的质量分析框架.首先,基于主题分析构建商品类别主题特征集合.其次,利用主题特征与商品分类的强关联关系,构建形式化概念分析的形式背景,将分类-主题概念格化简并生成主题特征格,以此构建五个质量特征并生成... 本文设计了一种用户生成文本的质量分析框架.首先,基于主题分析构建商品类别主题特征集合.其次,利用主题特征与商品分类的强关联关系,构建形式化概念分析的形式背景,将分类-主题概念格化简并生成主题特征格,以此构建五个质量特征并生成质量评估模型.最后,在真实评论数据上的实验结果表明新方法具有更高预测精度. 展开更多
关键词 用户评论 质量评估 主题特征 主题特征格
下载PDF
融合句法特征与语义特征的作文自动评分方法
2
作者 陈宇航 杨勇 +3 位作者 帕力旦·吐尔逊 樊小超 任鸽 刁宇峰 《计算机与现代化》 2024年第11期64-69,共6页
作文自动评分是一种利用自然语言处理技术对作文进行自动评估和打分的技术。作文自动评分能够提升评分效率,降低人工成本,确保评分的客观性和一致性,在教育领域有着广泛的应用前景。尽管句法特征和主题特征在作文自动评分中扮演着重要角... 作文自动评分是一种利用自然语言处理技术对作文进行自动评估和打分的技术。作文自动评分能够提升评分效率,降低人工成本,确保评分的客观性和一致性,在教育领域有着广泛的应用前景。尽管句法特征和主题特征在作文自动评分中扮演着重要角色,但迄今为止,关于如何更好地利用这些特征进行作文自动评分的研究还相对不足。本文提出融合句法特征与语义特征的作文自动评分方法 ISSF,该模型采用Parser提取作文的句法特征,采用BERT和适配器的训练方式提取作文的深层语义特征,为了更好地利用作文的主题特征和句法特征及深层语义特征的关联性,采用自注意力机制提取作文的主题特征并用于句法特征强化和深层语义特征强化。实验结果表明,本文提出的ISSF模型在公共数据集ASAP的8个子集上取得了较好的平均性能,相比于通义千问等基线模型,ISSF模型在评分范围较大、评分标准复杂的情况下更具有性能优势。 展开更多
关键词 作文自动评分 主题特征 句法特征 深层语义特征
下载PDF
一种融合Wikipedia类图和主题特征的短文本检索方法 被引量:2
3
作者 李璞 肖宝 +2 位作者 孙玉胜 张志锋 邓璐娟 《河南师范大学学报(自然科学版)》 CAS 北大核心 2019年第6期22-30,共9页
社交网络的快速发展催生出大量短文本数据.鉴于短文本具有长度短、信息量少、特征稀疏、语法不规则等特点,根据Wikipedia类图(Wikipedia Category Graph,WCG)中包含的结构信息,通过分析其中的主题特征,提出一种语义特征选择及关联度计... 社交网络的快速发展催生出大量短文本数据.鉴于短文本具有长度短、信息量少、特征稀疏、语法不规则等特点,根据Wikipedia类图(Wikipedia Category Graph,WCG)中包含的结构信息,通过分析其中的主题特征,提出一种语义特征选择及关联度计算方法.以此为基础,通过计算用户查询与目标短文本之间的语义关联度,实现对短文本的检索和排序.最后通过在Twitter子集上的实验结果表明,融合Wikipedia类图和主题特征的短文本检索方法比现有一些检索方法在评估指标MAP,P@k及R-Prec上具有更好的效果. 展开更多
关键词 Wikipedia类图 主题特征 短文本 信息检索
下载PDF
基于动态网络表示学习的学者合作关系预测研究 被引量:1
4
作者 李一帆 王玙 《情报科学》 CSSCI 北大核心 2022年第6期115-123,共9页
【目的/意义】随着学科交叉与学科融合的不断深入,科研工作越来越需要多个学者合作完成。识别潜在的合作关系,为学者推荐适合的合作对象,能有效提高科研效率。【方法/过程】基于动态网络表示学习模型对学者合作关系预测展开研究。首先,... 【目的/意义】随着学科交叉与学科融合的不断深入,科研工作越来越需要多个学者合作完成。识别潜在的合作关系,为学者推荐适合的合作对象,能有效提高科研效率。【方法/过程】基于动态网络表示学习模型对学者合作关系预测展开研究。首先,提出一种动态网络表示学习模型DynNE_Atten。其次,根据图书情报领域的文献数据构建动态科研合作网络和动态关键词共现网络,使用DynNE_Atten模型得到作者向量表示和关键词向量表示,同时提取作者单位特征。最后,融合作者合作、主题与单位特征,预测未来可能产生的合作。【结果/结论】实验结果表明,本文提出的动态网络表示学习模型在时序链路预测任务中只需要较少的输入数据,就能达到较高的准确性;相比于未融合特征的学者表示,融合模型在合作关系预测中展现出明显的优势。【创新/局限】提出了一种新的动态网络表示学习模型,并融合主题特征和作者单位特征进行科研合作预测,取得了较好的结果。目前模型在特征融合的方式上只考虑了数据层面的异构,并未考虑网络层面的异构。 展开更多
关键词 动态网络表示学习 合作关系预测 特征融合 主题特征 作者单位特征 时序链路预测
原文传递
一种基于最近搜索周期被引用频率的改进WPR算法
5
作者 王旭阳 任国盛 《计算机科学》 CSCD 北大核心 2016年第2期86-88,共3页
针对WPR(Weighted PageRank)算法存在的在网页搜索方面的主题漂移和偏重旧网页的现象,综合网页的主题特征和最近搜索周期网页的被引用频率两个因素,提出了一种改进的算法WTFPR(Weighted Topic Frequency PageRank)。该算法通过内容分析... 针对WPR(Weighted PageRank)算法存在的在网页搜索方面的主题漂移和偏重旧网页的现象,综合网页的主题特征和最近搜索周期网页的被引用频率两个因素,提出了一种改进的算法WTFPR(Weighted Topic Frequency PageRank)。该算法通过内容分析,采用改进的TD-IDF算法来解决网页相关性,改善主题漂移现象;通过网页的最近搜索周期的被引用频率来提高那些较新而且价值较高的网页的PR值,从而改善偏重旧网页的现象。仿真结果表明,改进后的算法与WPR算法相比获得了更好的效果。 展开更多
关键词 主题特征 被引用频率 偏重旧网页 搜索周期 主题漂移
下载PDF
中文社交媒体用户性别预测研究——以新浪微博短文本内容为例
6
作者 刘雅琦 李得志 王瑞雪 《知识管理论坛》 2021年第4期213-227,共15页
[目的/意义]与互联网的高速发展不同,个人信息安全保护的发展相对滞后,通过预测社交媒体用户的性别,能够更好地针对不同性别用户提供隐私保护。[方法/过程]以新浪微博这一社交媒体中用户发布的短文本为研究对象,从中抽取语言特征和主题... [目的/意义]与互联网的高速发展不同,个人信息安全保护的发展相对滞后,通过预测社交媒体用户的性别,能够更好地针对不同性别用户提供隐私保护。[方法/过程]以新浪微博这一社交媒体中用户发布的短文本为研究对象,从中抽取语言特征和主题特征,为每一个用户构建基于语言特征、主题特征以及两个特征叠加的特征表达向量,利用SVM机器学习算法构建性别预测的分类器。[结果/结论]实验表明,从微博短文本中抽取的语言特征和主题特征能够准确预测用户性别,其效果在主要评价指标中均有大幅提升。 展开更多
关键词 短文本 性别预测 主题特征 语言特征
原文传递
论魏晋南北朝时期的“四季”诗
7
作者 刘桂华 《殷都学刊》 2010年第2期49-54,共6页
魏晋南北朝时期,诗歌创作获得巨大发展。那时的中国,一年四季,四季分明,不同季节具有不同的气候特点、物候特征。众多诗人感应着四季不同的物候变化,感物兴思,诗情勃发,创作了大量季节特点鲜明的"四季"诗。相较而言,春秋二季... 魏晋南北朝时期,诗歌创作获得巨大发展。那时的中国,一年四季,四季分明,不同季节具有不同的气候特点、物候特征。众多诗人感应着四季不同的物候变化,感物兴思,诗情勃发,创作了大量季节特点鲜明的"四季"诗。相较而言,春秋二季,气温变化最明显,物候变化最显著,人们的情思也最活跃,所以成为诗歌创作的丰收季节。而夏冬二季,气候炎热或冷寒,人们的思维活动受限,情思也就较为单一,诗歌创作也就稍逊许多。 展开更多
关键词 魏晋南北朝 “四季”诗 题材特点
下载PDF
话题及其特征的多维研究
8
作者 周慧先 《韶关学院学报》 2005年第8期65-69,共5页
根据三个平面理论,话题是个语用成分,指述说的对象。它在语句线性序列中的位置分布及其形式都与它所承载的信息内容密切相关。当它传递已知信息时,一般位于语句的开头,其形式为表示特指的名词短语、代词或无形的零回指;当它传递新知信息... 根据三个平面理论,话题是个语用成分,指述说的对象。它在语句线性序列中的位置分布及其形式都与它所承载的信息内容密切相关。当它传递已知信息时,一般位于语句的开头,其形式为表示特指的名词短语、代词或无形的零回指;当它传递新知信息时,则位于语句的结尾或中间,其形式为表示泛指的名词短语。由于任何语句都是句法、语义、语用的结合体,因此,在语用平面表现为话题的成分在语义平面可能表现为施事或受事等语义成分、在句法平面则表现为主语、宾语或状语等句法成分。 展开更多
关键词 活题 特征 语用 语义 句法
下载PDF
人工智能政策与规划的主题结构:基于主题词共现网络分析 被引量:13
9
作者 章小童 李月琳 《情报资料工作》 CSSCI 北大核心 2019年第4期44-55,共12页
文章使用内容分析和主题词共现网络分析对我国人工智能发展水平3个不同梯队的9个省市及国家层级的10项人工智能发展规划政策文件进行了研究,旨在揭示各项政策文本内容的主题分布结构特征,从而为进一步解读相关文件提供参考,也为未来政... 文章使用内容分析和主题词共现网络分析对我国人工智能发展水平3个不同梯队的9个省市及国家层级的10项人工智能发展规划政策文件进行了研究,旨在揭示各项政策文本内容的主题分布结构特征,从而为进一步解读相关文件提供参考,也为未来政策文件制定、优化及相关研究提供借鉴。研究发现:基础理论研究与关键共性技术创新是人工智能发展原驱动力;人工智能示范应用工作是政策布局的关键组成部分;各省市根据其经济基础、产业结构、社会文化特征等因素对未来人工智能发展进行规划,其人工智能政策主题分布存在显著差异;各省市人工智能政策共现网络相似度与其智能发展水平梯队分类无明显关联。 展开更多
关键词 人工智能 政策分析 主题结构特征 共现网络分析
原文传递
融合话题多维特征和用户兴趣偏好的微博话题推荐研究 被引量:9
10
作者 单晓红 崔凤艳 刘晓燕 《现代情报》 CSSCI 2022年第5期69-76,97,共9页
[目的/意义]为了防止微博话题推荐引发信息茧房效应,提出融合微博话题特征和目标用户兴趣偏好的话题推荐方法,实现了在不降低推荐精确率的同时提高话题推荐结果的多样性,进而达到提高用户满意度的目的。[方法/过程]首先根据用户历史微... [目的/意义]为了防止微博话题推荐引发信息茧房效应,提出融合微博话题特征和目标用户兴趣偏好的话题推荐方法,实现了在不降低推荐精确率的同时提高话题推荐结果的多样性,进而达到提高用户满意度的目的。[方法/过程]首先根据用户历史微博内容获取用户兴趣偏好,进一步以协同过滤算法为基础,计算目标用户相似性,然后计算话题新鲜度、重要度、信任度指标并进行线性加和,得到目标用户对微博话题的综合兴趣度,最后,根据用户偏好和综合兴趣度计算目标用户对微博话题的兴趣度并降序排列,得到Top-N个话题推荐结果。[结果/结论]在真实微博数据上的实验结果表明,该方法取得了理想的预期效果,推荐效果既能保证准确性,又能体现多样性,并且有效缓解了推荐结果单一、容易引发信息茧房的问题。 展开更多
关键词 微博话题推荐 协同过滤 话题新鲜度 话题多维特征
下载PDF
菲律宾学习者对汉语话题结构的习得研究
11
作者 胡丽娜 郑丽娜 常辉 《惠州学院学报》 2017年第5期63-68,共6页
汉语是话题突出语言,菲律宾语是话题不突出语言。根据句子可接受度判断测试,笔者考察了菲律宾学习者能否习得汉语话题特征,以及母语和汉语二语水平在汉语话题结构习得中的作用。结果表明,菲律宾学习者对汉语话题结构的判断接近汉语母语... 汉语是话题突出语言,菲律宾语是话题不突出语言。根据句子可接受度判断测试,笔者考察了菲律宾学习者能否习得汉语话题特征,以及母语和汉语二语水平在汉语话题结构习得中的作用。结果表明,菲律宾学习者对汉语话题结构的判断接近汉语母语使用者,能够习得汉语话题突出特性。另外,他们对移位类话题结构的习得先于基础生成类话题结构,对表时间和地点的话题结构、话题和主语是领属关系的话题结构,以及关于话题结构的习得比较早。最后,母语和二语水平在他们习得汉语话题结构时均发挥了重要作用。研究结果支持"接口假说"。 展开更多
关键词 话题突出 话题结构 汉语习得 基础生成 移位
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部