期刊文献+
共找到19篇文章
< 1 >
每页显示 20 50 100
基于LDA模型的博客垃圾评论发现 被引量:23
1
作者 杨亮 林鸿飞 《中文信息学报》 CSCD 北大核心 2011年第1期41-47,共7页
Blog(博客)作为一种新兴的网络媒体,在很大程度上增强了互联网的开放性,Blog已经成为互联网上的主要信息源之一,这也使得Blog空间中的垃圾评论成倍增长,因此如何识别垃圾评论成为面临的重要问题。该文首先借鉴处理垃圾邮件的方法,针对B... Blog(博客)作为一种新兴的网络媒体,在很大程度上增强了互联网的开放性,Blog已经成为互联网上的主要信息源之一,这也使得Blog空间中的垃圾评论成倍增长,因此如何识别垃圾评论成为面临的重要问题。该文首先借鉴处理垃圾邮件的方法,针对Blog本身的特点,使用规则初步过滤垃圾评论,然后对剩余评论,利用Latent Dirichlet Allocation(LDA)这种能够提取文本隐含主题的产生式模型,对博客中的博文进行主题提取,并结合主题信息进行判断,从而识别Blog空间的垃圾评论。通过实验验证,该方法可以发现大多数垃圾评论,实验取得了较好的结果,使Blog信息更加准确、有效的为用户使用。 展开更多
关键词 BLOG 博文 LDA 主题 垃圾评论
下载PDF
基于BERT-PGN模型的中文新闻文本自动摘要生成 被引量:12
2
作者 谭金源 +1 位作者 祁瑞华 林鸿飞 《计算机应用》 CSCD 北大核心 2021年第1期127-132,共6页
针对文本自动摘要任务中生成式摘要模型对句子的上下文理解不够充分、生成内容重复的问题,基于BERT和指针生成网络(PGN),提出了一种面向中文新闻文本的生成式摘要模型——BERT-指针生成网络(BERTPGN)。首先,利用BERT预训练语言模型结合... 针对文本自动摘要任务中生成式摘要模型对句子的上下文理解不够充分、生成内容重复的问题,基于BERT和指针生成网络(PGN),提出了一种面向中文新闻文本的生成式摘要模型——BERT-指针生成网络(BERTPGN)。首先,利用BERT预训练语言模型结合多维语义特征获取词向量,从而得到更细粒度的文本上下文表示;然后,通过PGN模型,从词表或原文中抽取单词组成摘要;最后,结合coverage机制来减少重复内容的生成并获取最终的摘要结果。在2017年CCF国际自然语言处理与中文计算会议(NLPCC2017)单文档中文新闻摘要评测数据集上的实验结果表明,与PGN、伴随注意力机制的长短时记忆神经网络(LSTM-attention)等模型相比,结合多维语义特征的BERT-PGN模型对摘要原文的理解更加充分,生成的摘要内容更加丰富,全面且有效地减少重复、冗余内容的生成,Rouge-2和Rouge-4指标分别提升了1.5%和1.2%。 展开更多
关键词 生成式摘要模型 预训练语言模型 多维语义特征 指针生成网络 coverage机制
下载PDF
基于BERT-SUMOPN模型的抽取-生成式文本自动摘要 被引量:9
3
作者 谭金源 +2 位作者 杨亮 祁瑞华 林鸿飞 《山东大学学报(理学版)》 CAS CSCD 北大核心 2021年第7期82-90,共9页
可读性、准确性较差,生成式摘要存在连贯性、逻辑性的不足,此外2种摘要方法的传统模型对文本的向量表示往往不够充分、准确。针对以上问题,该文提出了一种基于BERT-SUMOPN模型的抽取-生成式摘要方法。模型通过BERT预训练语言模型获取文... 可读性、准确性较差,生成式摘要存在连贯性、逻辑性的不足,此外2种摘要方法的传统模型对文本的向量表示往往不够充分、准确。针对以上问题,该文提出了一种基于BERT-SUMOPN模型的抽取-生成式摘要方法。模型通过BERT预训练语言模型获取文本向量,然后利用抽取式结构化摘要模型抽取文本中的关键句子,最后将得到的关键句子输入到生成式指针生成网络中,通过EAC损失函数对模型进行端到端训练,结合coverage机制减少生成重复,获取摘要结果。实验结果表明,BERT-SUMOPN模型在BIGPATENT专利数据集上取得了很好的效果,ROUGE-1和ROUGE-2指标分别提升了3.3%和2.5%。 展开更多
关键词 BERT预训练语言模型 结构化模型 指针生成网络 EAC损失函数
原文传递
基于主题感知和语义增强的作文自动评分方法
4
作者 杨勇 +4 位作者 先木斯亚·买买提明 帕力旦·吐尔逊 樊小超 任鸽 《计算机工程》 CAS CSCD 北大核心 2024年第8期363-371,共9页
作文自动评分(AES)是教育领域中应用自然语言处理(NLP)技术的重要研究方向之一,其旨在提高评分效率,增强评价的客观性和可靠性。针对主题相关性缺失和长文本信息丢失问题以及预训练语言模型BERT不同层次能够提取不同维度特征的特点,提... 作文自动评分(AES)是教育领域中应用自然语言处理(NLP)技术的重要研究方向之一,其旨在提高评分效率,增强评价的客观性和可靠性。针对主题相关性缺失和长文本信息丢失问题以及预训练语言模型BERT不同层次能够提取不同维度特征的特点,提出一种基于主题感知和语义增强的作文自动评分模型。该模型采用多头注意力机制提取作文的浅层语义特征并感知作文主题特征,同时利用BERT的中间层句法特征和深层语义特征增强对作文语义的理解。在此基础上,融合不同维度的特征并用于作文自动评分。实验结果表明,该模型在公共数据集ASAP的8个子集上均表现出了显著的性能优势,相比于通义千问等基线模型,其能够有效提升作文自动评分性能,平均二次加权的卡帕值(QWK)达到80.25%。 展开更多
关键词 作文自动评分 语义增强 主题感知 特征融合 预训练语言模型
下载PDF
基于语义拼写理解和门控注意力机制的不良言论检测
5
作者 周险兵 樊小超 +2 位作者 杨勇 任鸽 《计算机应用与软件》 北大核心 2024年第1期112-118,125,共8页
如何自动检测网络传播的不良言论信息是自然语言处理研究领域的热门研究内容之一。针对不良言论中语义表达和拼写习惯的特点,提出一种基于语义拼写理解和门控注意力机制的不良言论检测方法。该方法采用自注意力机制获取文本的语义特征,... 如何自动检测网络传播的不良言论信息是自然语言处理研究领域的热门研究内容之一。针对不良言论中语义表达和拼写习惯的特点,提出一种基于语义拼写理解和门控注意力机制的不良言论检测方法。该方法采用自注意力机制获取文本的语义特征,采用卷积神经网络提取文本的拼写特征,采用前期特征融合和门控注意力机制相结合的方式融合语义和拼写特征。在两个公共数据集上的实验结果表明,提出的模型能够有效地提取不良言论的语义特征,提高不良言论检测的性能。 展开更多
关键词 不良言论检测 语义拼写理解 自注意力机制 早期融合 门控注意力机制
下载PDF
基于云技术的计算机实验室建设与管理研究 被引量:4
6
作者 何海祝 《内蒙古民族大学学报(自然科学版)》 2022年第4期290-294,共5页
近年来,随着“双一流”教学改革逐步推进,高校越来越重视学生的实践能力、创新能力和科研能力的培养,随之而来的是不断扩建的计算机实验室和相应的计算机设备。分析了“双一流”背景下,部分高校在推进计算机实验室建设过程中,所面临的... 近年来,随着“双一流”教学改革逐步推进,高校越来越重视学生的实践能力、创新能力和科研能力的培养,随之而来的是不断扩建的计算机实验室和相应的计算机设备。分析了“双一流”背景下,部分高校在推进计算机实验室建设过程中,所面临的建设与管理两方面存在的问题。从如何最小化建设成本,最优化资源配置,最有效推动实验教学等方面展开了研究,重点阐述了云计算技术应用于计算机实验室具有的技术优势、管理优势和实验教学优势。根据分析结果提出建设基于云计算的计算机实验室的软硬件平台,从而推动传统实验教学向“项目式”实验教学转变的新思路。 展开更多
关键词 双一流 云计算 计算机实验室 云桌面
下载PDF
中文笑话语料库的构建与应用 被引量:5
7
作者 任璐 杨亮 +3 位作者 徐琳宏 樊小超 林鸿飞 《中文信息学报》 CSCD 北大核心 2018年第7期20-29,共10页
笑话作为国家级非物质文化遗产,历史悠久,普遍存在于人们的日常生活中,是最贴近人们生活的艺术体裁之一,笑话的理解也是人工智能发展需要攻克的难题之一。该文构建的大规模中文笑话语料库为人工智能以及语言学研究提供了有利的资源支撑... 笑话作为国家级非物质文化遗产,历史悠久,普遍存在于人们的日常生活中,是最贴近人们生活的艺术体裁之一,笑话的理解也是人工智能发展需要攻克的难题之一。该文构建的大规模中文笑话语料库为人工智能以及语言学研究提供了有利的资源支撑。该文首先归纳总结笑话语料库所依据的笑话相关理论基础,然后对语料库构建中语料标注、语料分析等工作做了详细的介绍,最后在语料库的基础上,分别将笑话与故事、微博、歇后语/谚语以及新闻四种体裁分别做了识别工作,验证了笑话简洁、具有一定的情节、富含情感等特征。同时通过与等长的负例构成的数据集进行笑话识别,验证了所提出特征的有效性。 展开更多
关键词 人工智能 中文笑话语料库 语料标注 笑话识别
下载PDF
案例教学法在计算机类课程教学中的应用 被引量:3
8
作者 《无线互联科技》 2021年第11期167-168,共2页
计算机是大学教育中的必修课程,也是大学教育中重要的一部分。在计算机类课程教学中应用案例教学法能够使教学形式更加丰富,学生可以通过教学案例深刻理解复杂的计算机知识,并从案例中学会如何灵活使用计算机知识。当前计算机类课程教... 计算机是大学教育中的必修课程,也是大学教育中重要的一部分。在计算机类课程教学中应用案例教学法能够使教学形式更加丰富,学生可以通过教学案例深刻理解复杂的计算机知识,并从案例中学会如何灵活使用计算机知识。当前计算机类课程教学中案例教学法的应用还需要进一步加强。基于此,文章将阐述在计算机类课程教学中应用案例教学法的重要性,分析在计算机类课程教学中应用案例教学法的应该坚持的原则,并探究有效应用案例教学法的措施。 展开更多
关键词 案例教学法 计算机教学 应用
下载PDF
基于CDIO理念提升民族院校计算机专业学生实践能力的路径探析
9
作者 《电脑知识与技术》 2023年第6期127-128,146,共3页
民族院校计算机专业学生的基础普遍不高,立足该校实际教学情况,以CDIO理念为基础,将CDIO工程教育理念引入民族院校计算机专业人才的培养模式,以《高级语言程序设计》课程为例进行了教学改革,注重培养学生的综合实践能力,探析通过CDIO理... 民族院校计算机专业学生的基础普遍不高,立足该校实际教学情况,以CDIO理念为基础,将CDIO工程教育理念引入民族院校计算机专业人才的培养模式,以《高级语言程序设计》课程为例进行了教学改革,注重培养学生的综合实践能力,探析通过CDIO理念提升计算机专业学生的专业素养,为我国民族院校计算机专业课程的教学改革提供了借鉴和参考。 展开更多
关键词 民族院校 CDIO理念 实践能力
下载PDF
博客作者声誉度分析 被引量:1
10
作者 杨亮 许侃 +2 位作者 林鸿飞 王健 《计算机科学与探索》 CSCD 2013年第9期838-847,共10页
博客作为一种新兴的网络媒体,它具有自媒体的特征,使其成为舆情产生和传播的主要场所,因此对于博客作者和评论的研究是十分重要的。传统的博客作者声誉度排名是基于点击率和评论数量进行的,在此基础上结合评论的质量和博文的内容实现了... 博客作为一种新兴的网络媒体,它具有自媒体的特征,使其成为舆情产生和传播的主要场所,因此对于博客作者和评论的研究是十分重要的。传统的博客作者声誉度排名是基于点击率和评论数量进行的,在此基础上结合评论的质量和博文的内容实现了对博客作者声誉度的排名。首先通过情感语义特征分析博文,获得博客的情感基调;然后利用基于段落的多句联合评估方法进行评价;最后结合得到的评论倾向性和质量及浏览量等信息获得作者的声誉度。实验结果表明,该方法可以更为有效地对博客作者的声誉度进行排名。 展开更多
关键词 评论质量 情感倾向性 多句联合评估 博客作者声誉度
下载PDF
重庆市江津区推进“腾讯智慧校园”的应用与实践研究
11
作者 漆巨周 胡世祥 《中国现代教育装备》 2021年第8期18-20,共3页
重庆市江津区整区推进“腾讯智慧校园”的应用与实践研究,着力探索降低教育信息化投入成本和技术门槛的途径,努力走出一条资金投入少、技术门槛低,财政支撑可承受、可持续的教育信息化之路,为经济欠发达地区推进教育信息化提供一条可行... 重庆市江津区整区推进“腾讯智慧校园”的应用与实践研究,着力探索降低教育信息化投入成本和技术门槛的途径,努力走出一条资金投入少、技术门槛低,财政支撑可承受、可持续的教育信息化之路,为经济欠发达地区推进教育信息化提供一条可行的路径。 展开更多
关键词 腾讯智慧校园 移动互联网 智慧宣传 智慧教学 智能生态
下载PDF
大数据下机器学习关键技术研究及应用
12
作者 梁艳春 +13 位作者 姜静清 傅晓阳 乔世成 魏中华 裴志利 吕威 姜明洋 王婧 春花 冯广慧 张智丰 李想 路扬 《中国科技成果》 2021年第7期31-31,33,共2页
项目利用机器学习和深度神经网络技术等方法,对生物信息处理技术、NLP深度学习文本特征提取以及视频场景模式识别等领域进行研究,所研究的问题属于人工智能在生物信息提取、优化、识别、文本特征提取识别以及图像视频信息分类描述等领... 项目利用机器学习和深度神经网络技术等方法,对生物信息处理技术、NLP深度学习文本特征提取以及视频场景模式识别等领域进行研究,所研究的问题属于人工智能在生物信息提取、优化、识别、文本特征提取识别以及图像视频信息分类描述等领域中的交叉问题.利用全基因组关联分析的基因重测序数据,提出和研发了一套全基因组的高维SNP相互作用挖掘软件和并行计算平台;将进化算法与信息熵结合,提出了基于模糊C均值、信息熵和人工鱼群的聚类算法.在基于深度学习的高维稀疏分类模型研究、进化算法与信息熵结合研究、智能监护视频对象识别研究,以及检索关键算法研究等方面取得了一系列研究成果,丰富了大数据领域机器学习关键算法的理论研究和应用技术.把人工智能技术与传统养老康复设备相结合,促进了智能养老综合服务平台系统的研发和实现.项目成果对机器学习在信息科学等学科交叉问题中的应用具有重要的理论意义和实用价值. 展开更多
关键词 机器学习 深度神经网络 综合服务平台 对象识别 模式识别 人工智能 大数据 深度学习
原文传递
基于多语义融合的反讽识别 被引量:5
13
作者 樊小超 杨亮 +3 位作者 林鸿飞 申晨 楚永贺 《中文信息学报》 CSCD 北大核心 2021年第6期103-111,共9页
反讽是一种复杂的语言现象,被广泛应用于社交媒体中。如何让计算机具有识别反讽的能力,成为了自然语言处理研究领域的热门研究内容之一。该文针对反讽识别中缺乏上下文语境信息和修辞表达信息的问题,提出了基于多语义融合的反讽识别方... 反讽是一种复杂的语言现象,被广泛应用于社交媒体中。如何让计算机具有识别反讽的能力,成为了自然语言处理研究领域的热门研究内容之一。该文针对反讽识别中缺乏上下文语境信息和修辞表达信息的问题,提出了基于多语义融合的反讽识别方法。该方法采用ELMo从大规模反讽文本中训练得到领域词嵌入表示,并融合基于词性和基于风格信息的语义表示,使用双向长短时记忆网络和卷积神经网络进行反讽识别。实验结果表明,所提出模型能够从多个维度提取反讽文本的潜在语义特征,在公开数据集IAC上的实验性能有显著提升。 展开更多
关键词 反讽识别 多语义融合 神经网络 ELMo
下载PDF
基于多维潜在语义特征的幽默识别 被引量:3
14
作者 樊小超 杨亮 +4 位作者 林鸿飞 申晨 楚永贺 张桐瑄 《中文信息学报》 CSCD 北大核心 2021年第8期38-46,共9页
幽默是人类独有的品质,在日常交际中发挥着重要作用。随着人工智能的快速发展,如何让计算机识别幽默成了自然语言处理研究领域的热门研究内容之一。该文针对幽默的自动识别问题,基于幽默理论和领域知识,系统地分析总结了幽默的五类显著... 幽默是人类独有的品质,在日常交际中发挥着重要作用。随着人工智能的快速发展,如何让计算机识别幽默成了自然语言处理研究领域的热门研究内容之一。该文针对幽默的自动识别问题,基于幽默理论和领域知识,系统地分析总结了幽默的五类显著特性,包括不一致特性、模糊特性、情感特性、语音特性和句法结构特性,并针对每一类特性构建了多种幽默特征。实验结果表明,该文所提出的幽默特征能够从多个角度对幽默的潜在语义表达进行良好的表征,在两个俏皮话类型的幽默数据集上的实验性能均有显著提升。 展开更多
关键词 幽默识别 认知语言学 语义特征 机器学习
下载PDF
基于潜在语义特性的语义双关语检测及双关词定位 被引量:2
15
作者 杨亮 +4 位作者 林鸿飞 吴迪 樊小超 徐博 许侃 《中文信息学报》 CSCD 北大核心 2019年第4期12-19,28,共9页
语义双关语是幽默、笑话和喜剧等作品的来源之一,在人类写作的发展进程中具有重要的历史地位。由于语义双关语存在歧义难懂的特点,因此难以挖掘语义双关语的潜在语义信息,故目前语义双关语的检测和双关词的定位是自然语言处理任务中的... 语义双关语是幽默、笑话和喜剧等作品的来源之一,在人类写作的发展进程中具有重要的历史地位。由于语义双关语存在歧义难懂的特点,因此难以挖掘语义双关语的潜在语义信息,故目前语义双关语的检测和双关词的定位是自然语言处理任务中的一项困难和挑战。该文在语义双关语的理论基础上,挖掘了一系列的潜在语义特性,并构建了对应每个特性的特征集,用以检测语义双关语;同时从潜在语义特性出发,提出了一种基于词向量和同义词融合的语义相似度匹配算法实现语义双关词的定位。在SemEval 2017Task 7和Pun of the Day数据集上均取得了较好的实验结果,验证了该文所提出的检测算法和定位算法。 展开更多
关键词 语义双关句 潜在语义特性 双关词定位 词向量 同义词
下载PDF
基于ECPA神经网络的情绪原因识别方法 被引量:2
16
作者 杨亮 +5 位作者 林鸿飞 樊小超 吴迪 任璐 张冬瑜 许侃 《中文信息学报》 CSCD 北大核心 2021年第6期85-92,共8页
情绪原因识别是文本情绪分析领域中的一个前沿研究方向。传统情绪原因识别方法需要进行规则制定、抽取特征,而该文从情绪原因的语言特点出发,结合Bi-LSTM模型和注意力机制,提出一种基于情绪上下文位置注意力神经网络的情绪原因识别方法(... 情绪原因识别是文本情绪分析领域中的一个前沿研究方向。传统情绪原因识别方法需要进行规则制定、抽取特征,而该文从情绪原因的语言特点出发,结合Bi-LSTM模型和注意力机制,提出一种基于情绪上下文位置注意力神经网络的情绪原因识别方法(ECPA)。该方法考虑了情绪词和情绪类别中的情绪信息,学习了Bi-LSTM模型建模后的上下文语义信息,引入了基于位置信息的注意力机制模型,进而构建情绪原因识别模型。实验结果证明,该方法在情绪原因识别任务中的有效性,并取得了目前最优的性能,同时对情绪归因方法具有一定的指导作用。 展开更多
关键词 情绪原因识别 Bi-LSTM 注意力机制 情绪信息 位置信息
下载PDF
“三个教育”:熔铸区域教育的“江津经验”——重庆市江津区推进教育事业“公平、优质、创新”发展纪实
17
作者 叶子 张富伟 (特约记者) 《今日教育》 2011年第1期36-40,共5页
江津地处重庆“一小时经济圈”的核心圈层,位于大城市和大农村的承接环节,在地域上体现出明显的城乡过渡特征。作为重庆的教育大区。江津紧扣“统筹城乡,均衡教育”的时代脉搏,高举“阳光教育、效率教育、活力教育”三面旗帜,健全... 江津地处重庆“一小时经济圈”的核心圈层,位于大城市和大农村的承接环节,在地域上体现出明显的城乡过渡特征。作为重庆的教育大区。江津紧扣“统筹城乡,均衡教育”的时代脉搏,高举“阳光教育、效率教育、活力教育”三面旗帜,健全了体系,夯实了基础,绘成了一幅幅城乡“同频共振,互动发展”的生动画卷。江津“三个教育”体系的形成既让江津教育自身“打通任督二脉”,迅猛发展,又给了同类区域一个借鉴的模式。 展开更多
关键词 教育事业 江津区 重庆市 区域教育 重庆“一小时经济圈” 公平 经验 熔铸
下载PDF
以大手笔促大气象——专访中共重庆市江津区委书记王银峰
18
作者 叶子 (特约记者) 《今日教育》 2011年第1期41-42,共2页
《今日教育》:王书记,我这里有一组数据.从您2007年开始任区长,后来又任区委书记这几年.全区共投入5.65亿元,新建迁建学校9所,改建扩建学校62所,建设塑胶运动场30片。高等院校从零到八,协议投资达32.84亿元。短短两三年间,... 《今日教育》:王书记,我这里有一组数据.从您2007年开始任区长,后来又任区委书记这几年.全区共投入5.65亿元,新建迁建学校9所,改建扩建学校62所,建设塑胶运动场30片。高等院校从零到八,协议投资达32.84亿元。短短两三年间,江津教育就有了脱胎换骨的变化,干部群众悄然给您送上“教育书记”的称谓。您对教育为何有如此之深的情怀? 展开更多
关键词 区委书记 江津 《今日教育》 重庆市 中共 专访 气象 2007年
下载PDF
探讨文本挖掘技术研究在信息检索中的应用 被引量:1
19
作者 《信息系统工程》 2016年第6期142-142,共1页
文本挖掘指的是对一些具有丰富的语义的文本内容进行分析之后再理解这个文本内容包含的内容和意义的过程,随着科学技术以及经济实力的不断发展,文本挖掘机技术研究已经成为研究中的重要方向。
关键词 文本挖掘技术 信息检索技术
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部