期刊文献+
共找到13篇文章
< 1 >
每页显示 20 50 100
基于BERT的长文本分类方法 被引量:7
1
作者 刘博 蒲亦非 《四川大学学报(自然科学版)》 CAS CSCD 北大核心 2023年第2期75-82,共8页
由于预训练模型输入分词数量限制,基于BERT的长文本分类任务效果与长文本分割后的文本段集合的处理及特征融合密切相关,现有的长文本分类研究在融合文本段特征时更关注文本段之间原始的顺序关系,而本文提出了一种基于BERT和集合神经网... 由于预训练模型输入分词数量限制,基于BERT的长文本分类任务效果与长文本分割后的文本段集合的处理及特征融合密切相关,现有的长文本分类研究在融合文本段特征时更关注文本段之间原始的顺序关系,而本文提出了一种基于BERT和集合神经网络的长文本分类模型.该方法以BERT为基础,可处理从同一文本样本分割得到的任意数量文本段,经过BERT后得到文本段特征,再将所有文本段特征输入到具有置换不变性的集合神经网络层中,提取出集合级别特征来优化长文本的特征表达.通过在三个数据上的实验分析,论文在平均分词长度较长的数据集上取得了90.82%的准确率,高出目前最优方法4.37%. 展开更多
关键词 文本分类 BERT 集合神经网络 长文本
下载PDF
基于BERT与主题模型联合增强的长文档检索模型 被引量:2
2
作者 覃俊 刘璐 +2 位作者 刘晶 叶正 张泽谨 《中南民族大学学报(自然科学版)》 CAS 北大核心 2023年第4期469-476,共8页
尽管将BERT运用在Ad-hoc文档检索领域能够提升任务精确度,但也存在两个显著缺陷:第一,由于BERT存在输入限制,对长文档进行截断会导致文档信息丢失;第二,Ad-hoc文档检索任务的数据集中存在相当数量的领域特定词,而BERT不能较好地学习这... 尽管将BERT运用在Ad-hoc文档检索领域能够提升任务精确度,但也存在两个显著缺陷:第一,由于BERT存在输入限制,对长文档进行截断会导致文档信息丢失;第二,Ad-hoc文档检索任务的数据集中存在相当数量的领域特定词,而BERT不能较好地学习这些特定词的特征.而利用LDA主题模型不存在输入限制,可以表示完整的语义信息的优点,将其引入联合增强模型,且对文档中的领域特定词及语义内涵进行学习表征,弥补了BERT模型的不足.为此提出RWT-BERT联合增强模型通过对BERT和LDA主题模型的表征构建交互网络,对查询语句和长文档进行更深层次的特征挖掘.实验结果表明:该模型在3个数据集的主要指标上都有不同程度的提升,尤其在Core17数据集上,与目前效果最好的句子级Ad-hoc文档检索模型Birch相比,nDCG@20指标提高了4.01%. 展开更多
关键词 文档检索 预训练模型 长文档 主题模型 信息检索
下载PDF
Word长文档框架结构的编排技巧 被引量:1
3
作者 万德年 《电脑学习》 2011年第1期64-66,共3页
本文介绍了Word长文档框架结构的编排技巧。
关键词 长文档 样式 目录 大纲视图
下载PDF
Word长文档编排技术研究
4
作者 裴来芝 宁云智 《无线互联科技》 2018年第22期60-61,共2页
Word长文档因为结构和格式复杂,人们在处理这样的文档的时候,常常不知道怎样着手去排版,往往出现版面混乱不堪,目录也不能自动生成的情况。文章通过长文档编辑的主要知识,高效快速地指导如何对长文档进行编辑。
关键词 长文档 样式 目录 方法与技巧
下载PDF
信息化教学实践——以长文档制作为例
5
作者 顾敏 《信息与电脑》 2017年第12期252-253,256,共3页
计算机多媒体融图、文、声于一体的认知环境以及先进的网络技术,使得人们教育、教学的传统观念发生了很大变化。信息化教学主要是借助网络环境提供的技术条件,彻底摒弃"满堂灌"的教学模式。从现在教育领域普及多媒体教学手段... 计算机多媒体融图、文、声于一体的认知环境以及先进的网络技术,使得人们教育、教学的传统观念发生了很大变化。信息化教学主要是借助网络环境提供的技术条件,彻底摒弃"满堂灌"的教学模式。从现在教育领域普及多媒体教学手段可以看出,信息化教学的开展给学校教学带来了翻天覆地的变化。学生的学习方式也变得更加多元化,特别是手机的使用,如果老师能把手机利用起来,能促进学生主动学习。 展开更多
关键词 信息化 长文档制作 移动学习 泛在学习
下载PDF
Word长文档排版
6
作者 高平 《数字技术与应用》 2019年第2期231-232,共2页
Word长文档具有内容多、篇幅长的特点,因此排版工作量相对较复杂。如果处理方式不规范,不仅效率低下、易于返工,甚至会导致版面格式的混乱。
关键词 WORD 长文档 排版
下载PDF
高校计算机基础中Word 2010长文档制作教学实践探讨
7
作者 王兆华 王海波 《电脑知识与技术(过刊)》 2012年第12X期8453-8456,8460,共5页
Microsoft Office Word是高校计算机基础课程必讲内容,并且Word作为主要的文档编辑工具在生活和工作中被广泛应用。该文以笔者的实际教学经历为参考,阐述了长文档制作的基本要求和流程,依据实际教学效果为参考分析Word 2010长文档制作... Microsoft Office Word是高校计算机基础课程必讲内容,并且Word作为主要的文档编辑工具在生活和工作中被广泛应用。该文以笔者的实际教学经历为参考,阐述了长文档制作的基本要求和流程,依据实际教学效果为参考分析Word 2010长文档制作教学中的重点和难点,并针对重点和难点设计出的教学方法和思路。 展开更多
关键词 长文档 Word 2010 样式 分节
下载PDF
基于文本摘要的无监督关键词抽取方法
8
作者 尤泽顺 周喜 +2 位作者 董瑞 张洋宁 杨奉毅 《计算机工程与设计》 北大核心 2024年第9期2779-2784,共6页
为克服基于嵌入的关键词抽取方法在长文档上性能下降的问题,提出一种基于文本摘要的方法(summarization-based document embedding rank,SDERank)。将句向量的加权和作为文档嵌入,根据每个句子与文档主题的语义相关度赋予权重。以往基... 为克服基于嵌入的关键词抽取方法在长文档上性能下降的问题,提出一种基于文本摘要的方法(summarization-based document embedding rank,SDERank)。将句向量的加权和作为文档嵌入,根据每个句子与文档主题的语义相关度赋予权重。以往基于嵌入的方法选择关键词时忽略候选词之间的关联,针对该问题,在SDERank的改进版SDERank+中,PageRank算法被用于提取候选词之间的共现权重作为相似度分数的修正。实验结果表明,在4个广泛使用的数据集上SDERank和SDERank+比之前最好的模型MDERank的F1分数平均高出2.2%和3.29%。 展开更多
关键词 自动关键词抽取 文本摘要 长文档建模 文档主题分析 语义处理 权重优化 向量相似性
下载PDF
Word长文档排版的策略与技巧 被引量:1
9
作者 张玲红 《办公自动化》 2018年第18期54-55,共2页
针对Word长文档版面构成复杂的特点,以某篇长文档的排版版面要求为例,提出并论述了在Word中对长文档进行排版的关键策略和常用技巧,快速实现在Word中对长文档文本内容的定位和查阅,让Word长文档的排版过程变得轻松高效。
关键词 WORD长文档 排版 策略 技巧
下载PDF
SFExt-PGAbs:两阶段长文档摘要模型
10
作者 周伟枭 蓝雯飞 +1 位作者 许智明 朱容波 《计算机科学与探索》 CSCD 北大核心 2021年第5期907-921,共15页
针对抽取式方法、生成式方法在长文档摘要上的流畅性、准确性缺陷以及在文档编码前截断原始文档造成的重要信息缺失问题,提出一种两阶段长文档摘要模型SFExt-PGAbs,由次模函数抽取式摘要SFExt与指针生成器生成式摘要PGAbs组成。SFExt-PG... 针对抽取式方法、生成式方法在长文档摘要上的流畅性、准确性缺陷以及在文档编码前截断原始文档造成的重要信息缺失问题,提出一种两阶段长文档摘要模型SFExt-PGAbs,由次模函数抽取式摘要SFExt与指针生成器生成式摘要PGAbs组成。SFExt-PGAbs模拟人类对长文档进行摘要的过程,首先使用SFExt在长文档中抽取出重要句子,过滤不重要且冗余的句子形成过渡文档,然后PGAbs接收过渡文档作为输入以生成流畅且准确的摘要。为获取与原始文档中心思想更为接近的过渡文档,在传统SFExt中拓展出位置重要性、准确性两个子方面,同时设计新的贪心算法。为研究不同特征提取器对生成摘要质量的影响,在PGAbs中应用两种循环神经网络。实验结果显示,在CNNDM测试集上,SFExt-PGAbs相较于基线模型生成了更为流畅、准确的摘要,ROUGE指标有较大提升。同时,子方面拓展后的SFExt也能抽取得到更准确的摘要。 展开更多
关键词 两阶段摘要模型 长文档摘要 抽取式摘要 生成式摘要 次模函数 指针生成器 子方面融合
下载PDF
国内公共图书馆传承与弘扬长征文化的现状研究——以江西、云南及陕西省图书馆为例
11
作者 张文轩 《贵图学苑》 2024年第1期9-13,共5页
长征的胜利对中华民族具有重大历史意义,其蕴含的理想信念、不畏艰难、不怕牺牲、百折不挠和执着追求的精神已成为具有重要指导和启迪作用的永恒精神财富,凝聚成具有标志性意义的长征文化。本文选取江西、云南及陕西省图书馆作为研究对... 长征的胜利对中华民族具有重大历史意义,其蕴含的理想信念、不畏艰难、不怕牺牲、百折不挠和执着追求的精神已成为具有重要指导和启迪作用的永恒精神财富,凝聚成具有标志性意义的长征文化。本文选取江西、云南及陕西省图书馆作为研究对象,在探讨该三省长征文献资源的分布现状、传承与弘扬长征文化的渠道、方法及其局限性,以期深入了解国内公共图书馆传承与弘扬长征文化现状,为传承与弘扬长征文化奠定坚实基础。 展开更多
关键词 长征 长征文献 长征文化 公共图书馆
下载PDF
结合卷积和长短期记忆网络的长文分类方法 被引量:5
12
作者 姜恬静 和欣 +2 位作者 何军 冯姣 李鹏 《小型微型计算机系统》 CSCD 北大核心 2019年第11期2309-2312,共4页
现如今互联网成为了传播信息的主要平台,人们使用关键词在海量的文档中快速获取想要的信息.这要求论文文献有明确的分类和标签.传统的文献分类方法通常提取关键词或关键句,利用文本的局部信息进行分析,对于方向相似的科技论文,传统的局... 现如今互联网成为了传播信息的主要平台,人们使用关键词在海量的文档中快速获取想要的信息.这要求论文文献有明确的分类和标签.传统的文献分类方法通常提取关键词或关键句,利用文本的局部信息进行分析,对于方向相似的科技论文,传统的局部分析的方法区分度不高,分类不够明确易产生混淆.本文提出了一种对文献进行全局分析,自动生成标签的长文分类方法.为了降低卷积神经网络(Convolutional Neural Network,CNN)的深度,同时通过遍历全文捕获全局信息,本文提出了随机抽样算法将文献拆分为多个部分.然后,结合卷积神经网络和长短期记忆网络(Long Short-Term Memory,LSTM),提取各部分的局部特征,记忆各部分特征的相关性,得出分类结果.实验结果表明,与基于局部分析的文本分类方法相比,本文提出的长文分类方法能够更准确地区分方向相似的长文文献. 展开更多
关键词 自然语言处理 长文本分类 随机抽样 特征提取 卷积长短期记忆网络
下载PDF
Word长文档框架结构的编排技巧 被引量:3
13
作者 万德年 《办公自动化(综合月刊)》 2011年第3期53-55,62,共4页
本文通过详细讲解如何灵活运用Word的各种命令来编排Word文字、图形、表格混合的长文档,使人们在日常的Word办公应用中的排版更简单直接,且达到更好的图文效果。
关键词 WORD长文档 命令 灵活运用 编排
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部