期刊文献+
共找到108篇文章
< 1 2 6 >
每页显示 20 50 100
基于依存句法分析的电力设备缺陷文本信息精确辨识方法 被引量:27
1
作者 邵冠宇 王慧芳 +3 位作者 吴向宏 陆金龙 李建红 何奔腾 《电力系统自动化》 EI CSCD 北大核心 2020年第12期178-185,共8页
电力设备缺陷文本包含大量设备缺陷历史信息,从文本中精确辨识缺陷信息,可提供对于设备的故障率建模和健康状态评价问题的有效指导。引入依存句法分析技术,提出"左贪心"出栈规则和基于神经网络的依存关系状态转移分析模型,实... 电力设备缺陷文本包含大量设备缺陷历史信息,从文本中精确辨识缺陷信息,可提供对于设备的故障率建模和健康状态评价问题的有效指导。引入依存句法分析技术,提出"左贪心"出栈规则和基于神经网络的依存关系状态转移分析模型,实现了电力设备实际缺陷文本和缺陷分类标准文本的依存句法树构建,并结合缺陷文本特点提出了电力设备依存句法树的剪枝、切分和重构方法。同时,提出了基于依存关系的树匹配算法,实现实际缺陷和标准缺陷依存句法树的匹配。以主变压器缺陷文本为例,研究了基于依存句法分析的缺陷信息辨识方法的可行性和有效性。结果表明,所提方法相比于其他树匹配算法和语义相似度计算方法在效率和准确性上有明显提升。 展开更多
关键词 文本挖掘 电力设备 依存句法分析 依存句法树匹配 信息辨识
下载PDF
基于异构数据的颠覆性技术识别研究——以智能制造装备领域为例 被引量:16
2
作者 马永红 孔令凯 +2 位作者 林超然 杨晓萌 倪惠莉 《现代情报》 CSSCI 2022年第7期92-104,共13页
[目的/意义]颠覆性技术研发作为国家战略,如何准确识别颠覆性技术,对于国家和企业把握技术先机,抢占技术制高点意义重大。[方法/过程]本文结合专利文献数据,利用LDA主题模型实现数据降维,提取技术主题,从技术主题成长性、融合性、创新... [目的/意义]颠覆性技术研发作为国家战略,如何准确识别颠覆性技术,对于国家和企业把握技术先机,抢占技术制高点意义重大。[方法/过程]本文结合专利文献数据,利用LDA主题模型实现数据降维,提取技术主题,从技术主题成长性、融合性、创新性、突破性4个特征识别候选颠覆性技术;在此基础上,结合网页新闻数据,测算候选颠覆性技术主题与网页新闻数据主题之间的匹配度,分析技术的市场属性,准确识别颠覆性技术。[结果/结论]本文以智能制造装备领域为例,通过实证研究得到“智能数字控制”及“智能数据采集系统”是智能制造装备领域的颠覆性技术。 展开更多
关键词 异构数据 文本挖掘 颠覆性技术 技术识别
下载PDF
融合Sentence-BERT和LDA的评论文本主题识别 被引量:13
3
作者 阮光册 黄韵莹 《现代情报》 CSSCI 2023年第5期46-53,共8页
[目的/意义]为了解决评论文本主题识别时语义描述不充分以及学习到的主题语义连贯性不强等问题。本文将Sentence-BERT句子嵌入模型和LDA模型相结合,提升评论文本主题的语义性。[方法/过程]采用Sentence-BERT模型获取评论文本句子层面的... [目的/意义]为了解决评论文本主题识别时语义描述不充分以及学习到的主题语义连贯性不强等问题。本文将Sentence-BERT句子嵌入模型和LDA模型相结合,提升评论文本主题的语义性。[方法/过程]采用Sentence-BERT模型获取评论文本句子层面的向量特征,同时,采用LDA模型获取评论文本的概率主题向量,随后使用自动编码器连接两组向量,运用K-means算法对潜在空间向量进行聚类,从类簇中获取上下文主题信息。[结果/结论]通过对评论文本数据集的实验,本文方法可以较好地获得具有语义信息的主题词。Sentence-BERT模型与LDA结合,增加了模型的复杂性。通过对比,本文方法获得的主题一致性指标(Coherence)优于目前常见的评论文本主题识别方法。 展开更多
关键词 Sentence-BERT LDA模型 评论文本 主题识别
下载PDF
基于文本挖掘的科技文献主题演化研究进展 被引量:14
4
作者 梁爽 刘小平 《图书情报工作》 CSSCI 北大核心 2022年第13期138-149,共12页
[目的/意义]梳理国内外基于文本挖掘的科技文献主题演化相关研究,对主题演化分析中使用的各种方法进行分类、归纳与总结,并提出现有研究存在的不足,为主题演化研究提供新的思路与借鉴意义。[方法/过程]依照国内外学者进行主题演化研究... [目的/意义]梳理国内外基于文本挖掘的科技文献主题演化相关研究,对主题演化分析中使用的各种方法进行分类、归纳与总结,并提出现有研究存在的不足,为主题演化研究提供新的思路与借鉴意义。[方法/过程]依照国内外学者进行主题演化研究的一般流程,对数据集选取与对象分析、主题识别研究、主题演化研究(主题演化时序分析、主题强度演化分析、主题内容演化分析)3个分析层面中所使用的各类模型、指标与方法进行梳理比较与优缺点总结,提出现有研究的局限性并对未来发展做出展望。[结果/结论]当前研究已具有一定规模和较为成熟的分析体系,但仍存在以下不足:数据来源较为单一;LDA及相关扩展模型存在的弊端需进一步克服;缺乏对其他机器学习及深度学习算法的探索应用;演化分析方法需相互结合、互补互融。未来应针对以上问题做出相应改进与深入探究。 展开更多
关键词 文本挖掘 主题模型 主题识别 主题演化
原文传递
Gender Prediction on Twitter Using Stream Algorithms with N-Gram Character Features 被引量:10
5
作者 Zachary Miller Brian Dickinson Wei Hu 《International Journal of Intelligence Science》 2012年第4期143-148,共6页
The rapid growth of social networks has produced an unprecedented amount of user-generated data, which provides an excellent opportunity for text mining. Authorship analysis, an important part of text mining, attempts... The rapid growth of social networks has produced an unprecedented amount of user-generated data, which provides an excellent opportunity for text mining. Authorship analysis, an important part of text mining, attempts to learn about the author of the text through subtle variations in the writing styles that occur between gender, age and social groups. Such information has a variety of applications including advertising and law enforcement. One of the most accessible sources of user-generated data is Twitter, which makes the majority of its user data freely available through its data access API. In this study we seek to identify the gender of users on Twitter using Perceptron and Nai ve Bayes with selected 1 through 5-gram features from tweet text. Stream applications of these algorithms were employed for gender prediction to handle the speed and volume of tweet traffic. Because informal text, such as tweets, cannot be easily evaluated using traditional dictionary methods, n-gram features were implemented in this study to represent streaming tweets. The large number of 1 through 5-grams requires that only a subset of them be used in gender classification, for this reason informative n-gram features were chosen using multiple selection algorithms. In the best case the Naive Bayes and Perceptron algorithms produced accuracy, balanced accuracy, and F-measure above 99%. 展开更多
关键词 TWITTER GENDER identification STREAM MINING N-GRAM Feature Selection text MINING
下载PDF
基于语句节奏特征的作者身份识别研究 被引量:10
6
作者 王少康 董科军 阎保平 《计算机工程》 CAS CSCD 北大核心 2011年第9期4-5,8,共3页
提出一种新的写作风格相似度评估方法,利用不同作者写作时在文章语句节奏控制方面的特点,鉴别作者的写作风格,从而达到作者身份识别的目的。该方法构建节奏特征矩阵模型来描述文本的语句节奏,利用点积相似度算法以及改进的KL距离算法来... 提出一种新的写作风格相似度评估方法,利用不同作者写作时在文章语句节奏控制方面的特点,鉴别作者的写作风格,从而达到作者身份识别的目的。该方法构建节奏特征矩阵模型来描述文本的语句节奏,利用点积相似度算法以及改进的KL距离算法来度量节奏特征矩阵之间的差异。实验表明,该方法在文学作品的作者识别方面具有较高的准确率。 展开更多
关键词 文本挖掘 作者身份识别 文本相似度 节奏特征 多维矩阵
下载PDF
基于Sentence-BERT的专利技术主题聚类研究——以人工智能领域为例 被引量:5
7
作者 阮光册 周萌葳 《情报杂志》 CSSCI 北大核心 2024年第2期110-117,共8页
[研究目的]将Sentence-BERT模型应用于专利技术主题聚类,解决专利文献为突出新颖性,常使用独特技术术语造成词汇向量语义特征稀疏的问题。[研究方法]以人工智能领域2015年-2019年的22370篇专利为实验数据。首先,采用Sentence-BERT算法... [研究目的]将Sentence-BERT模型应用于专利技术主题聚类,解决专利文献为突出新颖性,常使用独特技术术语造成词汇向量语义特征稀疏的问题。[研究方法]以人工智能领域2015年-2019年的22370篇专利为实验数据。首先,采用Sentence-BERT算法对专利文献摘要文本进行向量化表示;其次,对向量化矩阵进行数据降维,利用HDBSCAN方式寻找原始数据中的高密度簇;最后,识别类簇文本集合中的主题特征,并完成主题呈现。[研究结论]对比LDA主题模型、K-means、doc2vec等方法,本文的实验结果提高了主题划分的细粒度和精确度,获得了较好的主题一致性。如何采用fine-tune策略进一步提升模型的效果,是未来该方法进一步深入探索的方向。 展开更多
关键词 Sentence-BERT 专利文本 主题识别 文本聚类
下载PDF
脏话文本语料库建设 被引量:9
8
作者 朱晓旭 钱培德 《计算机工程与应用》 CSCD 2014年第11期126-129,共4页
脏话作为一种非正规的语言现象,在网络评价中已经无处不在,对网络文明造成了影响。描述了脏话文本的特点、定义及其危害,并对网络脏话文本进行了研究与分析,设计了一个机器自动判别与少量人工标注相结合的脏话语料采集方法,借助海量的... 脏话作为一种非正规的语言现象,在网络评价中已经无处不在,对网络文明造成了影响。描述了脏话文本的特点、定义及其危害,并对网络脏话文本进行了研究与分析,设计了一个机器自动判别与少量人工标注相结合的脏话语料采集方法,借助海量的真实评价文本,构造了一个较大规模的高质量的脏话语料库,初步采集了6 000多句脏话语料。然后利用一元、二元和三元特征,通过SVM与最大熵分类器对脏话的自动分类进行了实验,结果表明,两种分类器的准确率和查全率都达到97%以上。 展开更多
关键词 脏话文本 语料库 文本分类 自动识别
下载PDF
基于Web身份特征的网络视频监控设备识别 被引量:6
9
作者 丁伟祥 《沈阳工业大学学报》 EI CAS 北大核心 2020年第4期427-431,共5页
为了更好地对网络视频监控设备进行在线管理与维护,提出了一种网络视频监控设备在线检测与自动识别技术.利用无状态扫描技术进行网络终端设备的在线检测,从终端设备特定端口返回的HTTP头信息中提取BANNER和HTML页面信息,并通过粗糙集属... 为了更好地对网络视频监控设备进行在线管理与维护,提出了一种网络视频监控设备在线检测与自动识别技术.利用无状态扫描技术进行网络终端设备的在线检测,从终端设备特定端口返回的HTTP头信息中提取BANNER和HTML页面信息,并通过粗糙集属性约简后构建设备Web身份特征.利用余弦距离计算在线设备Web身份特征与已知设备特征库样本之间相似度,实现在线设备的检测与识别.结果表明,该方法能够较好地在线检测并自动识别网络视频监控设备,具有较高的识别准确率和较低的识别遗漏率. 展开更多
关键词 网络视频监控 Web身份特征 无状态扫描 粗糙集 特征约简 文本相似性 余弦距离函数 在线检测 自动识别
下载PDF
基于前向神经网络的与内容无关的笔迹鉴别 被引量:2
10
作者 周琳霞 黎明 +1 位作者 刘高航 杨小芹 《南昌航空工业学院学报》 CAS 2002年第1期27-34,共8页
与内容无关的笔迹鉴别是属于图象处理和模式识别领域的一项课题 ,有着广泛的实用前景。本文提出了一种基于前向神经网络的与内容无关的笔迹鉴别的方法。文中讨论了提取笔迹灰度图象特征和用前向神经网络分类器进行鉴别两大问题。对笔迹... 与内容无关的笔迹鉴别是属于图象处理和模式识别领域的一项课题 ,有着广泛的实用前景。本文提出了一种基于前向神经网络的与内容无关的笔迹鉴别的方法。文中讨论了提取笔迹灰度图象特征和用前向神经网络分类器进行鉴别两大问题。对笔迹灰度图提取了 3大类 18个灰度特征 ,而前向神经网络分类器由一种新的遗传算法同时优化设计其结构和权重矢量。通过对 10人、每人 6幅笔迹灰度图象用 18个灰度特征进行鉴别试验 ,结果显示此方法设计的前向神经网络分类器收敛率高 ,比常用的最近邻分类器有更高的识别正确率。 展开更多
关键词 前向神经网络 笔迹鉴别 特征提取 文本独立 遗传算法
下载PDF
基于SVM的不良文本信息识别 被引量:5
11
作者 吕洪艳 杜鹃 《计算机系统应用》 2015年第6期183-187,共5页
不良文本识别的实际应用中,大多数文本之间总有交界甚至彼此掺杂,这种非线性不可分问题给不良文本识别带来了难度.应用SVM通过非线性变换可以使原空间转化为某个高维空间中的线性问题,而选择合适的核函数是SVM的关键.由于单核无法兼顾... 不良文本识别的实际应用中,大多数文本之间总有交界甚至彼此掺杂,这种非线性不可分问题给不良文本识别带来了难度.应用SVM通过非线性变换可以使原空间转化为某个高维空间中的线性问题,而选择合适的核函数是SVM的关键.由于单核无法兼顾对独立的不良词汇和词汇组合的识别,使识别准确率不高,而且也无法兼顾召回率.针对不良文本识别的特定应用,依据Mercer定理结合线性核与多项式核提出了一种新的组合核函数,这种组合核函数能兼顾线性核与多项式核的优势,能够实现对独立的不良词汇以及词汇组合进行识别.在仿真实验中评估了线性核、齐次多项式核以及组合核函数,实验结果表明组合核函数的识别准确率与召回率都比较理想. 展开更多
关键词 SVM 组合核函数 不良文本 信息识别 召回率
下载PDF
基于Ctpn及Tesseract的分纤箱喷码识别技术 被引量:5
12
作者 李飞 盛刚 毕佳佳 《电脑知识与技术》 2020年第13期18-19,27,共3页
为了有效识别装维人员在分纤箱上标记的唯一标识码,将识别出来的标识信息与资源系统工单中的信息进行比对,实现家庭宽带装维工单的一致性检验,本文提出了一种分纤箱喷码识别技术。该方法将文本检测技术Ctpn及tesseract文字识别技术进行... 为了有效识别装维人员在分纤箱上标记的唯一标识码,将识别出来的标识信息与资源系统工单中的信息进行比对,实现家庭宽带装维工单的一致性检验,本文提出了一种分纤箱喷码识别技术。该方法将文本检测技术Ctpn及tesseract文字识别技术进行结合,实现对分纤箱喷码的有效智能识别,替代了人工抽查的方式,提升了质检效率。 展开更多
关键词 文本检测 分纤箱 喷码识别 工单质检 质检效率
下载PDF
继电保护定值模型建立及语义识别技术研究 被引量:3
13
作者 熊学海 万春竹 +2 位作者 杨波 赵凌 齐雪雯 《自动化技术与应用》 2023年第5期128-132,共5页
针对各厂家继电保护定值信息语义不标准,严重影响信息审核和应用的问题,提出基于知识图谱和文本相似度计算的继电保护定值信息智能识别模型。建立语义预处理、语义智能识别、定值信息知识图谱等模块。基于正则表达式处理字母、数字以及... 针对各厂家继电保护定值信息语义不标准,严重影响信息审核和应用的问题,提出基于知识图谱和文本相似度计算的继电保护定值信息智能识别模型。建立语义预处理、语义智能识别、定值信息知识图谱等模块。基于正则表达式处理字母、数字以及特殊符号不标准表述;通过文本相似度算法,计算待规范信息和规范信息间余弦值,判定两者间的相似程度;基于自然语言处理技术,建立继电保护标准语义信息知识网络。通过某地区继电保护定值信息验证,模型能够准确地标准化各厂家的定值信息。 展开更多
关键词 定值信息模型 文本识别 文本相似度计算
下载PDF
基于机器学习的古典诗词作者的判别研究 被引量:4
14
作者 易勇 郑艳 +1 位作者 何中市 李良炎 《心智与计算》 2007年第3期359-364,共6页
主要基于机器学习的NaveBaye等方法,对诗词文本采用向量空间模型来表示,首次提出了中国古代诗人李白和杜甫作品判别计算模型,并采用了信息增益作为特征选择的依据,结合爬山法完善了计算模型,该模型已经在精典语料《全唐诗》的机器学... 主要基于机器学习的NaveBaye等方法,对诗词文本采用向量空间模型来表示,首次提出了中国古代诗人李白和杜甫作品判别计算模型,并采用了信息增益作为特征选择的依据,结合爬山法完善了计算模型,该模型已经在精典语料《全唐诗》的机器学习基础上得到实现,获得较好的诗人作品判别效果,准确度可达到98.3%,该方法已成功地推广到古典诗词的风格流派的机器判别上[1],准确度达到88.5%。本文提出了古典诗词研究的技术方向。 展开更多
关键词 自然语言处理 机器学习 文本分类 作品作者判别
原文传递
基于Sent-LDA的装备制造企业重要风险点识别及演化研究
15
作者 徐尚英 陈秋阳 刘平峰 《数学的实践与认识》 北大核心 2024年第11期79-96,共18页
面对动态变化、复杂多样、不确定性增强的内外部环境,装备制造企业突发冲击型重要风险点的精准识别与演化研究对于建构产业安全体系、支撑经济发展建设具有重要意义.针对438家计算机通信类上市公司2018-2022年间的1648份年报风险文本数... 面对动态变化、复杂多样、不确定性增强的内外部环境,装备制造企业突发冲击型重要风险点的精准识别与演化研究对于建构产业安全体系、支撑经济发展建设具有重要意义.针对438家计算机通信类上市公司2018-2022年间的1648份年报风险文本数据和2808篇主流新闻媒体风险文本数据,基于Sent-LDA模型对双源数据集进行风险主题聚类,识别出装备制造企业所面临的27个重要风险点,结合关键词共现自动划分出突发冲击型、持续调整型和衰减迟滞型三类风险点,最后对装备制造企业突发冲击型风险点进行后离散演化分析.本研究方法更加直观、准确、前瞻地识别装备制造企业面临的重要风险点,年报文本和主流新闻风险文本数据能够有效反映风险点的演变情况,且新闻文本时效性更强.装备制造企业需关注风险演化规律,及时采取强有力的干预措施切断风险传递路径. 展开更多
关键词 装备制造企业 文本挖掘 风险识别 演化分析
原文传递
网络游记文本中旅游行程链提取方法
16
作者 阮陵 葛军莲 +2 位作者 张翎 王黎淑 王晓宣 《地球信息科学学报》 EI CSCD 北大核心 2024年第2期477-487,共11页
网络游记是旅游者在互联网上发布的自述性旅游过程记录,描述了旅游的前后过程和感受体验。从网络游记文本中提取旅游行程链,分析行程结构,能给游客的行程制定、线路设计提供重要的参考。传统的游记文本行程提取大多依赖于人工识别文本... 网络游记是旅游者在互联网上发布的自述性旅游过程记录,描述了旅游的前后过程和感受体验。从网络游记文本中提取旅游行程链,分析行程结构,能给游客的行程制定、线路设计提供重要的参考。传统的游记文本行程提取大多依赖于人工识别文本中的行程节点,再进行串联、合并处理,工作量较大。自动提取游记文本中的旅游行程链,能够提高数据处理和分析效率。本文基于自然语言处理技术,在深入分析游记网络文本的段落结构和表达特点的基础上,归纳了行程节点和节点次序关系的句法表达规则,构建了行程节点触发词表,进而提出了基于句法规则的旅游行程链提取方法,主要包含行程节点的识别、节点次序关系的识别和旅游行程链的生成,能实现网络游记文本的旅游行程重构。本文采集了蚂蜂窝平台17 226篇南京市网络游记文本数据,采用最长公共子序列算法,开展了本文方法的试验验证。通过对比分析,本文方法提取的旅游行程链和人工识别的真实行程链相似度达到86.14%,高于实体关系抽取领域的BERT-BiLSTM-CasRel深度学习模型的83.1%。相比现有关系提取类深度学习方法需要开展大量的数据标注,本文方法计算更加便捷,准确率相对较高,仅需构建区域旅游点名录,即可实现网络游记文本中行程信息的自动提取。 展开更多
关键词 网络游记 网络文本 旅游行程链 行程重构 行程提取 节点识别 规则匹配
原文传递
高质量发展背景下科技新闻主题识别及其热点演化分析 被引量:3
17
作者 王曰芬 刘佳宁 +1 位作者 王柳虹 岑咏华 《情报理论与实践》 CSSCI 北大核心 2023年第5期107-116,共10页
[目的/意义]科技创新是驱动高质量发展的核心动力,科技新闻是人们了解科技发展情况的重要途径,识别科技新闻中的热点主题,反映国家战略发布和实施过程中的状态及变化,以为政府及科研人员提供有效的决策参考与信息支持。[方法/过程]从国... [目的/意义]科技创新是驱动高质量发展的核心动力,科技新闻是人们了解科技发展情况的重要途径,识别科技新闻中的热点主题,反映国家战略发布和实施过程中的状态及变化,以为政府及科研人员提供有效的决策参考与信息支持。[方法/过程]从国家科技部网站中采集2011—2021年发布的科技新闻,借助新词发现与LDA主题模型等文本挖掘方法,文章构建了科技新闻热词发现与主题识别的研究方案,并对新闻热点进行演化分析。[结果/结论]我国科技新闻报道中主要集中于高新技术、科技交流合作、人才培养与激励、农村科技发展、绿色生态、科技创新载体建设和政府部门工作7个主题范畴;高质量发展总纲提出前后的关注热点产生了一定程度上的变化;科技创新驱动高质量发展相关新闻事件中,政府工作与高新技术的发展是关注的重点。 展开更多
关键词 高质量发展 科技新闻 文本挖掘 主题识别 热点演化
原文传递
基于深度学习的非结构化医学文本知识抽取
18
作者 耿飙 梁成全 +1 位作者 魏炜 朱长元 《计算机工程与设计》 北大核心 2024年第1期177-186,共10页
为解决一词多义和关系重叠问题,以糖尿病领域文本数据为对象,基于序列标注的新型标注策略,提出一种轻量级端到端神经模型。采用头部实体优先策略,使用BERT获取输入字向量,通过BiLSTM深度学习捕获时间特征和上下文相关性。引入multi_head... 为解决一词多义和关系重叠问题,以糖尿病领域文本数据为对象,基于序列标注的新型标注策略,提出一种轻量级端到端神经模型。采用头部实体优先策略,使用BERT获取输入字向量,通过BiLSTM深度学习捕获时间特征和上下文相关性。引入multi_head attention机制,采用CRF模型根据相邻标签的相互依赖关系得到最优预测序列。旨在将非结构化的医学文本转换成结构化的数据,在阿里云天池中文糖尿病标注数据集上进行综合实验,实验结果表明,该模型在医学文本知识抽取中具有优越的性能。 展开更多
关键词 深度学习 非结构化文本 医学文本 知识抽取 实体识别 关系抽取 序列标注
下载PDF
An Investigation into the Issues Concerning the Copyright of Content Generated by Text-to-Video AI
19
作者 Zhou Chunguang Yi Jia 《Contemporary Social Sciences》 2024年第5期95-117,共23页
Text-to-video artificial intelligence(AI)is a new product that has arisen from the continuous development of digital technology over recent years.The emergence of various text-to-video AI models,including Sora,is driv... Text-to-video artificial intelligence(AI)is a new product that has arisen from the continuous development of digital technology over recent years.The emergence of various text-to-video AI models,including Sora,is driving the proliferation of content generated through concrete imagery.However,the content generated by text-to-video AI raises significant issues such as unclear work identification,ambiguous copyright ownership,and widespread copyright infringement.These issues can hinder the development of text-to-video AI in the creative fields and impede the prosperity of China’s social and cultural arts.Therefore,this paper proposes three recommendations within a legal framework:(a)categorizing the content generated by text-to-video AI as audiovisual works;(b)clarifying the copyright ownership model for text-to-video AI works;(c)reasonably delineating the responsibilities of the parties who are involved in the text-to-video AI works.The aim is to mitigate the copyright risks associated with content generated by text-to-video AI and to promote the healthy development of text-to-video AI in the creative fields. 展开更多
关键词 text-to-video AI work identification copyright ownership copyright infringement
下载PDF
基于BERT的农业领域前沿研究主题识别方法研究 被引量:4
20
作者 李松繁 黄永 杨金庆 《情报工程》 2021年第5期100-114,共15页
[目的/意义]为了快速准确地识别学科领域的前沿研究主题,为科研工作者提供精准的学科发展趋势预测服务。[方法/过程]本文提出了一种基于BERT的前沿研究主题识别方法,结合本文改进的主题新颖度和提出的相关文献指标、主题发展态势指标,... [目的/意义]为了快速准确地识别学科领域的前沿研究主题,为科研工作者提供精准的学科发展趋势预测服务。[方法/过程]本文提出了一种基于BERT的前沿研究主题识别方法,结合本文改进的主题新颖度和提出的相关文献指标、主题发展态势指标,实现农业领域前沿研究主题的识别。[结果/结论]基于农业领域期刊论文数据的实证研究发现,该方法在前沿研究主题的识别任务上效果显著,有效识别出了农业领域内的潜在前沿研究主题1个、热门前沿研究主题2个、衰退前沿研究主题2个。 展开更多
关键词 前沿主题 BERT 文本聚类 前沿识别
下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部