-
题名基于ACNNC模型的中文分词方法
被引量:4
- 1
-
-
作者
张忠林
余炜
闫光辉
袁晨予
-
机构
兰州交通大学电子与信息工程学院
-
出处
《中文信息学报》
CSCD
北大核心
2022年第8期12-19,28,共9页
-
基金
国家自然科学基金(61662043,62062049)
甘肃省哲学社会科学规划项目(20YB056)。
-
文摘
目前,现有中文分词模型大多是基于循环神经网络的,其能够捕捉序列整体特征,但存在忽略了局部特征的问题。针对这种问题,该文综合了注意力机制、卷积神经网络和条件随机场,提出了注意力卷积神经网络条件随机场模型(Attention Convolutional Neural Network CRF,ACNNC)。其中,嵌入层训练词向量,自注意力层代替循环神经网络捕捉序列全局特征,卷积神经网络捕捉序列局部特征和位置特征,经融合层的特征输入条件随机场进行解码。实验证明该文提出的模型在BACKOFF 2005测试集上有更好的分词效果,并在PKU、MSR、CITYU和AS上取得了96.2%、96.4%、96.1%和95.8%的F值。
-
关键词
中文分词
深度学习
注意力机制
-
Keywords
Chinese word segmentation
deep learning
attention mechanism
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名融合BERT与句法依存的性格识别方法研究
- 2
-
-
作者
张忠林
袁晨予
陈丽萍
吴奕霖
-
机构
兰州交通大学电子与信息工程学院
中国科学院自动化研究所多模态人工智能系统全国重点实验室
中国科学院大学人工智能学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2023年第18期98-104,共7页
-
基金
国家自然科学基金(61662043,62062049)
甘肃省哲学社会科学规划项目(20YB056)。
-
文摘
针对现有性格识别方法难以有效融合文本深层语义与心理学特征的技术挑战,提出了融合BERT与句法依存的性格识别模型。采用BERT提取文本蕴含的深层语义信息,通过词法与句法分析获得具有性格特征的心理学词汇,设计条件融合函数将该词汇作为外部条件动态嵌入到文本表示向量中,捕获文本深层语义与性格线索间动态的语义交互,基于融合后的特征向量使用全连接网络进行更深层的特征提取并降维,以此对性格进行识别。在首次构建的面向中文电影评论的性格数据集上的实验验证了该方法的有效性,该模型相较传统神经网络和单一BERT模型在性格识别准确性上有明显提升。
-
关键词
BERT模型
动态语义交互
性格识别
-
Keywords
BERT model
dynamic semantic interaction
personality detection
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-