-
题名中文分词技术研究进展综述
被引量:7
- 1
-
-
作者
钟昕妤
李燕
-
机构
甘肃中医药大学信息工程学院
-
出处
《软件导刊》
2023年第2期225-230,共6页
-
基金
甘肃中医药大学研究生创新基金项目(2022CX137)。
-
文摘
中文分词作为实现机器处理中文的一项基础任务,是近几年的研究热点之一。其结果对后续处理任务具有深远影响,具备充分的研究意义。通过对近5年分词技术研究文献的综合分析,明晰后续研究将以基于神经网络模型的融合方法为主导,进一步追求更精准高效的分词表现。而在分词技术的发展与普及应用中,亦存在着制约其性能的各项瓶颈。除传统的歧义和未登录词问题外,分词还面临着语料规模质量依赖和多领域分词等新难题,针对这些新问题的突破研究将成为后续研究的重点之一。
-
关键词
中文分词
深度学习
语料依赖
多领域分词
-
Keywords
Chinese word segmentation
deep learning
corpus dependence
multi-domain participle
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名情感语音特征对语料库依赖性的统计分析
被引量:3
- 2
-
-
作者
孙颖
张雪英
-
机构
太原理工大学信息工程学院
-
出处
《噪声与振动控制》
CSCD
北大核心
2011年第4期132-136,共5页
-
基金
国家自然科学基金(No.61072087)
山西省自然科学基金(No.2010011020-1)
山西省研究生创新基金(No.20093010)
-
文摘
简述线性预测倒谱系数(LPCC)、Teager能量算子(TEO)、梅尔频率倒谱系数(MFCC)和过零峰值幅度(ZCPA)特征提取方法,并将这四种方法应用于情感识别。设计两种实验,第一种是使用TYUT和Berlin语料库的单语言实验,这种实验证明,以上四种特征在单一的语料库单一语言条件下均能够有效地表征语音的情感特征,其中MFCC特征对情感的识别率最高。第二种实验是混合语料库的单一语言实验。之前大多数关于情感特征的研究都是基于某一种语料库中某种特定语言的,但在实际中,说话人的背景环境总是多种多样。因此,对特征的混合语料库研究是有现实意义的。第二种实验证明这四种特征都是语料库依赖性的,其中ZCPA特征的识别率下降最少。
-
关键词
声学
信号处理
情感语音识别
语料库依赖性
情感特征
混合语料库
-
Keywords
acoustics
signal analysis
emotional speech recognition
database dependence
emotional features
merge-database
-
分类号
TN912.34
[电子电信—通信与信息系统]
-