为了解决财经微博文本中网民情感状态转移的时序数据分析问题,本文提出一个基于认知情感评价模型(Ortony,Clore&Collins,OCC)和长短期记忆模型(long short term memory,LSTM)的财经微博文本情感分类模型(OCC-LSTM)。基于OCC模型从...为了解决财经微博文本中网民情感状态转移的时序数据分析问题,本文提出一个基于认知情感评价模型(Ortony,Clore&Collins,OCC)和长短期记忆模型(long short term memory,LSTM)的财经微博文本情感分类模型(OCC-LSTM)。基于OCC模型从网民认知角度建立情感规则,对财经微博文本进行情感标注,并作为LSTM模型进行深度学习的训练集;基于LSTM模型,使用深度学习中的TensorFlow框架和Keras模块建立相应的实验模型,进行海量微博数据情感分类,并结合13家上市公司3年的微博文本数据进行实证研究和模型验证对比。实证研究结果发现本文提出的模型取得了89.45%的准确率,高于采用传统的机器学习方式的支持向量机方法 (support vector machine,SVM)和基于深度学习的半监督RAE方法 (semi-supervised recursive auto encoder)。展开更多
针对情感分类问题中长句和短句具有不同的建模特点,提出了一种基于联合深度学习模型的情感分类方法。该方法融合长短期记忆(long-short term memory,LSTM)模型与卷积神经网络(convolutional neural network,CNN)对影视评论数据进行情感...针对情感分类问题中长句和短句具有不同的建模特点,提出了一种基于联合深度学习模型的情感分类方法。该方法融合长短期记忆(long-short term memory,LSTM)模型与卷积神经网络(convolutional neural network,CNN)对影视评论数据进行情感极性判别;采用LSTM对上下文进行建模,通过逐词迭代得到上下文的特征向量;采用CNN模型从词向量序列中自动发现特征,抽取局部特征并整合成全局特征来提高分类效果。所提出的方法在COAE2016评测的任务2的情感极性分类任务中,取得最高的系统准确率。展开更多
目前,工业控制系统(industrial control system, ICS)面临巨大的信息安全威胁,针对ICS的异常检测技术成为该领域的研究重点.近年来ICS的数据规模增大,但是异常运行数据样本依然缺失,异常检测系统也难以实时获取ICS运行数据,增加了ICS的...目前,工业控制系统(industrial control system, ICS)面临巨大的信息安全威胁,针对ICS的异常检测技术成为该领域的研究重点.近年来ICS的数据规模增大,但是异常运行数据样本依然缺失,异常检测系统也难以实时获取ICS运行数据,增加了ICS的异常检测难度.为此,基于数字孪生技术,提出数字孪生驱动的工控系统异常检测框架,借助数字孪生技术的一致性、实时性和可视化效果,解决当前异常检测的瓶颈问题.首先设计面向异常检测的数字孪生模块,利用数字孪生中虚拟实体与物理实体的模型一致性模拟异常数据,解决异常样本难获取的问题.随后设计攻击状态下的ICS异常检测模块,结合数字孪生模块的实时交互数据实现在线异常检测.最后以双容水箱控制系统为实验对象,综合运用WinCC,Unity3D,MySQL等开发环境,通过实验验证了该方法的可行性与有效性.展开更多
细粒度实体分类(Fine-grained entity type classification,FETC)旨在将文本中出现的实体映射到层次化的细分实体类别中.近年来,采用深度神经网络实现实体分类取得了很大进展.但是,训练一个具备精准识别度的神经网络模型需要足够数量的...细粒度实体分类(Fine-grained entity type classification,FETC)旨在将文本中出现的实体映射到层次化的细分实体类别中.近年来,采用深度神经网络实现实体分类取得了很大进展.但是,训练一个具备精准识别度的神经网络模型需要足够数量的标注数据,而细粒度实体分类的标注语料非常稀少,如何在没有标注语料的领域进行实体分类成为难题.针对缺少标注语料的实体分类任务,本文提出了一种基于迁移学习的细粒度实体分类方法,首先通过构建一个映射关系模型挖掘有标注语料的实体类别与无标注语料实体类别间的语义关系,对无标注语料的每个实体类别,构建其对应的有标注语料的类别映射集合.然后,构建双向长短期记忆(Bidirectional long short term memory,BiLSTM)模型,将代表映射类别集的句子向量组合作为模型的输入用来训练无标注实体类别.基于映射类别集中不同类别与对应的无标注类别的语义距离构建注意力机制,从而实现实体分类器以识别未知实体分类.实验证明,我们的方法取得了较好的效果,达到了在无任何标注语料前提下识别未知命名实体分类的目的.展开更多
文摘为了解决财经微博文本中网民情感状态转移的时序数据分析问题,本文提出一个基于认知情感评价模型(Ortony,Clore&Collins,OCC)和长短期记忆模型(long short term memory,LSTM)的财经微博文本情感分类模型(OCC-LSTM)。基于OCC模型从网民认知角度建立情感规则,对财经微博文本进行情感标注,并作为LSTM模型进行深度学习的训练集;基于LSTM模型,使用深度学习中的TensorFlow框架和Keras模块建立相应的实验模型,进行海量微博数据情感分类,并结合13家上市公司3年的微博文本数据进行实证研究和模型验证对比。实证研究结果发现本文提出的模型取得了89.45%的准确率,高于采用传统的机器学习方式的支持向量机方法 (support vector machine,SVM)和基于深度学习的半监督RAE方法 (semi-supervised recursive auto encoder)。
文摘针对情感分类问题中长句和短句具有不同的建模特点,提出了一种基于联合深度学习模型的情感分类方法。该方法融合长短期记忆(long-short term memory,LSTM)模型与卷积神经网络(convolutional neural network,CNN)对影视评论数据进行情感极性判别;采用LSTM对上下文进行建模,通过逐词迭代得到上下文的特征向量;采用CNN模型从词向量序列中自动发现特征,抽取局部特征并整合成全局特征来提高分类效果。所提出的方法在COAE2016评测的任务2的情感极性分类任务中,取得最高的系统准确率。
文摘目前,工业控制系统(industrial control system, ICS)面临巨大的信息安全威胁,针对ICS的异常检测技术成为该领域的研究重点.近年来ICS的数据规模增大,但是异常运行数据样本依然缺失,异常检测系统也难以实时获取ICS运行数据,增加了ICS的异常检测难度.为此,基于数字孪生技术,提出数字孪生驱动的工控系统异常检测框架,借助数字孪生技术的一致性、实时性和可视化效果,解决当前异常检测的瓶颈问题.首先设计面向异常检测的数字孪生模块,利用数字孪生中虚拟实体与物理实体的模型一致性模拟异常数据,解决异常样本难获取的问题.随后设计攻击状态下的ICS异常检测模块,结合数字孪生模块的实时交互数据实现在线异常检测.最后以双容水箱控制系统为实验对象,综合运用WinCC,Unity3D,MySQL等开发环境,通过实验验证了该方法的可行性与有效性.
文摘细粒度实体分类(Fine-grained entity type classification,FETC)旨在将文本中出现的实体映射到层次化的细分实体类别中.近年来,采用深度神经网络实现实体分类取得了很大进展.但是,训练一个具备精准识别度的神经网络模型需要足够数量的标注数据,而细粒度实体分类的标注语料非常稀少,如何在没有标注语料的领域进行实体分类成为难题.针对缺少标注语料的实体分类任务,本文提出了一种基于迁移学习的细粒度实体分类方法,首先通过构建一个映射关系模型挖掘有标注语料的实体类别与无标注语料实体类别间的语义关系,对无标注语料的每个实体类别,构建其对应的有标注语料的类别映射集合.然后,构建双向长短期记忆(Bidirectional long short term memory,BiLSTM)模型,将代表映射类别集的句子向量组合作为模型的输入用来训练无标注实体类别.基于映射类别集中不同类别与对应的无标注类别的语义距离构建注意力机制,从而实现实体分类器以识别未知实体分类.实验证明,我们的方法取得了较好的效果,达到了在无任何标注语料前提下识别未知命名实体分类的目的.