为了减少复杂环境因素对电力负荷超短期预测效果的影响,提高算法的预测精度和运算效率,该文提出一种基于聚类经验模态分解(clusterempiricalmodedecomposition,CEMD)的卷积神经网络和长短期记忆网络(convolutional neural network and l...为了减少复杂环境因素对电力负荷超短期预测效果的影响,提高算法的预测精度和运算效率,该文提出一种基于聚类经验模态分解(clusterempiricalmodedecomposition,CEMD)的卷积神经网络和长短期记忆网络(convolutional neural network and long short term memory network,CNNLSTM)混合预测算法。该算法首先通过经验模态分解法将负荷数据分解为平稳性好、规律性强的若干本征模态函数(intrinsic mode functions,IMF)和残差(residual,Res)。其次为了简化后续模型的计算体量,运用k均值聚类方法对分解所得的各分量进行分组集成,同时分析不同聚类数对应的预测效果,选取最优聚类标签构造神经网络输入数据。之后将各组数据分别输入到CNN-LSTM混合神经网络中,利用CNN挖掘数据间的特征形成特征向量,并将其输入到LSTM中进行预测。最后将所有预测结果进行线性相加得到完整预测负荷。通过在真实负荷上进行验证并与现有模型进行比较,所提方法具有更高的预测精度。展开更多
为了对饮食文本信息高效分类,建立一种基于word2vec和长短期记忆网络(Long-short term memory,LSTM)的分类模型。针对食物百科和饮食健康文本特点,首先利用word2vec实现包含语义信息的词向量表示,并解决了传统方法导致数据表示稀疏及维...为了对饮食文本信息高效分类,建立一种基于word2vec和长短期记忆网络(Long-short term memory,LSTM)的分类模型。针对食物百科和饮食健康文本特点,首先利用word2vec实现包含语义信息的词向量表示,并解决了传统方法导致数据表示稀疏及维度灾难问题,基于K-means++根据语义关系聚类以提高训练数据质量。由word2vec构建文本向量作为LSTM的初始输入,训练LSTM分类模型,自动提取特征,进行饮食宜、忌的文本分类。实验采用48 000个文档进行测试,结果显示,分类准确率为98.08%,高于利用tf-idf、bag-of-words等文本数值化表示方法以及基于支持向量机(Support vector machine,SVM)和卷积神经网络(Convolutional neural network,CNN)分类算法结果。实验结果表明,利用该方法能够高质量地对饮食文本自动分类,帮助人们有效地利用健康饮食信息。展开更多
在生物医学文本挖掘领域,化学药物命名实体识别具有重要意义.目前的主流方法是基于条件随机场(conditional random fields,CRF)的方法,但是该方法需要大量的人工特征,并且存在实体标签的全文非一致性问题.针对此问题,提出一种基于注意(A...在生物医学文本挖掘领域,化学药物命名实体识别具有重要意义.目前的主流方法是基于条件随机场(conditional random fields,CRF)的方法,但是该方法需要大量的人工特征,并且存在实体标签的全文非一致性问题.针对此问题,提出一种基于注意(Attention)机制的深度学习方法.该方法首先从海量生物文本中学习词向量,然后利用双向长短期记忆网络(BiLSTM)学习字符向量,随后将词向量和字符向量再经过另一个BiLSTM以获得词的上下文表示,然后再利用Attention机制获得词在全文范围下的上下文表示,最后利用CRF层得到整篇文章的标签序列.实验结果表明:相比之前的研究方法,提高了在同一篇文章中实体识别的一致性,并在BioCreative IV评测中的CHEMDNER数据集上取得了更好的结果(F值为90.77%).展开更多
文摘为了减少复杂环境因素对电力负荷超短期预测效果的影响,提高算法的预测精度和运算效率,该文提出一种基于聚类经验模态分解(clusterempiricalmodedecomposition,CEMD)的卷积神经网络和长短期记忆网络(convolutional neural network and long short term memory network,CNNLSTM)混合预测算法。该算法首先通过经验模态分解法将负荷数据分解为平稳性好、规律性强的若干本征模态函数(intrinsic mode functions,IMF)和残差(residual,Res)。其次为了简化后续模型的计算体量,运用k均值聚类方法对分解所得的各分量进行分组集成,同时分析不同聚类数对应的预测效果,选取最优聚类标签构造神经网络输入数据。之后将各组数据分别输入到CNN-LSTM混合神经网络中,利用CNN挖掘数据间的特征形成特征向量,并将其输入到LSTM中进行预测。最后将所有预测结果进行线性相加得到完整预测负荷。通过在真实负荷上进行验证并与现有模型进行比较,所提方法具有更高的预测精度。
文摘在生物医学文本挖掘领域,化学药物命名实体识别具有重要意义.目前的主流方法是基于条件随机场(conditional random fields,CRF)的方法,但是该方法需要大量的人工特征,并且存在实体标签的全文非一致性问题.针对此问题,提出一种基于注意(Attention)机制的深度学习方法.该方法首先从海量生物文本中学习词向量,然后利用双向长短期记忆网络(BiLSTM)学习字符向量,随后将词向量和字符向量再经过另一个BiLSTM以获得词的上下文表示,然后再利用Attention机制获得词在全文范围下的上下文表示,最后利用CRF层得到整篇文章的标签序列.实验结果表明:相比之前的研究方法,提高了在同一篇文章中实体识别的一致性,并在BioCreative IV评测中的CHEMDNER数据集上取得了更好的结果(F值为90.77%).