-
题名一种宋词自动生成的遗传算法及其机器实现
被引量:33
- 1
-
-
作者
周昌乐
游维
丁晓君
-
机构
厦门大学智能科学与技术系
浙江大学语言与认知研究中心
厦门大学英国语言文学系
-
出处
《软件学报》
EI
CSCD
北大核心
2010年第3期427-437,共11页
-
基金
国家自然科学基金No.60975076~~
-
文摘
主要针对宋词这种特殊的汉语诗歌体裁,开展了有关自动生成算法及其实现方法的探索性研究.研究工作主要根据宋词特点,设计了基于平仄的编码方式、基于句法和语义加权值的适应度函数、基于精英主义和轮盘赌算法的选择策略,采用部分映射和启发式交叉算子和启发式变异算子,从而构建了一种基于遗传算法的宋词生成计算模型并进行了系统实现.实验结果表明,所建立的计算模型及其软件系统,初步实现了机器自动生成宋词的目标,对于给定的主题词和词牌,基本上能够自动生成有一定欣赏价值的宋词.论文的工作也填补了我国在汉语诗歌自动生成研究方面的不足.
-
关键词
自然语言生成
计算诗学
宋词生成
遗传算法
-
Keywords
natural language generation
computational poetics
Chinese SONGCI generation
genetic algorithm
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名结合多注意力和条件变分自编码器的宋词生成模型
被引量:1
- 2
-
-
作者
梁骁
黄文明
姚俊
温雅媛
邓珍荣
-
机构
桂林电子科技大学计算机与信息安全学院
广西图形图像与智能处理重点实验室
广西壮族自治区高级人民法院
广西师范大学电子工程学院
-
出处
《广西科学》
CAS
北大核心
2022年第2期308-315,共8页
-
基金
广西科技计划项目(桂科AB20238013)
广西图像图形与智能处理重点实验室培育基地(桂林电子科技大学)开放基金项目(GIIP2011)
广西高校中青年教师科研基础能力提升项目(2019KY0238)资助。
-
文摘
现有的诗词生成方法忽略了风格的重要性。另外,由于宋词大部分词牌词句较多,逐句生成宋词的过程中容易产生上下文缺乏连贯性的现象,在上下文连贯性方面仍存在提升空间。针对这两个问题,在编码解码的文本生成框架基础上,引入自注意力机制的句子表示算法计算多注意力权重矩阵,用于提取词句的多种重要语义特征,让模型更多地关注上文的显著信息来提高上下文连贯性。引入条件变分自编码器(CVAE)将每条宋词数据转化为隐空间中不同风格特征的高维高斯分布,从各自的分布中采样隐变量来控制宋词的风格。由于自构建的宋词语料库缺少完整风格分类标签,使用具有风格标签的宋词微调BERT模型,将其作为风格分类器标注全部的宋词数据。在上述关键技术的基础上实现了宋词生成模型,生成上下文连贯的婉约词以及豪放词。通过与其他4种基准方法进行对比实验,结果表明引入自注意力机制的句子表示算法和条件变分自编码器,在上下文连贯性和风格控制方面有一定的提升。
-
关键词
条件变分自编码器
宋词风格
宋词生成
Bi-GRU
自注意力机制
-
Keywords
conditional variational auto-encoder
Song Ci style
generation of Song Ci
Bi-GRU
self-attention mechanism
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
I207.22
[自动化与计算机技术—计算机科学与技术]
-