期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
基于句法模板采样的无监督复述生成方法 被引量:1
1
作者 鲍宇 黄书剑 +3 位作者 周浩 李磊 戴新宇 陈家骏 《中国科学:信息科学》 CSCD 北大核心 2022年第10期1808-1821,共14页
文本复述可以辅助机器翻译、智能问答、文本分类等任务,是非常重要的自然语言处理任务.近年来,一些研究探索了基于结构变换的文本复述,从无监督学习的概率化表示空间中采样多个句法表示并生成多个复述.然而,通过后验分布采样句法表示生... 文本复述可以辅助机器翻译、智能问答、文本分类等任务,是非常重要的自然语言处理任务.近年来,一些研究探索了基于结构变换的文本复述,从无监督学习的概率化表示空间中采样多个句法表示并生成多个复述.然而,通过后验分布采样句法表示生成的复述往往高度相似,缺乏多样性;另一方面,从先验分布采样句法表示又难以保证与给定的语义表示相匹配,导致生成的复述质量欠佳.本文提出了基于句法模板的文本复述模型,引入了句法模板隐变量建立语义空间和句法空间的联系,并进一步提出了两步采样策略:(1)使用先验分布采样句法模板,使得采样的句法表示更加多样化;(2)使用后验分布采样句法表示,以确保句法表示与语义表示的匹配.实验表明,两步采样策略有效地结合了先验采样和后验采样的优势,生成的文本复述可以在具备良好生成质量的同时保持着更好的多样性,取得了当前最佳的复述性能. 展开更多
关键词 无监督复述 变分自编码器 句法结构 采样
原文传递
基于隐式网络和显式网络相似性学习的零样本意图识别 被引量:1
2
作者 孙鹏飞 欧阳亚文 +1 位作者 戴新宇 张文明 《中国科学:信息科学》 CSCD 北大核心 2021年第11期1853-1866,共14页
意图识别是对话系统的一个重要组成部分.现有的工作主要集中在使用充足的标记数据进行意图识别.然而,这些方法不能识别训练数据中不存在的意图.为了解决这个问题,我们提出了一种基于隐式网络和显式网络的相似性学习模型,用于零样本意图... 意图识别是对话系统的一个重要组成部分.现有的工作主要集中在使用充足的标记数据进行意图识别.然而,这些方法不能识别训练数据中不存在的意图.为了解决这个问题,我们提出了一种基于隐式网络和显式网络的相似性学习模型,用于零样本意图识别,该模型能够从词级和句子级学习用户话术和意图描述之间的相似性.为了增强意图的表示,我们引入槽位类型作为意图描述.并依据表达方式的不同将意图分为显式意图和隐式意图,分别从词级和句子级构建显式网络和隐式网络.同时,为了更好地结合这两部分信息,我们还设计了关系层来融合不同层级的信息.在两个基准数据集上的实验结果表明,我们的模型明显优于现有的最先进的模型,并展示了从词级和句子级同时学习相似性的有效性. 展开更多
关键词 零样本意图识别 隐式网络 显式网络 关系层 选择门
原文传递
农业区游牧民族饮食文化的滞后性——基于大同东信广场北魏墓群人骨的稳定同位素研究 被引量:7
3
作者 侯亮亮 古顺芳 +4 位作者 张昕煜 戴玲玲 武夏 张国文 郭怡 《人类学学报》 CSCD 北大核心 2017年第3期359-369,共11页
不同地域的人群具有不同的饮食传统和饮食文化。然而,当人们持续不断的直接或间接接触时,一方或双方原有的饮食文化将会产生变化,如拓跋鲜卑的饮食文化就经历了从游牧向农业的转变。本文对山西大同东信广场北魏墓群26例人骨进行了C、N... 不同地域的人群具有不同的饮食传统和饮食文化。然而,当人们持续不断的直接或间接接触时,一方或双方原有的饮食文化将会产生变化,如拓跋鲜卑的饮食文化就经历了从游牧向农业的转变。本文对山西大同东信广场北魏墓群26例人骨进行了C、N稳定同位素分析,结果 (δ^(13)C值为-11.5±2.7‰,n=26;δ^(15)N值为9.8±1.2‰,n=26)显示,先民的食物类型差异较大,并包含大量的肉食资源。研究表明,以C_3类食物为主的先民主要放牧或狩猎,以C_4类食物为主的先民主要以种植粟、黍等C_4型农作物喂养家畜。大同东信广场北魏墓群人群中两种不同饮食传统的存在,显示游牧民族新的饮食习惯(以粟作农业产品为食)的形成滞后性于北魏政权的建立,这可能与气候变冷及他们的排斥有关。 展开更多
关键词 北魏 东信广场墓群 稳定同位素 食物结构 文化滞后性
下载PDF
基于语法和语义分割的跨领域方面级情感分类
4
作者 吴震 戴新宇 《中国科学:信息科学》 CSCD 北大核心 2023年第7期1299-1313,共15页
神经网络在方面级情感分类任务上已经取得了良好的性能.然而,由于复杂且耗时的数据标注流程,方面级情感分类在很多领域上是低资源甚至是零资源的,这限制了该任务在实际场景中的应用.为了解决这个挑战性的问题,本文关注跨领域的方面级情... 神经网络在方面级情感分类任务上已经取得了良好的性能.然而,由于复杂且耗时的数据标注流程,方面级情感分类在很多领域上是低资源甚至是零资源的,这限制了该任务在实际场景中的应用.为了解决这个挑战性的问题,本文关注跨领域的方面级情感分类,并提出一种基于语法和语义分割的跨领域方面情感分类方法.具体而言,针对不同领域用词差异造成的领域漂移和注意力泛化问题,本文首次提出利用单纯的语法信息来获取可在领域之间迁移的语法注意力,并引入与目标领域相近的文档情感分类任务来增强神经网络模型对目标领域的情感识别能力,最终从语法和语义两个层面分别提升模型的注意力机制和文本上下文表示.实验在6个跨领域方面级情感分类任务上进行,结果表明,与其他9种基线方法相比,本文的方法在6个任务上都取得了最先进的性能,在平均准确率和平均macro-F1两个指标上比之前最好的模型DIFD分别提升7.14%和7.6%.此外,即使以大规模预训练模型BERT,BERT-ADA,RoBERTa等作为骨干网络,本文的方法仍能实现3.5%以上的平均准确率提升和平均macro-F1提升. 展开更多
关键词 方面级情感分类 跨领域 神经网络 注意力 语法和语义
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部