期刊文献+
共找到82篇文章
< 1 2 5 >
每页显示 20 50 100
综合型语言知识库的建设与利用 被引量:29
1
作者 俞士汶 段慧明 +1 位作者 朱学锋 张化瑞 《中文信息学报》 CSCD 北大核心 2004年第5期1-10,共10页
语言知识库的规模和质量决定了自然语言处理系统的成败。经过 18年的努力 ,北京大学计算语言学研究所已经积累了一系列颇具规模、质量上乘的语言数据资源 :现代汉语语法信息词典 ,大规模基本标注语料库 ,现代汉语语义词典 ,中文概念词... 语言知识库的规模和质量决定了自然语言处理系统的成败。经过 18年的努力 ,北京大学计算语言学研究所已经积累了一系列颇具规模、质量上乘的语言数据资源 :现代汉语语法信息词典 ,大规模基本标注语料库 ,现代汉语语义词典 ,中文概念词典 ,不同单位对齐的双语语料库 ,多个专业领域的术语库 ,现代汉语短语结构规则库 ,中国古代诗词语料库等等。本项研究将把这些语言数据资源集成为一个综合型的语言知识库。集成不同的语言数据资源时 ,必须克服它们之间的“缝隙”。规划中的综合型语言知识库除了有统一的友好的使用界面和方便的应用程序接口外 ,还将提供支持知识挖掘的工具软件 ,促使现有的语言数据资源从初级产品形式向深加工产品形式不断发展 ;提供多种形式的知识传播和信息服务机制 ,让综合型语言知识库为语言信息处理研究、语言学本体研究和语言教学提供全方位的。 展开更多
关键词 计算机应用 中文信息处理 语言处理 语言知识库 语言数据资源 电子词典 语料库
下载PDF
语义文本相似度计算方法 被引量:33
2
作者 韩程程 李磊 +1 位作者 刘婷婷 高明 《华东师范大学学报(自然科学版)》 CAS CSCD 北大核心 2020年第5期95-112,共18页
综述了语义文本相似度计算的最新研究进展,主要包括基于字符串、基于统计、基于知识库和基于深度学习的方法.针对每一类方法,不仅介绍了其中典型的模型和方法,而且深入探讨了各类方法的优缺点;并对该领域的常用公开数据集和评估指标进... 综述了语义文本相似度计算的最新研究进展,主要包括基于字符串、基于统计、基于知识库和基于深度学习的方法.针对每一类方法,不仅介绍了其中典型的模型和方法,而且深入探讨了各类方法的优缺点;并对该领域的常用公开数据集和评估指标进行了整理,最后讨论并总结了该领域未来可能的研究方向. 展开更多
关键词 文本相似度 语义相似度 自然语言处理 知识库 深度学习
下载PDF
现代汉语虚词知识库的研究 被引量:27
3
作者 昝红英 张坤丽 +1 位作者 柴玉梅 俞士汶 《中文信息学报》 CSCD 北大核心 2007年第5期107-111,共5页
现代汉语虚词在句法中所起的作用比较复杂,其个性较强,用法各异。目前已有的虚词研究成果大都是面向人用的,对虚词个性的描写难以避免主观性和模糊性,很难直接应用于自然语言处理的研究。本文从计算语言学的观点出发,根据目前已有的虚... 现代汉语虚词在句法中所起的作用比较复杂,其个性较强,用法各异。目前已有的虚词研究成果大都是面向人用的,对虚词个性的描写难以避免主观性和模糊性,很难直接应用于自然语言处理的研究。本文从计算语言学的观点出发,根据目前已有的虚词研究成果以及对真实语料中虚词用法规律的考察,着力构建面向机器的现代汉语虚词用法信息词典和虚词用法规则库,旨在为现代汉语虚词用法的机器识别打下一定的数据基础。 展开更多
关键词 计算机应用 中文信息处理 虚词 语言知识库 用法属性 规则库
下载PDF
面向自然语言处理的汉语虚词研究与广义虚词知识库构建 被引量:21
4
作者 昝红英 朱学锋 《当代语言学》 CSSCI 北大核心 2009年第2期124-135,共12页
现代汉语虚词的研究历史悠久,成果丰富。但是目前已有的虚词研究成果大都是面向人用的,对虚词个性的描写难以避免主观性和模糊性,很难直接应用于NLP的相关研究。本文从计算语言学的观点出发,根据目前已有的虚词研究成果以及对《人民日... 现代汉语虚词的研究历史悠久,成果丰富。但是目前已有的虚词研究成果大都是面向人用的,对虚词个性的描写难以避免主观性和模糊性,很难直接应用于NLP的相关研究。本文从计算语言学的观点出发,根据目前已有的虚词研究成果以及对《人民日报》分词与词性标注语料中虚词用法规律的考察,着力构建面向NLP的现代汉语广义虚词知识库,旨在为现代汉语虚词用法的机器识别打下一定的数据基础。 展开更多
关键词 现代汉语虚词 语言知识库 用法属性 规则库 语料库
原文传递
关于汉语信息处理的认识及其研究方略 被引量:5
5
作者 俞士汶 朱学锋 《语言文字应用》 CSSCI 北大核心 2002年第2期51-58,共8页
在总结长期实践经验的基础上 ,笔者分析了为什么自然语言处理是一个相当困难的研究领域 ,而汉语信息处理是更加困难的研究领域。面对日益强烈的社会需求 ,汉语信息处理的研究方兴未艾。笔者探讨了开展这项研究的技术路线 。
关键词 自然语言处理 汉语信息处理 语言知识库
下载PDF
基于XML的结构化电子病历系统设计 被引量:15
6
作者 吴伶俐 刘洪星 《计算机工程与设计》 CSCD 北大核心 2007年第2期473-476,共4页
阐述了两种结构化数据采集的方法:自然语言处理(NLP)和结构化数据输入(SDE)。基于上述两种方法,设计了一个结构化电子病历系统(EPR)的原型,用XML技术来描述和实现知识库,使用Microsoft.NET的XML数据流技术实现病历数据的输入、存储和展... 阐述了两种结构化数据采集的方法:自然语言处理(NLP)和结构化数据输入(SDE)。基于上述两种方法,设计了一个结构化电子病历系统(EPR)的原型,用XML技术来描述和实现知识库,使用Microsoft.NET的XML数据流技术实现病历数据的输入、存储和展现,并使用XSL技术实现Web方式的病历浏览。设计表明,利用XML技术解决病历的自由输入并和结构化输入相结合,是可行的技术方案;它为电子病历的研究提供了新的途径。 展开更多
关键词 可扩展标记语言 结构化电子病历 EPR 自然语言处理 结构化数据输入 知识库 XSL
下载PDF
面向知识库的中文自然语言问句的语义理解 被引量:15
7
作者 许坤 冯岩松 +2 位作者 赵东岩 陈立伟 邹磊 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2014年第1期85-92,共8页
设计从自然语言问句到结构化查询的转换框架。该方法从自然语言问句的句法结构入手,提出一套启发式识别实体与关系的方法,并利用语料库建立从实体到知识库的映射,对谓词进行消歧,进而转化为计算机可理解的结构化查询语言。从百度知道抽... 设计从自然语言问句到结构化查询的转换框架。该方法从自然语言问句的句法结构入手,提出一套启发式识别实体与关系的方法,并利用语料库建立从实体到知识库的映射,对谓词进行消歧,进而转化为计算机可理解的结构化查询语言。从百度知道抽取人物、地点、组织3类共42个问题作为标准测试集。实验结果表明,所提出的框架能够有效地将中文自然语言问句转换为结构化查询,为下一代智能问答系统打下良好的基础。 展开更多
关键词 自然语言问句 知识库 查询语义图
下载PDF
基于SQL Server的演绎数据库系统 被引量:7
8
作者 陶世群 原锦辉 《计算机工程》 CAS CSCD 北大核心 2001年第3期33-34,共2页
分析了演绎数据库的理论基础和实现机制,重点介绍设计和实现的基于SQL Server的演绎数据库系统,对系统进行了分析和评价.
关键词 演绎数据库系统 SQL SERVER 人工智能 数学模型
下载PDF
结合预训练模型和语言知识库的文本匹配方法 被引量:11
9
作者 周烨恒 石嘉晗 徐睿峰 《中文信息学报》 CSCD 北大核心 2020年第2期63-72,共10页
针对文本匹配任务,该文提出一种大规模预训练模型融合外部语言知识库的方法。该方法在大规模预训练模型的基础上,通过生成基于WordNet的同义-反义词汇知识学习任务和词组-搭配知识学习任务引入外部语言学知识。进而,与MT-DNN多任务学习... 针对文本匹配任务,该文提出一种大规模预训练模型融合外部语言知识库的方法。该方法在大规模预训练模型的基础上,通过生成基于WordNet的同义-反义词汇知识学习任务和词组-搭配知识学习任务引入外部语言学知识。进而,与MT-DNN多任务学习模型进行联合训练,以进一步提高模型性能。最后利用文本匹配标注数据进行微调。在MRPC和QQP两个公开数据集的实验结果显示,该方法可以在大规模预训练模型和微调的框架基础上,通过引入外部语言知识进行联合训练有效提升文本匹配性能。 展开更多
关键词 文本匹配 预训练模型 语言知识库融合
下载PDF
制造资源构造工具建模 被引量:1
10
作者 段广洪 王云莉 +4 位作者 毛伟 刘丹 王先逵 库冠群 庞智勤 《制造技术与机床》 CSCD 北大核心 2000年第1期35-37,共3页
提出了一种面向工艺设计的制造资源构造工具的建模方法。用户使用这个构造工具分别建立、管理用户工艺知识库和制造资源数据库,有助于工艺知识的获取和车间设备状况的反映。文章给出了知识库完备性检验的模型,介绍了基于此引导模板的... 提出了一种面向工艺设计的制造资源构造工具的建模方法。用户使用这个构造工具分别建立、管理用户工艺知识库和制造资源数据库,有助于工艺知识的获取和车间设备状况的反映。文章给出了知识库完备性检验的模型,介绍了基于此引导模板的知识库维护方式;提出了一种参数化工艺规程语言描述方法;分析了面向对象的制造资源库的操作方法。 展开更多
关键词 构造工具 工艺语言 知识库 数据库 制造资源
全文增补中
基于XML的海上搜救智能决策支持系统知识库 被引量:7
11
作者 于卫红 贾传荧 《大连海事大学学报》 CAS CSCD 北大核心 2005年第4期30-32,共3页
提出了用XML构建基于多agent的海上搜救智能决策支持系统知识库的新方法,研究了知识库的创建、知识库与应用程序相结合等问题.研究结果表明:与传统的知识表示方法相比,基于XML的知识库具有检索效率高、通用性良好等优点,特别是能较好地... 提出了用XML构建基于多agent的海上搜救智能决策支持系统知识库的新方法,研究了知识库的创建、知识库与应用程序相结合等问题.研究结果表明:与传统的知识表示方法相比,基于XML的知识库具有检索效率高、通用性良好等优点,特别是能较好地实现异构系统的互操作. 展开更多
关键词 可扩展标记语言 海上搜救智能决策支持系统 知识库 异构系统
原文传递
基于临床护理分类系统的患儿体温过高护理程序知识库的构建 被引量:8
12
作者 赵永信 顾莺 +7 位作者 张晓波 刘芳 吴颖 叶岚 王慧美 万嫣敏 陆春梅 夏爱梅 《中华护理杂志》 CSCD 北大核心 2020年第12期1808-1812,共5页
目的基于临床护理分类(clinical care classification,CCC)系统2.5版,构建患儿体温过高护理程序知识库。方法以患儿常见症状"腋下温度≥37.5℃"为研究内容,采用循证护理法,研究小组结合临床护理常规及医院管理制度,汇总与&qu... 目的基于临床护理分类(clinical care classification,CCC)系统2.5版,构建患儿体温过高护理程序知识库。方法以患儿常见症状"腋下温度≥37.5℃"为研究内容,采用循证护理法,研究小组结合临床护理常规及医院管理制度,汇总与"腋下温度≥37.5℃"相关的所有护理措施。基于CCC系统2.5版"腋下温度≥37.5℃"相关护理诊断、核心护理干预措施、护理活动类型修饰语及护理结局修饰语,构建患儿体温过高护理程序知识库初稿。按照CCC系统2.5版中"具体护理措施编码=核心护理干预编码+护理活动类型修饰语编码""护理结局编码=护理诊断编码+护理结局修饰语编码"的编码规则,对知识库初稿内容进行编码,然后通过专家咨询对知识库初稿内容及编码进行评价、讨论与修改,确定知识库终稿。结果患儿体温过高护理程序知识库终稿包括1项护理诊断、19项具体护理措施和4种护理结局。结论患儿体温过高护理程序知识库具有专业性、科学性与实用性,标准化了护理语言,有利于信息共享。 展开更多
关键词 标准化护理术语 临床护理分类系统 知识库 儿科护理学
原文传递
Learning to Transform Service Instructions into Actions with Reinforcement Learning and Knowledge Base 被引量:7
13
作者 Meng-Yang Zhang Guo-Hui Tian +1 位作者 Ci-Ci Li Jing Gong 《International Journal of Automation and computing》 EI CSCD 2018年第5期582-592,共11页
In order to improve the learning ability of robots, we present a reinforcement learning approach with a knowledge base for mapping natural language instructions to executable action sequences. A simulated platform wit... In order to improve the learning ability of robots, we present a reinforcement learning approach with a knowledge base for mapping natural language instructions to executable action sequences. A simulated platform with physical engine is built as interactive environment. Based on the knowledge base, a reward function with immediate rewards and delayed rewards is designed to handle sparse reward problems. Also, a list of object states is produced by retrieving the knowledge base, as a standard to define the quality of action sequences. Experimental results demonstrate that our approach yields good performance on accuracy of action sequences production. 展开更多
关键词 Natural language robot knowledge base reinforcement learning object state.
原文传递
大语言模型在建筑工程中的应用测试与讨论 被引量:6
14
作者 覃思中 郑哲 +1 位作者 顾燚 陆新征 《工业建筑》 北大核心 2023年第9期162-169,共8页
建筑业作为我国的经济支柱行业之一,一直面临着生产效率低、智能化水平有限等问题,大语言模型则给行业的发展带来了新的可能。首先提出了一套大语言模型在建筑工程中的应用方案,采用提示词工程和本地知识库相结合的方式来提升模型性能,... 建筑业作为我国的经济支柱行业之一,一直面临着生产效率低、智能化水平有限等问题,大语言模型则给行业的发展带来了新的可能。首先提出了一套大语言模型在建筑工程中的应用方案,采用提示词工程和本地知识库相结合的方式来提升模型性能,通过实验分析验证其效果,并探究了本方案在行业各个领域中应用的可行性,针对部分任务提供了详细的应用案例。从实验结果中可以看出,尽管目前大语言模型在一些复杂的问题上还有较大的提升空间,但已经能初步替代建筑工程中的一些文本任务,为建筑业未来的发展提供了一个新的方向。 展开更多
关键词 大语言模型 建筑工程 提示词工程 本地知识库 问答系统
原文传递
面向新领域的事件抽取研究综述 被引量:7
15
作者 黄河燕 刘啸 《智能系统学报》 CSCD 北大核心 2022年第1期201-212,共12页
在当前互联网时代,大量新领域下的非结构文本数据中蕴含了海量信息。面向新领域的事件抽取方法研究能快速地构建领域知识库,用于支撑基于知识的下游应用。但现有事件抽取系统的领域限定性强,在新领域中从零构建会极度依赖事件体系和标... 在当前互联网时代,大量新领域下的非结构文本数据中蕴含了海量信息。面向新领域的事件抽取方法研究能快速地构建领域知识库,用于支撑基于知识的下游应用。但现有事件抽取系统的领域限定性强,在新领域中从零构建会极度依赖事件体系和标注数据的质量及规模,需要大量人力和专家知识来定制模板和标注语料。而且数据集中常见在相同的上下文中出现多个相关联的事件实例,对事件抽取和真实性检测产生了极大阻碍。本文针对面向新领域的事件抽取这一新兴研究领域进行综述,从事件模板推导、多实例联合事件抽取、事件真实性检测三个研究方向介绍了相关工作的研究现状,并对目前存在的重点和难点问题进行了讨论,指出了下一步需要开展的研究工作。 展开更多
关键词 事件抽取 新领域 信息抽取 事件模板推导 联合抽取 事件真实性检测 自然语言处理 知识库
下载PDF
基于语法语义知识的维吾尔文机构名识别 被引量:7
16
作者 麦合甫热提 米日姑.肉孜 +1 位作者 麦热哈巴.艾力 吐尔根.依布拉音 《计算机工程与设计》 CSCD 北大核心 2014年第8期2944-2948,共5页
为了提高维吾尔语中机构名的自动识别准确率,从维吾尔语的语言特点出发,对维吾尔语中机构名的组织结构进行了分类并将其形式化表示;根据此特征设计出有效地识别规则,创建了特征词库、地名库和修饰词库等知识库;设计并实现了基于状态转... 为了提高维吾尔语中机构名的自动识别准确率,从维吾尔语的语言特点出发,对维吾尔语中机构名的组织结构进行了分类并将其形式化表示;根据此特征设计出有效地识别规则,创建了特征词库、地名库和修饰词库等知识库;设计并实现了基于状态转移原理的高效识别算法。实验结果表明,该算法识别的F值达到83.05%,获得了较好结果。 展开更多
关键词 自然语言处理 命名实体识别 机构名识别 知识库 规则匹配
下载PDF
语言的抽象、封装与变换型开发方法 被引量:4
17
作者 张乃孝 郑红军 裘宗燕 《软件学报》 EI CSCD 北大核心 1998年第7期496-500,共5页
该文提出了一种系统的软件开发方法——面向模型的变换型软件开发方法.这种方法把数据抽象的思想提高到语言抽象层次;把一类专用软件的规范抽象为语言的规范;把这类软件的实现抽象为语言的归约变换;用“规范+变换”抽象软件开发过... 该文提出了一种系统的软件开发方法——面向模型的变换型软件开发方法.这种方法把数据抽象的思想提高到语言抽象层次;把一类专用软件的规范抽象为语言的规范;把这类软件的实现抽象为语言的归约变换;用“规范+变换”抽象软件开发过程.为支持这种方法,提出了语言的一种抽象与封装机制Garment,以此定义语言中各成分的语法和语义,描述语言间的继承、屏蔽和扩充关系.最后,以语言知识库为核心,简要介绍了支持用Garment进行变换型开发的系统结构和工作流程. 展开更多
关键词 变换型方法 语言抽象 语言封装 软件开发方法
下载PDF
计算语言学浅介 被引量:4
18
作者 俞士汶 朱学锋 《术语标准化与信息技术》 2009年第3期34-39,共6页
计算语言学是文理交叉的新兴学科,以自然语言(汉语、英语等)的计算机处理(包括分析和生成)为研究内容,其最高境界是自然语言的机器理解,从而在人机之间实现自然语言的交互。本文简单介绍计算语言学和自然语言处理的研究对象、内容和当... 计算语言学是文理交叉的新兴学科,以自然语言(汉语、英语等)的计算机处理(包括分析和生成)为研究内容,其最高境界是自然语言的机器理解,从而在人机之间实现自然语言的交互。本文简单介绍计算语言学和自然语言处理的研究对象、内容和当前的主攻方向。语言知识库是支撑自然语言处理研究的重要基础。本文也介绍了作者及其同仁在语言知识库建设方面所作的努力。最后,展望了自然语言理解研究的前景。 展开更多
关键词 计算语言学 自然语言处理 自然语言理解 语言知识库 现代汉语语法信息词典
下载PDF
基于自然语言处理的肿瘤专科病历质控系统建设 被引量:2
19
作者 刘伟伟 王立军 +2 位作者 庞娟 王丹 衡反修 《医学信息学杂志》 CAS 2024年第2期77-81,91,共6页
目的/意义通过建立电子病历内涵质控系统,实现病历书写标准化与规范化,提高医院病历质量。方法/过程基于医院医疗数据搭建智能中台,结合自然语言处理、机器学习技术形成具有肿瘤专科特色的知识库、规则库,实现电子病历“前置审核、全面... 目的/意义通过建立电子病历内涵质控系统,实现病历书写标准化与规范化,提高医院病历质量。方法/过程基于医院医疗数据搭建智能中台,结合自然语言处理、机器学习技术形成具有肿瘤专科特色的知识库、规则库,实现电子病历“前置审核、全面覆盖、过程监管、闭环管理”的全新质控模式。结果/结论应用基于自然语言处理的肿瘤专科病历质控系统后,质控覆盖率由1%提升至100%,甲级病案率提升至96%以上,具有较好的实时性与准确率,为医院病历高质量发展奠定坚实的信息化基础。 展开更多
关键词 内涵质控 自然语言处理 肿瘤知识库 电子病历
下载PDF
结合知识图谱的行业知识库构建方法研究 被引量:6
20
作者 王得强 吴军 关立文 《制造技术与机床》 北大核心 2022年第8期74-80,共7页
首先阐述了机器学习和知识图谱的相关概念以及在行业知识库建设中的应用情况和地位,然后结合典型算法介绍了机器学习常见的模型,为提高行业知识库中知识的关联性并降低冗余性,引入了行业知识图谱及其构建相关的新技术方法,进而引出了对... 首先阐述了机器学习和知识图谱的相关概念以及在行业知识库建设中的应用情况和地位,然后结合典型算法介绍了机器学习常见的模型,为提高行业知识库中知识的关联性并降低冗余性,引入了行业知识图谱及其构建相关的新技术方法,进而引出了对于行业知识库构建方法的研究,结合智能知识库展示了知识图谱的创新性应用,即利用知识图谱为知识库的搜索和推荐功能提供技术支持,同时通过知识图谱对领域知识进行更加直观地展示。最后,结合行业知识库的建设工作对机器学习和知识图谱在其中的作用发挥进行了更深一步的阐述和总结。 展开更多
关键词 知识图谱 机器学习 深度学习 自然语言处理 知识库
下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部