期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
多特征融合的专利功效短语抽取
1
作者
游新冬
赵颖
+1 位作者
刘佳琦
吕学强
《计算机工程与设计》
北大核心
2024年第5期1413-1419,共7页
为提高专利功效短语抽取的准确率和召回率,保障专利布局等研究工作的高质量进行,提出一种融合多特征的专利功效短语抽取模型。基于Bert-BiLSTM-CRF的整体框架,利用Bert模型对文本进行向量化,融合偏旁部首、五笔、词长+词性等特征输入到B...
为提高专利功效短语抽取的准确率和召回率,保障专利布局等研究工作的高质量进行,提出一种融合多特征的专利功效短语抽取模型。基于Bert-BiLSTM-CRF的整体框架,利用Bert模型对文本进行向量化,融合偏旁部首、五笔、词长+词性等特征输入到BiLSTM或Transformer进行编码,使用CRF解码得到对应输入的标签序列,得到专利功效短语。实验采用新能源汽车领域的专利文本作为训练数据,尝试组合不同的特征进行实验,实验结果表明,所提模型在准确率、召回率、F1值上均取得了明显提升,验证了多特征融合在功效短语抽取任务上的有效性。
展开更多
关键词
多特征融合
专利功效短语
深度学习
词语
抽取
双向长短期记忆模型
条件随机场模型
词向量模型
下载PDF
职称材料
语料库自然标注信息与中文分词应用研究(英文)
被引量:
2
2
作者
饶高琦
修驰
荀恩东
《北京大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2013年第1期140-146,共7页
以中文分词为应用目标,将大规模语料库上存在的自然标注信息分为显性标注信息与隐性标注信息,分别考察了它们的分布和对大数据集上语言计算的影响。结果表明,两者都直接或间接地表达了作者对语言的分割意志,因而对分词具有积极的影响。...
以中文分词为应用目标,将大规模语料库上存在的自然标注信息分为显性标注信息与隐性标注信息,分别考察了它们的分布和对大数据集上语言计算的影响。结果表明,两者都直接或间接地表达了作者对语言的分割意志,因而对分词具有积极的影响。通过词语抽取测试,发现在缺乏丰富显性标注信息的文本中,来自语言固有规律的自然标注信息对字符串有着强大的分割性能。
展开更多
关键词
自然标注信息
中文分词
词语
抽取
大规模语料库
下载PDF
职称材料
词语搭配抽取系统的对比研究
3
作者
薛晶
杜友福
黄岚
《现代计算机》
2016年第6期17-21,共5页
词语搭配抽取系统是自动抽取搭配的有效工具,对自然语言处理和语言学习具有重要作用。从语料库来源、抽取方法和抽取结果三方面对常用的搭配抽取系统作比较分析,以便找到一种适合于特定情况的系统。
关键词
词语
搭配
抽取
抽取
方法
语料库
下载PDF
职称材料
题名
多特征融合的专利功效短语抽取
1
作者
游新冬
赵颖
刘佳琦
吕学强
机构
北京信息科技大学网络文化与数字传播重点实验室
出处
《计算机工程与设计》
北大核心
2024年第5期1413-1419,共7页
基金
国家自然科学基金项目(62171043)
北京市自然科学基金项目(4212020)
+2 种基金
国家语委基金项目(ZDI145-10、YB145-3)
国防科技重点实验室基金项目(6412006200404)
北京市教育委员会科学研究计划基金项目(KM202111232001)。
文摘
为提高专利功效短语抽取的准确率和召回率,保障专利布局等研究工作的高质量进行,提出一种融合多特征的专利功效短语抽取模型。基于Bert-BiLSTM-CRF的整体框架,利用Bert模型对文本进行向量化,融合偏旁部首、五笔、词长+词性等特征输入到BiLSTM或Transformer进行编码,使用CRF解码得到对应输入的标签序列,得到专利功效短语。实验采用新能源汽车领域的专利文本作为训练数据,尝试组合不同的特征进行实验,实验结果表明,所提模型在准确率、召回率、F1值上均取得了明显提升,验证了多特征融合在功效短语抽取任务上的有效性。
关键词
多特征融合
专利功效短语
深度学习
词语
抽取
双向长短期记忆模型
条件随机场模型
词向量模型
Keywords
multi-feature fusion
patent efficacy phrase
deep learning
word extraction
BiLSTM model
CRF model
Word2vec model
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
语料库自然标注信息与中文分词应用研究(英文)
被引量:
2
2
作者
饶高琦
修驰
荀恩东
机构
北京语言大学信息科学学院
出处
《北京大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2013年第1期140-146,共7页
基金
国家自然科学基金(60973062,61170162)
中央高校基本科研业务费专项资金(2012-jbyz-001)资助
文摘
以中文分词为应用目标,将大规模语料库上存在的自然标注信息分为显性标注信息与隐性标注信息,分别考察了它们的分布和对大数据集上语言计算的影响。结果表明,两者都直接或间接地表达了作者对语言的分割意志,因而对分词具有积极的影响。通过词语抽取测试,发现在缺乏丰富显性标注信息的文本中,来自语言固有规律的自然标注信息对字符串有着强大的分割性能。
关键词
自然标注信息
中文分词
词语
抽取
大规模语料库
Keywords
natural annotation
Chinese word segmentation
word extraction
large-scale corpora
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
词语搭配抽取系统的对比研究
3
作者
薛晶
杜友福
黄岚
机构
长江大学计算机科学学院
出处
《现代计算机》
2016年第6期17-21,共5页
文摘
词语搭配抽取系统是自动抽取搭配的有效工具,对自然语言处理和语言学习具有重要作用。从语料库来源、抽取方法和抽取结果三方面对常用的搭配抽取系统作比较分析,以便找到一种适合于特定情况的系统。
关键词
词语
搭配
抽取
抽取
方法
语料库
Keywords
Collocation Extraction
Extraction Approaches
Corpus
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
多特征融合的专利功效短语抽取
游新冬
赵颖
刘佳琦
吕学强
《计算机工程与设计》
北大核心
2024
0
下载PDF
职称材料
2
语料库自然标注信息与中文分词应用研究(英文)
饶高琦
修驰
荀恩东
《北京大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2013
2
下载PDF
职称材料
3
词语搭配抽取系统的对比研究
薛晶
杜友福
黄岚
《现代计算机》
2016
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部