期刊文献+
共找到20篇文章
< 1 >
每页显示 20 50 100
面向数字人文的馆藏方志古籍地名自动识别模型构建 被引量:20
1
作者 李娜 包平 《图书馆》 CSSCI 北大核心 2018年第5期67-73,共7页
在数字人文背景下,以馆藏方志古籍为语料库,以摘抄自地方志的农业专题资料《方志物产》之山西分卷为例,在全文人工标注的基础上,构建基于条件随机场的古汉语地名自动识别模型,通过交叉验证方法测试模型的识别性能,用精确率P、召回率R和... 在数字人文背景下,以馆藏方志古籍为语料库,以摘抄自地方志的农业专题资料《方志物产》之山西分卷为例,在全文人工标注的基础上,构建基于条件随机场的古汉语地名自动识别模型,通过交叉验证方法测试模型的识别性能,用精确率P、召回率R和调和平均数F为测评指标,最佳的测试效果分别为98.16%、91.55%、94.57%。结果显示,条件随机场模型在基于人工标注的方志古籍语料上能够取得较好的识别效果,为深化图书馆馆藏古籍的整理利用提供借鉴。 展开更多
关键词 条件随机场 方志古籍 地名 馆藏资源
下载PDF
CRF与规则相结合的维吾尔文地名识别研究 被引量:9
2
作者 买合木提.买买提 卡哈尔江.阿比的热西提 +2 位作者 艾山.吾买尔 吐尔根.依布拉音 王路路 《中文信息学报》 CSCD 北大核心 2017年第6期110-118,共9页
该文通过维吾尔文地名的分析研究,提出了一种基于条件随机场和规则的维吾尔文地名识别方法。根据维吾尔文地名黏着性、音译等特点,针对维吾尔文地名识别任务,在词汇和词性特征基础之上,引入音节、词向量获取的相似单词、常用地名词典、... 该文通过维吾尔文地名的分析研究,提出了一种基于条件随机场和规则的维吾尔文地名识别方法。根据维吾尔文地名黏着性、音译等特点,针对维吾尔文地名识别任务,在词汇和词性特征基础之上,引入音节、词向量获取的相似单词、常用地名词典、地名特征词、地名词缀等特征进行实验,结果表明这些特征对识别性能有较大的影响。通过对错误识别结果分析,该文提出了基于规则的后处理,进一步提高了识别性能,准确率达到94.68%,召回率达到89.52%,F值达到92.03%。 展开更多
关键词 命名实体 维吾尔文 地名 条件随机场 词向量
下载PDF
中美政治语篇地名转喻的意识形态研究 被引量:4
3
作者 陈敏 周宜珊 倪锦诚 《外语学刊》 CSSCI 北大核心 2018年第3期38-43,共6页
本文运用语料库语言学的研究方法,对中美政治语篇中地名的转喻性用法进行实证研究,尝试依托自建语料库语料透析潜存于转喻使用背后的意识形态动因。基于英汉新闻报刊中有关中美关系话题的语料,借助USAS语义标注软件,按转喻识别程序,识... 本文运用语料库语言学的研究方法,对中美政治语篇中地名的转喻性用法进行实证研究,尝试依托自建语料库语料透析潜存于转喻使用背后的意识形态动因。基于英汉新闻报刊中有关中美关系话题的语料,借助USAS语义标注软件,按转喻识别程序,识别并概括出"地点"(次级)转喻模式,进一步的卡方检验从概念和话语层面更为精确地描绘出该转喻的分布特点与分化粒度。研究发现,中美政治语篇中"地点"转喻反映概念与话语层面上的使用特征,对潜存于背后的隐性的意识形态具有加强与建构作用,因此转喻成为中美媒体表达其政治观点与评价偏见的载体和实施后台操控的工具。 展开更多
关键词 概念转喻 地名 政治语篇 意识形态
原文传递
Techniques for Determining the Geographic Location of IP Addresses in ISP Topology Measurement 被引量:2
4
作者 Yu Jiang Bin-Xing Fang +1 位作者 Ming-Zeng Hu Xiang Cui 《Journal of Computer Science & Technology》 SCIE EI CSCD 2005年第5期689-701,共13页
A brief survey on the state-of-the-art research of determining geographic location of IP addresses is presented. The problem of determining the geographic location of routers in Internet Service Provider (ISP) topol... A brief survey on the state-of-the-art research of determining geographic location of IP addresses is presented. The problem of determining the geographic location of routers in Internet Service Provider (ISP) topology measurement is discussed when there is inadequate information such as domain names that could be used. Nine empirical inference rules are provided, and they are respectively (1) rule of mutual inference, (2) rule of locality, (3) rule of ping-pong assignment, (4) rule of bounding from both sides, (5) rule of preferential exit deny, (6) rule of uureachable/timeout, (7) rule of relay hop assignment, (8) rule of following majority, and (9) rule of validity checking based on interface-finding. In totally 2,563 discovered router interfaces of a national ISP topology, only 6.4% of them can be located by their corresponding domain names. In contrast, after exercising these nine empirical inference rules, 38% of them have been located. Two methods have mainly been employed to evaluate the effectiveness of these inference rules. One is to compare the measured topology graph with the graph published by the corresponding ISP. The other is to contact the administrator of the corresponding ISP for the verification of IP address locations of some key routers. The conformity between the locations inferred by the rules and those determined by domain names as well as those determined by whois information is also examined. Experimental results show that these empirical inference rules play an important role in determining the geographic location of routers in ISP topology measurement. 展开更多
关键词 network topology Internet topology measurement geographic location network deployment structure routing domain name whois information
原文传递
奉节建县时间、地点及县名由来考 被引量:1
5
作者 李君鉴 《三峡论坛》 2012年第5期21-26,147,共6页
奉节建县的时间和最初的治地,各说不一或自相矛盾。本文认为以春秋时期县的概念看,奉节建县在春秋初期,即庸国鱼邑时期;以当下县的概念看,奉节建县在战国中期,即楚巫郡鱼邑时期;鱼复作为奉节第一个县名,当在公元前277年。建县地点在鱼... 奉节建县的时间和最初的治地,各说不一或自相矛盾。本文认为以春秋时期县的概念看,奉节建县在春秋初期,即庸国鱼邑时期;以当下县的概念看,奉节建县在战国中期,即楚巫郡鱼邑时期;鱼复作为奉节第一个县名,当在公元前277年。建县地点在鱼复浦。鱼复的得名,若认为得名于巴得鱼邑之地后,"鱼、复"皆指当地鱼人,是三峡土著语言的华夏族记音用字。若认为秦建鱼复县后方有"鱼复"之名,那么"鱼",指当地鱼人,"复",即"复除",免除赋役之意。笔者倾向前种说法。 展开更多
关键词 奉节 建县 时间 地点 县名由来
下载PDF
位置信息记录中基于期望最大化的名称消重算法
6
作者 孙晓玲 郑勉 +1 位作者 李伟勤 罗恩韬 《计算机科学》 CSCD 北大核心 2016年第3期238-241,251,共5页
在包含位置信息的签到记录中,每条记录仅包含名称和位置(经纬度)两个属性。传统的名称消重算法通过匹配实体的属性值或者计算实体间的名称相似性进行消重,忽略了位置信息的特殊性。为了提高位置信息记录中名称消重的质量,提出了一种基... 在包含位置信息的签到记录中,每条记录仅包含名称和位置(经纬度)两个属性。传统的名称消重算法通过匹配实体的属性值或者计算实体间的名称相似性进行消重,忽略了位置信息的特殊性。为了提高位置信息记录中名称消重的质量,提出了一种基于期望最大化的位置名称消重算法。首先,提出了一种包含核心单词和背景单词的文本名称模型,并给出了计算模型参数值的期望最大化算法。其次,在文本名称模型中引入位置信息,将整个地图划分为若干个网格,分别计算每个网格中核心单词和背景单词的分布情况,并提出了一种考虑位置的文本名称模型。最后,将位置文本名称模型用于位置信息记录中的名称消重,并给出了相应的名称消重算法。实验表明,与传统的名称消重模型相比,提出的位置名称消重模型可以更好地识别出名称中包含的核心词汇,因而在名称消重时具有更好的性能。 展开更多
关键词 签到 位置 期望最大化 名称消重
下载PDF
俄汉方位地名之比较
7
作者 李山 《河北北方学院学报(社会科学版)》 2020年第3期37-39,共3页
语言是文化的重要载体,地名作为一种特殊的语言形式不仅反映了特定区域的自然特征,还积淀了社会文化。以俄汉语中的方位地名为语料,总结俄汉语方位地名的命名类型,探讨其折射出的两国地理和历史文化特征,从而促进跨文化交际的发展。
关键词 俄汉语 方位地名 命名类型 地理特征 历史文化
下载PDF
基于篇章的中文地名识别研究 被引量:18
8
作者 唐旭日 陈小荷 +1 位作者 许超 李斌 《中文信息学报》 CSCD 北大核心 2010年第2期24-32,共9页
该文介绍了以篇章为单位的中文地名识别方法和系统实现。地名识别包括简单地名识别和复杂地名识别两个阶段。简单地名识别由基于条件随机场的识别模块和基于篇章地名关系的识别模块顺序构成,以原始文本为输入,直接利用地名内部结构和相... 该文介绍了以篇章为单位的中文地名识别方法和系统实现。地名识别包括简单地名识别和复杂地名识别两个阶段。简单地名识别由基于条件随机场的识别模块和基于篇章地名关系的识别模块顺序构成,以原始文本为输入,直接利用地名内部结构和相邻字信息进行地名识别和文本分词,然后利用篇章地名关系和地名性判断进一步处理。复杂地名识别以简单地名识别结果为输入,采用条件随机场识别。系统在封闭测试和开放测试中F-1值分别达到92.87%和89.76%。研究发现,在地名性判断中地名确信度低的字串对于地名识别干扰性较大,篇章地名关系能够在不降低识别精确度的情况下有效提高召回率,综合利用地名短距离和长距离依存关系可以有效提高地名识别效果。 展开更多
关键词 计算机应用 中文信息处理 篇章地名关系 条件随机场 地名性判断
下载PDF
基于统计的中文地名自动识别研究 被引量:13
9
作者 邱莎 阿圆 +1 位作者 王付艳 丁海燕 《计算机技术与发展》 2011年第11期35-38,共4页
中文地名的自动识别是命名实体识别任务中难度较大的任务之一,目的是从中文文本中自动准确提取地理专用名词。文中使用统计模型中的条件随机场对中文地名的自动识别在字一级粒度进行了研究。在研究中利用条件随机场能任意添加特征的优点... 中文地名的自动识别是命名实体识别任务中难度较大的任务之一,目的是从中文文本中自动准确提取地理专用名词。文中使用统计模型中的条件随机场对中文地名的自动识别在字一级粒度进行了研究。在研究中利用条件随机场能任意添加特征的优点,合理引用了丰富的特征组合,在大规模语料上进行训练,统计获得标注序列基于特征集的条件概率分布,并采用序列标注的方式,实现中文地名的自动识别。多次闭合测试和开放测试结果F1值为90%左右,识别效果良好。 展开更多
关键词 中文地名识别 条件随机场 特征模板
下载PDF
基于CRF的藏文地名识别技术研究 被引量:10
10
作者 头旦才让 仁青东主 尼玛扎西 《计算机工程与应用》 CSCD 北大核心 2019年第18期111-115,共5页
藏文地名识别是藏文命名实体识别中必须要解决的问题。通过分析藏文地名的特点及识别难点,阐述了藏文地名的音节、触发词、地名后续词和格助词等特性适用基于CRF模型的地名识别,通过实验,验证了6种特征对藏文地名识别的有效性。实验结... 藏文地名识别是藏文命名实体识别中必须要解决的问题。通过分析藏文地名的特点及识别难点,阐述了藏文地名的音节、触发词、地名后续词和格助词等特性适用基于CRF模型的地名识别,通过实验,验证了6种特征对藏文地名识别的有效性。实验结果表明该方法对藏文地名识别的准确率、召回率和F值分别达到了96.12%、81.92%和88.45%,实验结果与已有的系统相比,取得了较好的效果。 展开更多
关键词 CRF模型 藏文地名 地名识别
下载PDF
方志类古籍地名识别及分析研究——以《方志物产》(广东分卷)为例 被引量:6
11
作者 朱锁玲 包平 《图书馆论坛》 CSSCI 北大核心 2012年第4期171-176,共6页
以地方志资料汇编《方志物产》(广东分卷)为语料,利用命名实体识别技术实现物产地名的自动识别。通过对物产地名、识别规则的文献计量学研究,挖掘物产分布、物产引进和传播等知识内容,为方志类古籍的数字化整理提供新途径。
关键词 方志 《方志物产》 地名识别 内容挖掘 古籍整理
下载PDF
姑射山名称的学术误区及其含义考释 被引量:5
12
作者 李炳海 《河北学刊》 CSSCI 北大核心 2016年第2期107-113,共7页
先秦文献所载姑射山,分布在多个空间方位。有的在鲁南,有的在山西临汾,有的在东北沿海,还有的远在西海。以往对姑射山所作研究,在很大程度上走入学术误区,相继出现《山海经》错简说,以海中列姑射山解释《逍遥游》的姑射山,对《逍遥游》... 先秦文献所载姑射山,分布在多个空间方位。有的在鲁南,有的在山西临汾,有的在东北沿海,还有的远在西海。以往对姑射山所作研究,在很大程度上走入学术误区,相继出现《山海经》错简说,以海中列姑射山解释《逍遥游》的姑射山,对《逍遥游》的姑射山割裂分释。上述做法均不可取。先秦时期姑字往往表达"大"之义,"射"取其挺拔之义。以姑射山相称的山,取其广大高耸之义。即使后代出现的姑射、姑射山,其山体样态亦是绵延广大,挺拔崔巍。姑射山作为山名,其具体含义经历了由虚入实的过程,兼有专名和通称属性。 展开更多
关键词 姑射山 地理位置 名称含义 山体样态
下载PDF
基于条件随机场与规则相结合的中文地名识别 被引量:2
13
作者 高国洋 戚银城 潘德锋 《电脑开发与应用》 2009年第8期26-28,共3页
对中文地名识别进行了研究,提出了一种结合多知识的地名识别方法,该方法首先以条件随机场模型为框架,充分利用地名的外部特征和内部颗粒特征,将局部特征、复合特征以及专家知识相融合进行中文地名识别;在此结果上,利用构建的专家规则库... 对中文地名识别进行了研究,提出了一种结合多知识的地名识别方法,该方法首先以条件随机场模型为框架,充分利用地名的外部特征和内部颗粒特征,将局部特征、复合特征以及专家知识相融合进行中文地名识别;在此结果上,利用构建的专家规则库对实验结果进行修正。实验结果表明,本文的方法是有效的,实验语料为1998年1月的《人民日报》,开放测试准确率、召回率、和F-值分别达到了93.64%、90.36%、92.03%。 展开更多
关键词 中文地名识别 命名实体识别 条件随机场 信息抽取
下载PDF
中文单字国名简称的自动识别 被引量:2
14
作者 李斌 方芳 《计算机工程与应用》 CSCD 北大核心 2006年第28期167-169,176,共4页
单字地名简称识别是中文专名识别的重要组成部分,其中单字国名简称又占到了78.43%。但就现有的词性标注系统来看,还不能很好地对其进行识别。文章提出了一个基于规则的识别方法,以分词文本为底本,通过两次扫描,第一次扫描建立基于语篇... 单字地名简称识别是中文专名识别的重要组成部分,其中单字国名简称又占到了78.43%。但就现有的词性标注系统来看,还不能很好地对其进行识别。文章提出了一个基于规则的识别方法,以分词文本为底本,通过两次扫描,第一次扫描建立基于语篇的临时国名词表,第二次扫描利用上下文特征词等评分机制,从分词碎片中召回单字国名简称。在封闭测试和开放测试中,都取得了较好的实验结果,以人工分词文本为输入底本,调和平均值分别达到了96.33%和94.96%。 展开更多
关键词 单字地名 单字国名简称 评分机制 临时词表
下载PDF
基于多特征融合和图匹配的维汉句子对齐 被引量:2
15
作者 倪耀群 许洪波 程学旗 《中文信息学报》 CSCD 北大核心 2016年第4期124-133,共10页
维吾尔语新闻网页与对应的中文翻译网页在内容上往往并非完全可比,主要表现为双语句子序列的错位甚至部分句子缺失,这给维汉句子对齐造成了困难。此外,作为新闻要素的人名地名很多是未登录词,这进一步增加了维汉句子对齐的难度。为了提... 维吾尔语新闻网页与对应的中文翻译网页在内容上往往并非完全可比,主要表现为双语句子序列的错位甚至部分句子缺失,这给维汉句子对齐造成了困难。此外,作为新闻要素的人名地名很多是未登录词,这进一步增加了维汉句子对齐的难度。为了提高维汉词汇的匹配概率,作者自动提取中文人名、地名并翻译为维吾尔译名,构造双语名称映射表并加入维汉双语词典。然后用维文句中词典词对应的中文译词在中文句中进行串匹配,以避免中文分词错误,累计所有匹配词对得到双语句对的词汇互译率。最后融合数字、标点、长度特征计算双语句对的相似度。在所有双语句子相似度构成的矩阵上,使用图匹配算法寻找维汉平行句对,在900个句对上最高达到95.67%的维汉对齐准确率。 展开更多
关键词 句子对齐 人名、地名翻译 多特征融合 二部图最佳匹配
下载PDF
基于物联网技术的电子定位地名标志系统研究 被引量:2
16
作者 曾玉龙 张晓辉 +1 位作者 吴云婷 余晓芬 《地理空间信息》 2018年第7期51-53,124,共4页
传统的地名标牌提供的信息有限,难以满足日益复杂的公共治理与安全等多元化需求。结合地名普查试点工作中电子定位标志系统研究与开发工作实践,利用GPS技术、数据库技术设计并实现了基于物联网技术的电子定位地名标志系统;重点介绍了基... 传统的地名标牌提供的信息有限,难以满足日益复杂的公共治理与安全等多元化需求。结合地名普查试点工作中电子定位标志系统研究与开发工作实践,利用GPS技术、数据库技术设计并实现了基于物联网技术的电子定位地名标志系统;重点介绍了基于物联网的系统技术路线和工作原理等。 展开更多
关键词 物联网技术 电子定位 地名标志 系统设计
下载PDF
淄博奂山考辨 被引量:1
17
作者 王聿发 刘艳玲 褚宏祥 《淄博师专学报》 2007年第4期69-73,共5页
奂山是淄博市淄川城西北的一座秀丽小山,蒲松龄先生特别钟情奂山,淄川县志中多次记载了奂山山市现象。2004年淄博师专新校区落成于奂山南麓,系统深入地挖掘奂山文化必将有助于淄博师专校园文化的建设和凝炼。我们在实地勘察、走访当地... 奂山是淄博市淄川城西北的一座秀丽小山,蒲松龄先生特别钟情奂山,淄川县志中多次记载了奂山山市现象。2004年淄博师专新校区落成于奂山南麓,系统深入地挖掘奂山文化必将有助于淄博师专校园文化的建设和凝炼。我们在实地勘察、走访当地百姓及研究相关文献资料的基础上,详尽地考证了奂山山名及方位,推断出了奂山碧霞宫的初建年代,再现了民国年间奂山寺庙的基本概貌与历史变迁。 展开更多
关键词 奂山 方位 山名 碧霞宫 寺庙概貌
下载PDF
《哀郢》“陵阳”研究述评 被引量:1
18
作者 周秉高 《职大学报》 2012年第1期1-6,共6页
从古到今,对《九章》"陵阳"的解释,主要有四种不同的说法,即:动词说、地名说、未详说和大波说。从目前情况看,四种说法中,地名说和大波说是学界认知的主流,而大波说的说服力更胜一筹。
关键词 楚辞 《哀郢》 陵阳 地名说 大波说
下载PDF
一种基于统计和规则的核心地名抽取方法
19
作者 石桢 姚天昉 《微型电脑应用》 2013年第2期56-59,共4页
在核心地名抽取方法的研究中,提出了基于统计和规则的针对地名文化类文本的核心地名抽取方法。具体地说,首先通过地名在文本中出现的频度和位置特征衡量地名的重要性,再选择地名文化类文本中一些较为明显的规则,对地名总得分进行一定的... 在核心地名抽取方法的研究中,提出了基于统计和规则的针对地名文化类文本的核心地名抽取方法。具体地说,首先通过地名在文本中出现的频度和位置特征衡量地名的重要性,再选择地名文化类文本中一些较为明显的规则,对地名总得分进行一定的修正。最后通过与传统的TFIDF抽取方法进行比较来验证本文方法的正确性。 展开更多
关键词 核心地名 统计 规则 TFIDF
下载PDF
峨山彝语地名的文化语言学解读
20
作者 罗江文 罗雅馨 《云南农业大学学报(社会科学版)》 2014年第2期88-96,共9页
峨山自古就是彝族聚居的地方,传承了众多的彝语地名,其命名与彝族所处自然环境、社会生活和历史文化密切相关,体现出明显的区域特征和民族特征,从中可以看到峨山彝族社会历史风貌、语言文化和多民族文化的交流与融合。
关键词 彝语地名 文化内涵 文化交融
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部