郑州大学现代远程教育[信息检索]

郑州大学现代远程教育《信息检索》

真题 [2015版客观题]

一、名词:(每题5分,共5×6分)

1. 检全率与漏检率

2. D-KWIC

3. 文献著录

4. 词族索引

5. 检索表达式

6. 加权检索

二、简答:(每空8分,共8×5分)

1. 什么是索引语言?索引词表的规范化内容包括哪些方面?

2. 图示CA文摘、索引、附表之间的关系

3. 简述DIALOG系统的常用指令(至少八个)

4. 简述建立数据库对知识进行组织的三个层次

5. 简述联机检索的主要服务范围

三、论述:(每题15分数,共15×2分)

1. 论述主题词的性质

2. 论述联机检索和网络检索的差异

《信息检索》答案

一、名词: 1.检准率(P)检出的相关文献量(a) 检出文献总量(ab)

误检率(N)检出的无关文献量(b) 检出文献总量(ab)

2.双重上下文关键词索引(D-KWIC)在编排形式上,结合了KWIC和KWOC的特点,即先抽出文中的一个关键词(第一关键词)提行,作为索引标目,然后将剩余部分,

按其它关键词(第二关键词)轮排,在轮排条目中,第一关键词用*代替。

3. 按照一定的条例或标准,将一件文献区别于其它文献的外表特征(包括书名或篇名、著者或译者、出版事项,出处、文种等)、物质特征(包括文献类型、装帧形式、图表、页码等)乃至文献摘要一一加以描述并记载下来的工作称为文献著录。

4. 词族索引,也称族系索引或词族表,它是把字顺主题词表和附表中的具有属种关系、整体与部分关系和包含关系等主题词,按其学科本质属性展开全显示的一种词族系统。

5. 检索表达式是计算机检索中用来表达用户检索提问的逻辑表达式,由检索词和各种布尔逻辑算符、位置算符以及系统规定的其他组配连接符号组成。

6. 加权检索,是在检索时,给每个检索词以一个表示其重要度的数值(即所谓“权”),然后对含有这些检索词的文献进行加权计算,其和在规定的数值以上者,作为命中文献输出;权值的大小,表示被检出文献的切题程度。

二、简答:

1. 什么是索引语言?索引词表的规范化内容包括哪些方面?

 文献存贮时, 文献标识按照一定的语言加以描述,而进行检索时,情

报提问也按照相应的语言予以表达.这种把标引与检索联系起来,对概念进行规范化处理.使检索得以有效进行的语言就索引语言.

其规范化的范围主要有以下三种:

 第一,同义规范,是指对自然语言中的同义词.准同义词的规范.

 第二,词义规范,指对自然语言中多义词,同形异义词的规范.这种规

范主要是对主题词的概念作进一步说明, 以确保在标引和检索时正确运用.词义规范主要有以下三种形式:(1)范围注释.(2)含义注释.(3)观点注释.

 第三,词类规范,是指对主题词选词范围的一种控制.在自然语言中,

词的种类主要有二种:一种是实词,主要包括名词.动词.形容词.代词.数词.和量词等.一种是虚词,主要包括介词.联词.副词.助词等.作为文献检索用的语言词汇,必须具有实际意义,并能反映事物本质属性.因此,主题词的选词范围,一般应控制在实词之中,即名词或动名词.其它词,如形容词.数词.量词等应控制使用,而动词,代词和虚词应完全避免.

2. 图示CA文摘、索引、附表之间的关系

3. 简述DIALOG系统的常用指令

 BEGINn(或简写成Bn):开库指令。

 EXPAND(或简写成E):扩词指令。·

 SELECT(或S):基本查找指令。

 SELECT STEPS(或S STEPS;SS):分步骤查找指令(分步选词检索指令)。

 TYPE(或T)或者PRINT(PR):联机或脱机打印指令。

 SETFILES:选文档指令。

 REMOVE DUPLICATES(RD):去除重复记录指令。

 COMBINE(或C):逻辑组配指令。

 DISPLAY SETS(或DS):回溯检索步骤指令。

 SAVE:保存检索策略指令。·

 EXECUTE STEPS(或EXS):执行存储检索策略指令。

 SORT:排序指令。

 LOGOFFHOLD:暂时关机指令。

 LOGOFF:关机指令。

 EXPLAIN:解释指令。

4. 简述建立数据库对知识进行组织的三个层次。

 对知识进行第一个层次的组织,是单篇文献。一篇文献往往不止记载一个知识项,并且还记载知识得以取得的环境,条件和方法。有的既然有图表的说明,又有文字的叙述。在一篇文献中, 这些都有机地结合在一起,并以逻辑次序加以组织。因此情报用户有时只要获得一篇对口径的文献,就能从中查找,筛选出自己所需要的情报。

 对知识进行第二个层次的组织,是百科全书,大全,年鉴,手册,表之类的三次文献。这类文献对于知识的组织,所包含的知识项更多,可检性更强。

 对知识进行第三个层次的组织,是书目,索引,文摘之类的二次文献。它所包含的知识领域更宽,能使成千上万的文献通过题录,简介,摘要置于检索者的控制之下。

 上述对知识进行三个层次的组织,从而产生了检索系统的全文数据库,事实数据库与数值数据库,书目数据库。

5. 简述联机检索的主要服务范围

 追溯检索 (RS) 这种检索不仅能够查找最新信息资料,而且可以追溯查找数据库存储年限范围内的某一段时间之内的有关文献资料。

 定题服务 (SDI) 这是针对相对固定的用户课题提问要求,对新到的数据库文档进行检索并定期向用户提供所需信息资料的服务。

 联机订购原始文献 联机检索到的情报信息,大多数是二次文献。用户如果需要原始文献而在国内馆藏中又查不到时,可以通过联机终端向联机服务系统订购文献原文

 光盘检索服务 光盘检索也是一种联机检索。它不仅可以单独使用,还可以与远程联机检索系统连用。为了便于用户使用和推销产品,把光盘数据库结构、指令语言做成与远程联机检索系统一样

 电子邮件服务 大型联机信息系统,都设有电子邮件服务,允许用户发送电子信息到联机检索系统各部门和同一系统中的各个用户。联机系统的电子邮件既可将用户脱机打印的检索结果进行传送,又可以进行邮件快件发送。

三、论述:

1. 论述主题词的性质

 主题词的概念性,主题词是主题词表中表达一定概念的最小词汇单元,是自然语言中优选出的规范化词汇,这种词汇不仅反映着一定事物的概念,而且作为事物概念的表达形式而存在。

 主题词的规范性,主要是指对主题词概念的控制,使每一个主题词只能表达一个概念,即主题词的单一性。

 在文献的实际标引和检索过程中,多数主题都需要用两个或两个以上的主题词进行描述。因此,主题词语言是一种组配性语言。

 主题词的语义性,是指主题词之间(概念与概念)存在的含义上的相互关系。这种关系主要有同义关系、属分关系和相关关系。

 主题词语言是一种动态性的语言,随着事物不断发展变化和人们对客观世界认识的深入,不断增删修改,定期更新,以适应现代科学技术发展和文献检索的需要。

2. 论述联机检索和网络检索的差异

更应该引起重视的,是先进的网络技术应用于信息检索领域后,所造成的网络检索和联机检索的不同之处。联机和网络检索的根本差异在于它们使用的技术手段不同。

 1标引所依据的语言不同

联机检索系统采用叙词表等人工语言进行标引,这使它的发展受到人工

语言发展的影响,在利用人工语言进行检索的过程中,首先不可避免地会造成标引人员、检索人员和用户对标引词和检索词在理解上的误差,从而影响检索效率。其次,要掌握这种人工语言必须经过专业的培训,这使人工语言多年来一直只为专业信息中介机构采用;网络检索则从一开始就采用自然语言,它无疑更符合人们使用语言的习惯,从而解决了困扰情报界多年的一个

问题——对语言的理解问题。从某种意义上来说,网络检索的突飞猛进源于自然语言的一些显著优势。

 2系统界面设计不同

联机检索系统和网络检索系统由于面对的用户市场不同,在系统界面设计上也有很大差异。前者自产生起,就面对专业的信息检索机构,因此,一直使用非图形界面,这在一定程度上影响了联机检索的使用。网络检索系统因为面对的是普通用户,系统检索界面设计采用图形界面,非常友好,这对网络检索用户市场的迅速壮大是非常重要的。

 3信息组织方式不同

在传统的联机检索系统中,其数据库主要存储有关主题领域各类文献资料的书目信息。它以文档的形式按线性组织,文档的基本组成单位是记录。记录是作为一个单位来处理的有关数据的集合,它被划分为若干个字段,用于检索和显示。每个字段均有一个供计算机识别的字段标识符。在Internet上,基于Web的信息组织采用了超文本组织方式。

超文本系统数据库的特点主要表现在:首先是按照单元、片断、关系将知识存储;其次是用链路网将同一文献或不同文献的相关部分结构化地连接起来,这是传统的联机检索系统所无法实现的;再次是链路网能将语义相近的文献连接起来,用户还可以通过文献间的距离判断文献的重要程度。而且,超文本技术的引入,还使得信息的形式不仅仅局限于字符,而且还可以是声音、图像、动画或其他多媒体的形式。

郑州大学现代远程教育《信息检索》

真题 [2015版客观题]

一、名词:(每题5分,共5×6分)

1. 检全率与漏检率

2. D-KWIC

3. 文献著录

4. 词族索引

5. 检索表达式

6. 加权检索

二、简答:(每空8分,共8×5分)

1. 什么是索引语言?索引词表的规范化内容包括哪些方面?

2. 图示CA文摘、索引、附表之间的关系

3. 简述DIALOG系统的常用指令(至少八个)

4. 简述建立数据库对知识进行组织的三个层次

5. 简述联机检索的主要服务范围

三、论述:(每题15分数,共15×2分)

1. 论述主题词的性质

2. 论述联机检索和网络检索的差异

《信息检索》答案

一、名词: 1.检准率(P)检出的相关文献量(a) 检出文献总量(ab)

误检率(N)检出的无关文献量(b) 检出文献总量(ab)

2.双重上下文关键词索引(D-KWIC)在编排形式上,结合了KWIC和KWOC的特点,即先抽出文中的一个关键词(第一关键词)提行,作为索引标目,然后将剩余部分,

按其它关键词(第二关键词)轮排,在轮排条目中,第一关键词用*代替。

3. 按照一定的条例或标准,将一件文献区别于其它文献的外表特征(包括书名或篇名、著者或译者、出版事项,出处、文种等)、物质特征(包括文献类型、装帧形式、图表、页码等)乃至文献摘要一一加以描述并记载下来的工作称为文献著录。

4. 词族索引,也称族系索引或词族表,它是把字顺主题词表和附表中的具有属种关系、整体与部分关系和包含关系等主题词,按其学科本质属性展开全显示的一种词族系统。

5. 检索表达式是计算机检索中用来表达用户检索提问的逻辑表达式,由检索词和各种布尔逻辑算符、位置算符以及系统规定的其他组配连接符号组成。

6. 加权检索,是在检索时,给每个检索词以一个表示其重要度的数值(即所谓“权”),然后对含有这些检索词的文献进行加权计算,其和在规定的数值以上者,作为命中文献输出;权值的大小,表示被检出文献的切题程度。

二、简答:

1. 什么是索引语言?索引词表的规范化内容包括哪些方面?

 文献存贮时, 文献标识按照一定的语言加以描述,而进行检索时,情

报提问也按照相应的语言予以表达.这种把标引与检索联系起来,对概念进行规范化处理.使检索得以有效进行的语言就索引语言.

其规范化的范围主要有以下三种:

 第一,同义规范,是指对自然语言中的同义词.准同义词的规范.

 第二,词义规范,指对自然语言中多义词,同形异义词的规范.这种规

范主要是对主题词的概念作进一步说明, 以确保在标引和检索时正确运用.词义规范主要有以下三种形式:(1)范围注释.(2)含义注释.(3)观点注释.

 第三,词类规范,是指对主题词选词范围的一种控制.在自然语言中,

词的种类主要有二种:一种是实词,主要包括名词.动词.形容词.代词.数词.和量词等.一种是虚词,主要包括介词.联词.副词.助词等.作为文献检索用的语言词汇,必须具有实际意义,并能反映事物本质属性.因此,主题词的选词范围,一般应控制在实词之中,即名词或动名词.其它词,如形容词.数词.量词等应控制使用,而动词,代词和虚词应完全避免.

2. 图示CA文摘、索引、附表之间的关系

3. 简述DIALOG系统的常用指令

 BEGINn(或简写成Bn):开库指令。

 EXPAND(或简写成E):扩词指令。·

 SELECT(或S):基本查找指令。

 SELECT STEPS(或S STEPS;SS):分步骤查找指令(分步选词检索指令)。

 TYPE(或T)或者PRINT(PR):联机或脱机打印指令。

 SETFILES:选文档指令。

 REMOVE DUPLICATES(RD):去除重复记录指令。

 COMBINE(或C):逻辑组配指令。

 DISPLAY SETS(或DS):回溯检索步骤指令。

 SAVE:保存检索策略指令。·

 EXECUTE STEPS(或EXS):执行存储检索策略指令。

 SORT:排序指令。

 LOGOFFHOLD:暂时关机指令。

 LOGOFF:关机指令。

 EXPLAIN:解释指令。

4. 简述建立数据库对知识进行组织的三个层次。

 对知识进行第一个层次的组织,是单篇文献。一篇文献往往不止记载一个知识项,并且还记载知识得以取得的环境,条件和方法。有的既然有图表的说明,又有文字的叙述。在一篇文献中, 这些都有机地结合在一起,并以逻辑次序加以组织。因此情报用户有时只要获得一篇对口径的文献,就能从中查找,筛选出自己所需要的情报。

 对知识进行第二个层次的组织,是百科全书,大全,年鉴,手册,表之类的三次文献。这类文献对于知识的组织,所包含的知识项更多,可检性更强。

 对知识进行第三个层次的组织,是书目,索引,文摘之类的二次文献。它所包含的知识领域更宽,能使成千上万的文献通过题录,简介,摘要置于检索者的控制之下。

 上述对知识进行三个层次的组织,从而产生了检索系统的全文数据库,事实数据库与数值数据库,书目数据库。

5. 简述联机检索的主要服务范围

 追溯检索 (RS) 这种检索不仅能够查找最新信息资料,而且可以追溯查找数据库存储年限范围内的某一段时间之内的有关文献资料。

 定题服务 (SDI) 这是针对相对固定的用户课题提问要求,对新到的数据库文档进行检索并定期向用户提供所需信息资料的服务。

 联机订购原始文献 联机检索到的情报信息,大多数是二次文献。用户如果需要原始文献而在国内馆藏中又查不到时,可以通过联机终端向联机服务系统订购文献原文

 光盘检索服务 光盘检索也是一种联机检索。它不仅可以单独使用,还可以与远程联机检索系统连用。为了便于用户使用和推销产品,把光盘数据库结构、指令语言做成与远程联机检索系统一样

 电子邮件服务 大型联机信息系统,都设有电子邮件服务,允许用户发送电子信息到联机检索系统各部门和同一系统中的各个用户。联机系统的电子邮件既可将用户脱机打印的检索结果进行传送,又可以进行邮件快件发送。

三、论述:

1. 论述主题词的性质

 主题词的概念性,主题词是主题词表中表达一定概念的最小词汇单元,是自然语言中优选出的规范化词汇,这种词汇不仅反映着一定事物的概念,而且作为事物概念的表达形式而存在。

 主题词的规范性,主要是指对主题词概念的控制,使每一个主题词只能表达一个概念,即主题词的单一性。

 在文献的实际标引和检索过程中,多数主题都需要用两个或两个以上的主题词进行描述。因此,主题词语言是一种组配性语言。

 主题词的语义性,是指主题词之间(概念与概念)存在的含义上的相互关系。这种关系主要有同义关系、属分关系和相关关系。

 主题词语言是一种动态性的语言,随着事物不断发展变化和人们对客观世界认识的深入,不断增删修改,定期更新,以适应现代科学技术发展和文献检索的需要。

2. 论述联机检索和网络检索的差异

更应该引起重视的,是先进的网络技术应用于信息检索领域后,所造成的网络检索和联机检索的不同之处。联机和网络检索的根本差异在于它们使用的技术手段不同。

 1标引所依据的语言不同

联机检索系统采用叙词表等人工语言进行标引,这使它的发展受到人工

语言发展的影响,在利用人工语言进行检索的过程中,首先不可避免地会造成标引人员、检索人员和用户对标引词和检索词在理解上的误差,从而影响检索效率。其次,要掌握这种人工语言必须经过专业的培训,这使人工语言多年来一直只为专业信息中介机构采用;网络检索则从一开始就采用自然语言,它无疑更符合人们使用语言的习惯,从而解决了困扰情报界多年的一个

问题——对语言的理解问题。从某种意义上来说,网络检索的突飞猛进源于自然语言的一些显著优势。

 2系统界面设计不同

联机检索系统和网络检索系统由于面对的用户市场不同,在系统界面设计上也有很大差异。前者自产生起,就面对专业的信息检索机构,因此,一直使用非图形界面,这在一定程度上影响了联机检索的使用。网络检索系统因为面对的是普通用户,系统检索界面设计采用图形界面,非常友好,这对网络检索用户市场的迅速壮大是非常重要的。

 3信息组织方式不同

在传统的联机检索系统中,其数据库主要存储有关主题领域各类文献资料的书目信息。它以文档的形式按线性组织,文档的基本组成单位是记录。记录是作为一个单位来处理的有关数据的集合,它被划分为若干个字段,用于检索和显示。每个字段均有一个供计算机识别的字段标识符。在Internet上,基于Web的信息组织采用了超文本组织方式。

超文本系统数据库的特点主要表现在:首先是按照单元、片断、关系将知识存储;其次是用链路网将同一文献或不同文献的相关部分结构化地连接起来,这是传统的联机检索系统所无法实现的;再次是链路网能将语义相近的文献连接起来,用户还可以通过文献间的距离判断文献的重要程度。而且,超文本技术的引入,还使得信息的形式不仅仅局限于字符,而且还可以是声音、图像、动画或其他多媒体的形式。


    相关文章

    信息检索报告1

    一.实习内容:网络信息资源检索 二.实习目的:了解网络信息资源的类型及特点:掌握常用中外搜索引擎的使用方法. 三.实习要求: 1)了解网络信息资源的类型及特点. 2)掌握百度检索规则及基本检索.高级检索.限定字段检索及特色功能的使用方法. ...

    大学生信息检索技术素质培养论文

    大学生地理文献选读论文 大学生信息检索技术素质培养论文 姓名:程静 班级: 11级地理科学2班 学号: [1**********] 学院:环境科学与旅游学院 指导老师:吴旭东博士 大学生信息检索技术素质培养论文 作者:程静 摘要:本文从分析 ...

    [市场营销学]课程论文(7)

    兰州大学网络教育学院 2015年3月课程考试<信息检索与利用>论文卷纸 要求: 1.满分100分. 2.论文字数在1500字以上.无错别字. 3. 抄袭.不按规定题目写作的论文以"0"分记. 4. 有明确.具 ...

    医学文献检索课教学的思考

    · 58·<中国病案>2011年第12卷第5期 医学文献检索课教学的思考 100142 北京市 空军总医院信息科 张向阳 陈 敏 张 凌* 摘要 目的通过对医学文献检索课的教学分析, 提高对文献检索课重要性的认识.方法采用归纳总 ...

    综合报告格式

    <现代信息查询与利用>综合报告格式 课题名称:大学生心理健康教育研究 一.需求分析 (1)课题背景(即研究意义.研究现状.存在问题.拟解决的问题等) 1)研究意义:在经济转轨.社会转型.竞争加剧的大背景下,高校大学生心理健康教育 ...

    第二节信息检索的重要意义

    第 二 节 信息检索的重要意义 本节重点:信息检索与高校图书馆 主要内容:信息检索的重要性及高校图书馆功能 授课目的:使学生明确图书馆在信息社会的重要作用 信息社会给人们带来了浩如烟海的信息,令人们享受不尽,同时也感到无所适从.如何从滚滚泛 ...

    浅议高校"文献检索课"的搜索引擎教学

    摘要:高校的"文献检索课"是一种快速变化的课程,从印刷型检索到利用计算机联机以及对互联网资源的检索,应与变化了的大环境保持一致.网络信息资源日臻丰富,给高校的"文献检索课"带来了新的内涵,掌握一种新的 ...

    西安外国语大学

    华侨大学 西安外国语大学 经济学 专业代码 020101 点击查看开设该专业的学校 业务培养目标 本专业培养具备比较扎实的马克思主义经济学理论基础,熟悉现代西方经济学理论,比较熟练地掌握现代经济分析方法,知识面较宽,具有向经济学相关领域扩展 ...

    大学生信息素质教育2

    大学生信息素质教育 西安航空学院.液压1519班.王欢.学号:[1**********]43 摘 要 :信息素质教育应该是大学生素质教育的重要组成部分.本文阐述了信息素养的概念和内涵,分析了我国大学生信息素养的现状,对大学生信息素养教育提出 ...