互联网信息检索原理

互联网信息检索原理

1.从信息利用的角度考察,互联网信息资源由哪三方面构成?答:从信息利用的角度考察,互联网信息资源由连接在网上的计算机中的无数信息、网上的各种信息工具以及网络通信渠道三方面构成。

2.简述网络信息资源的特点。答:网络信息资源的特点是数量庞大、增长迅速;更新频繁、变化无常、分布散乱;良莠混杂。

3.如何正确认识网络信息与印刷性出版物在出版类型上的对应关系?按照出版类型区分,网络信息资源有着和印刷型出版物类似的对应关系。例如,印刷型的期刊有网络期刊与其相对应,印刷型的图书有网络图书与其相对应,印刷型的报告有网络报告与其相对应,如此等等。这种对应关系,仅限于我们对网络文献信息类型的认识,不能应用于具体的文献。例如,早期的印刷型文献一般不会有网络形式,多数的当前印刷型学术文献也不太可能找到对应的网上电子版本。

4.何谓原创性网络信息和二次网络信息?按照内容是否具有原创性,网络信息资源有一次资源和二次资源的区分。一次资源是指首次发表的原创性信息,二次资源是转载已有的信息。

5.何谓可见网络信息和不可见网络信息?按照是否属于搜索引擎检索范围,网络信息资源可分为可见资源和不可见资源两类。

6.简述网络可见信息的两个条件。可见资源是搜索引擎可搜索到的资源。这种资源要满足两个条件:一是必须含有HTML超链接,二是没有设置口令,

7.简述网站和网页的关系。网页是用HTML或DHTML、XML等语言写成的文本文件。而网站则是有独立的域名,由若干相关网页组成的一个站点。按照微软公司的比喻,如果把WWW当作是Internet上的大型图书馆,则每个Web站点就是一本书,每个Web页面就是书的一页。

8.为什么说网络学术信息不能唾手可得?原因主要有三:一是查找主页信息通常要通过查找搜索引擎之类的中介数据库才能进行。而使用这些工具需要一些专门的技术,希望高效率地查找网络信息时尤其如此。二是一般情况下只使用一两种搜索引擎所得的结果往往是沧海一粟。三是互联网上学术类与非学术类信息的比例是1﹕10。再则,网上学术信息很多是以不可见资源形式存在着。因此查找网上信息的难度更大一些。9.按工作方式区分的搜索引擎有哪三类搜索引擎?按照工作方式的不同,搜索引擎可以分为主题引擎、目录引擎和多元引擎。

10.简述主题引擎的三个组成部分。主题引擎由三个主要部分构成:Robot、Index和搜索软件。

11.请举出典型的国外和国内主题引擎各一个。国外主题引擎的代表是Google,国内代表为百度。

12.为什么主题引擎的分类途径不如目录指南型引擎?主题搜索引擎提供的分类途径或者为自动分类的结果,或是借用其他目录引擎的分类数据(例如Google利用网景公司的Open Directory分类),因而分类检索效果不如由人工仔细分类的目录指南型搜索引擎。

13.简述主题引擎与目录指南型引擎的主要区别。(1)信息处理深度,目录指南型引擎为网站,主题型引擎为网页;(2)信息处理方式,目录指南型引擎为有人工参与,主题型引擎为全自动化;(3)信息的质量和数量,目录指南型引擎质量上相对较高,主题型引擎数量上相对较多。

14.为什么目录指南型引擎的主题查找效果不如主题型引擎?目录指南型引擎的主题检索只在对站点人工描述语言中进行,查找范围有限,所得结果通常是分类类名和网站名称,结果数量远不如主题引擎。

15.举出国内外目录指南型引擎典型代表各一个。目录引擎的国外代表是Yahoo!,国内代表有新浪网。

16.什么是多元搜索引擎?简述其工作原理。多元引擎是一种起检索中介作用的搜索引擎。多元引擎本身没有存放网页信息的数据库。当用户查询一个关键词时,它把查询请求转换成其他数个搜索引擎能够接受的命令格式,并行地或者有选择性地访问这些搜索引擎并查询这个关键词,处理这些搜索引擎返回的结果,然后再返回给用户。

17.举出国内外多元引擎典型代表各一个。国外多元搜索引擎的代表是Dogpile,国内的代表是万纬等。

18.简述中外问搜索引擎的主要区别。中文引擎可以使用英语等外文查找信息,外文引擎也可以使用中文;因而这两种引擎的区别不在于使用的语言,而在于收集和处理信息的侧重点。中文引擎主要收集和处理的信息是中文网页,查找中文资料的效果通常胜过外文引擎。反之,如果需要查找英文信息,直接使用境外英文引擎效果更好。

19.百度引擎的网页快照可以起什么作用?百度服务器通过程序收集网页时,在缓存器中保留了网页备份。“网页快照”即是网页备份的链接。当点击检索结果标题没有结果时,“网页快照”可以用于帮助获取某些“消失”了的网页信息。

20.分别给出百度引擎限制于URL字段、标题字段和网站字段的检索命令。他们分别是inurl, intitle和site.

21.简述百度引擎的三种逻辑运算符。逻辑与为空格,逻辑或为“|”,逻辑非为“ -”.

22.什么是虚拟图书馆?虚拟图书馆是一种网络信息利用工具。它针对某一学科或领域的研究者的需要,将互联网上与之有关的各种资源线索,包括与该学科或领域有关的研究机构、实验室、电子书籍、学术期刊、会议论坛、专家学者等的URL,进行系统地收集、核实并加以组织,以网站、网页或数据库形式提供给用户浏览或者检索。

23.简述使用虚拟图书馆的场合。使用虚拟图书馆查找信息的场合为:当时间短促,不允许浏览由搜索引擎查得的巨量的信息时;当希望看到比较可靠的网络信息;当希望对某个领域有个整体的、较全面的了解时。

23.能否以网上信息资源完全代替印刷型文献。哪一些文献的全文更适合从网上获得?目前,网上信息资源不能完全代替印刷型文献,尤其是学术型文献。近几年的国内学术期刊文献、部分国外学术期刊文献和部分专利文献,比较适合于通过网络获取。

24.通过搜索引擎获得的未经审查的各种非正式出版物称为什么文献?通过搜索引擎获得的未经审查的各种非正式出版物称为灰色文献。

互联网信息检索原理

1.从信息利用的角度考察,互联网信息资源由哪三方面构成?答:从信息利用的角度考察,互联网信息资源由连接在网上的计算机中的无数信息、网上的各种信息工具以及网络通信渠道三方面构成。

2.简述网络信息资源的特点。答:网络信息资源的特点是数量庞大、增长迅速;更新频繁、变化无常、分布散乱;良莠混杂。

3.如何正确认识网络信息与印刷性出版物在出版类型上的对应关系?按照出版类型区分,网络信息资源有着和印刷型出版物类似的对应关系。例如,印刷型的期刊有网络期刊与其相对应,印刷型的图书有网络图书与其相对应,印刷型的报告有网络报告与其相对应,如此等等。这种对应关系,仅限于我们对网络文献信息类型的认识,不能应用于具体的文献。例如,早期的印刷型文献一般不会有网络形式,多数的当前印刷型学术文献也不太可能找到对应的网上电子版本。

4.何谓原创性网络信息和二次网络信息?按照内容是否具有原创性,网络信息资源有一次资源和二次资源的区分。一次资源是指首次发表的原创性信息,二次资源是转载已有的信息。

5.何谓可见网络信息和不可见网络信息?按照是否属于搜索引擎检索范围,网络信息资源可分为可见资源和不可见资源两类。

6.简述网络可见信息的两个条件。可见资源是搜索引擎可搜索到的资源。这种资源要满足两个条件:一是必须含有HTML超链接,二是没有设置口令,

7.简述网站和网页的关系。网页是用HTML或DHTML、XML等语言写成的文本文件。而网站则是有独立的域名,由若干相关网页组成的一个站点。按照微软公司的比喻,如果把WWW当作是Internet上的大型图书馆,则每个Web站点就是一本书,每个Web页面就是书的一页。

8.为什么说网络学术信息不能唾手可得?原因主要有三:一是查找主页信息通常要通过查找搜索引擎之类的中介数据库才能进行。而使用这些工具需要一些专门的技术,希望高效率地查找网络信息时尤其如此。二是一般情况下只使用一两种搜索引擎所得的结果往往是沧海一粟。三是互联网上学术类与非学术类信息的比例是1﹕10。再则,网上学术信息很多是以不可见资源形式存在着。因此查找网上信息的难度更大一些。9.按工作方式区分的搜索引擎有哪三类搜索引擎?按照工作方式的不同,搜索引擎可以分为主题引擎、目录引擎和多元引擎。

10.简述主题引擎的三个组成部分。主题引擎由三个主要部分构成:Robot、Index和搜索软件。

11.请举出典型的国外和国内主题引擎各一个。国外主题引擎的代表是Google,国内代表为百度。

12.为什么主题引擎的分类途径不如目录指南型引擎?主题搜索引擎提供的分类途径或者为自动分类的结果,或是借用其他目录引擎的分类数据(例如Google利用网景公司的Open Directory分类),因而分类检索效果不如由人工仔细分类的目录指南型搜索引擎。

13.简述主题引擎与目录指南型引擎的主要区别。(1)信息处理深度,目录指南型引擎为网站,主题型引擎为网页;(2)信息处理方式,目录指南型引擎为有人工参与,主题型引擎为全自动化;(3)信息的质量和数量,目录指南型引擎质量上相对较高,主题型引擎数量上相对较多。

14.为什么目录指南型引擎的主题查找效果不如主题型引擎?目录指南型引擎的主题检索只在对站点人工描述语言中进行,查找范围有限,所得结果通常是分类类名和网站名称,结果数量远不如主题引擎。

15.举出国内外目录指南型引擎典型代表各一个。目录引擎的国外代表是Yahoo!,国内代表有新浪网。

16.什么是多元搜索引擎?简述其工作原理。多元引擎是一种起检索中介作用的搜索引擎。多元引擎本身没有存放网页信息的数据库。当用户查询一个关键词时,它把查询请求转换成其他数个搜索引擎能够接受的命令格式,并行地或者有选择性地访问这些搜索引擎并查询这个关键词,处理这些搜索引擎返回的结果,然后再返回给用户。

17.举出国内外多元引擎典型代表各一个。国外多元搜索引擎的代表是Dogpile,国内的代表是万纬等。

18.简述中外问搜索引擎的主要区别。中文引擎可以使用英语等外文查找信息,外文引擎也可以使用中文;因而这两种引擎的区别不在于使用的语言,而在于收集和处理信息的侧重点。中文引擎主要收集和处理的信息是中文网页,查找中文资料的效果通常胜过外文引擎。反之,如果需要查找英文信息,直接使用境外英文引擎效果更好。

19.百度引擎的网页快照可以起什么作用?百度服务器通过程序收集网页时,在缓存器中保留了网页备份。“网页快照”即是网页备份的链接。当点击检索结果标题没有结果时,“网页快照”可以用于帮助获取某些“消失”了的网页信息。

20.分别给出百度引擎限制于URL字段、标题字段和网站字段的检索命令。他们分别是inurl, intitle和site.

21.简述百度引擎的三种逻辑运算符。逻辑与为空格,逻辑或为“|”,逻辑非为“ -”.

22.什么是虚拟图书馆?虚拟图书馆是一种网络信息利用工具。它针对某一学科或领域的研究者的需要,将互联网上与之有关的各种资源线索,包括与该学科或领域有关的研究机构、实验室、电子书籍、学术期刊、会议论坛、专家学者等的URL,进行系统地收集、核实并加以组织,以网站、网页或数据库形式提供给用户浏览或者检索。

23.简述使用虚拟图书馆的场合。使用虚拟图书馆查找信息的场合为:当时间短促,不允许浏览由搜索引擎查得的巨量的信息时;当希望看到比较可靠的网络信息;当希望对某个领域有个整体的、较全面的了解时。

23.能否以网上信息资源完全代替印刷型文献。哪一些文献的全文更适合从网上获得?目前,网上信息资源不能完全代替印刷型文献,尤其是学术型文献。近几年的国内学术期刊文献、部分国外学术期刊文献和部分专利文献,比较适合于通过网络获取。

24.通过搜索引擎获得的未经审查的各种非正式出版物称为什么文献?通过搜索引擎获得的未经审查的各种非正式出版物称为灰色文献。


    相关文章

    信息组织与管理

    结课大作业 信息组织与管理 学 学 专 生生业姓学班名 号 级 汪厚连 08580101 08信息管理1班 管理工程系 2011年6月7日 目录 1 根据第三章,分别用800字.500字.200字和120字概括第三章内容 ......... ...

    网络技术应用

    网络技术应用 教材分析 第1节 因特网应用 概述 本模块是高中信息技术课程的五个选修模块之一. [下一节] 网络是信息技术应用发展的热点.网络技术应用遍及现代社会各行各业,成为应用广泛.与社会与生活关系密切的技术领域.通过本模块的学习,将使 ...

    人工智能技术在搜索引擎中的应用

    人工智能技术在搜索引擎中的应用 [摘要] 文章介绍了搜索引擎的分类.工作原理以及体系结构.并且基于人工智能技术,对搜索引擎中运用的人工智能技术进行了研究和分析.描述了搜索引擎发展的智能化方向与方法,对智能型搜索引擎所面临的挑战以及未来发展进 ...

    网络营销基础与实践读书笔记---常用网络营销工具和方法

    2011年5月12日 星期四 <第二章 网络营销的常用工具和方法> 网络营销信息传递原则之一是建立尽可能多的网络营销信息传递渠道,因此,就需要借助各种有效的营销工具.网络营销的各种职能也是通过各种营销方法来实现的,所以,网络营销 ...

    搜索技术在人工智能领域的实际应用

    搜索技术在人工智能领域的实际应用 摘要:介绍了搜索引擎的分类.工作原理,并具体分析了搜索引擎的体系结构,包括信息的搜集系统.索引系统以及查询接口.基于现在人工智能技术的迅速发展,对于在搜索引擎中运用的人工智能技术进行了研究,且着重分析了搜索 ...

    虚拟现实期末论文

    2015-2016学年第1学期期末考试 论文 考试科目:虚拟现实原理与技术 学院:信息与通信工程学院 专业: 班级: 班内序号: 学号: 姓名: 手机 任课教师: 北京邮电大学 时间:2016年1月12日 虚拟现实原理与技术的简单探索 张克 ...

    信息检索题库

    第一章 计算机网络基础知识 一.填空 1. 是计算机网络技术发展中 的一个里程碑,它的研究成果对促进网络技术发展具有重要作用,并为Internet的形成奠定了基础. 网 C ) 电 话 线 D)光纤 7.网络协议的三个要素:语法.语义和 ( ...

    现代教育技术重点

    第一章 现代教育技术概述 1.教育技术AECT定义:教育技术是设计.开发.利用.管理和评价学习过程和学习资源的理论与实践. 2.教育技术名称的演变:视觉教育.视听教育.视听传播.教育技术 3.师范生学习教育技术的主要内容:现代教学设计理论与 ...

    电子商务模拟软件实验教学大纲

    电子商务模拟软件实验教学大纲 目 录 实验教学大纲 .............................................................................................. ...