网络信息检索论文
“狂傲天下”通过精心收集,向本站投稿了10篇网络信息检索论文,下面小编给大家整理后的网络信息检索论文,欢迎阅读!
篇1:网络信息检索论文
关于网络信息检索论文
浅谈网络信息检索的现状及其发展趋势
【摘要】随着计算机技术及网络技术的发展,网络信息检索显得越发重要。本文主要综述了网络信息检索的全文数据库、搜索引擎、互联网“超链接”等现行检索模式及它的智能化、一站式化、可视化等发展趋势。
【关键词】网络信息检索;现状;发展趋势
1、信息检索概述
信息检索(Information Retrieval)是指将信息按照一定的方式组织和存储起来,并能根据信息用户的需要指出其中相关信息的过程,因此它的全称叫“信息存储与检索”。
随着互联网的发展,人类社会的信息化、网络化进程大大加快。当今出现的一系列新型检索模式,包括网络信息规范控制标准等为网络检索技术的未来展现了新希望,与之相适应的信息检索的交流平台也迅速转移到以WWW为核心的网络应用环境中,信息检索步入网络化时代,网络信息检索已基本取代了手工检索。
2、网络信息检索的现状
对大多数读者而言,检索并不意味着发现,而是获得。人们希望不仅仅是提供宽泛的检索结果,而应该是计算机能试图理解用户提问的意图,并对检索结果进行适当的分类和排序。但是,现有的搜索引擎大多是基于简单的关键词匹配,不能真正理解用户的检索意图;各个搜索引擎的信息搜集和索引建立有很大的不同,每个搜索引擎平均只能涉及到整个网上资源的30%~50%,而其中真正有用的信息也只占很小的比例,这就意味着使用任何一个搜索引擎都只能检索到网络中的部分资源。目前网络检索面临一系列的挑战,网络信息量迅猛增加,人工已经无法对它们进行有效的分类、索引和利用;简单的关键词搜索,返回的信息量过大,已经让用户无法承担;网络信息组织的无序性;信息有用性评价困难;网络信息日新月异的更变;信息媒体的多样化;带宽等其它因素的制约,这些都给因特网信息的获取造成了极大的阻碍。这样就造成了要求智能化、专业化、多元化、多媒体化的网络信息检索工具出现的呼声越来越高,并且有更多的人参与到其中来。如此种种,给当今的网络信息检索研究带来了发展机遇,也给了它无限的发展空间。
3、网络信息检索的现行模式
3.1 网络全文数据库检索
网络全文数据库是以全文数据为数据库对象,并在网上提供全文检索服务的数据库。按数据库的生产机构分类,可分为出版商全文期刊数据库和生产商全文期刊数据库。前者主要是那些期刊出版单位在其出版的印刷期刊基础上建立的网络电子期刊全文数据库。而后者则是由数据库生产商根据一定的主题或一定的收录范围整合一定数量的期刊出版物而产生的全文数据库。国内全文数据库主要有中国学术期刊全文数据库。
3.2 网络搜索引擎检索
搜索引擎是一个专门的系统,它可以对互联网信息资源进行搜索整理和分类,并将其储存在网络数据库中供用户查询。搜索引擎包括搜集信息、分类和用户查询等三大部分。目前流行的搜索引擎有两大类:关键词全文检索式搜索引擎和分类目录式搜索引擎。
关键词全文检索式搜索引擎主要利用其内部的搜索机器人和蜘蛛程序,自动搜索来自互联网上的各种内容,在每一个关键词和所有相关的网页之间按照网页相关性原理建立一个对应关系,储存在其网络服务器的数据库中。用户只要输入关键词就可以找到符合该关键词特征的所有被索引的网页,搜索结果以超链接的方式列表,搜索结果有简单介绍,用户点击相应的链接就可以进入相应的网络资源网站,从而找到所需信息。用这种方式搜索到的结果通常数以百万计,但是相关性越高的信息,在搜索结果列表中的位置越靠前。分类目录式搜索引擎将互联网信息按照一定的标准进行收集和分类,并编入相应目录,以层级和逐次分项的方式管理目录,查找信息可以按照分类目录一层层进入,最终找到所要的信息。
3.3 互联网“超链接”搜索
Web信息以超文本链接方式组织,基本组织单元是信息节点而不是字符串,信息节点之间通过链接进行联系。超链接是网页必不可少的一个元素,同一主题或相关的信息因超链接构成了信息网。超文本信息检索技术,以超文本信息节点之间的多种链接关系为基础,根据思维联想或查找信息的需要,通过链接从一个信息节点转到另一个信息节点。
4、网络信息检索的未来发展趋势
网络技术的发展,给网络信息检索及信息的'网络化带来的极大的便利,进一步推动了网络信息检索理论和技术的快速发展。怎样为网络用户提供高质量、高效率的检索方式是网络信息检索研究者的努力方向。信息检索的对象已从传统的文本信息扩展到如今开放、动态、分布广泛的多媒体信息。那么,网络信息检索的发展趋势如何呢?
4.1 智能化信息检索
智能化信息检索是基于自然语言处理的检索形式。检索工具是对用户提供的以自然语言表达的检索要求进行分析,从而形成检索策略进行检索。检索工具智能化的内涵在于检索工具具有学习、分析、辨别和推理的能力。近年来,因特网上不断涌现的人工智能产品,如智能搜索引擎、智能浏览器、智能代理等,它们将提高网络信息检索的智能化程度,促进智能信息检索的发展。
网络中的智能代理通常是一个专家系统、一个过程、一个模块或一个求解单元。智能代理可以获得用户的信息需求,自动检索信息和推送检索结果信息。多智能代理系统还具有信息发现、信息筛选、信息推送和信息导航功能,可满足专业研究人员的特定需求,实现网络信息检索与服务的智能化。
4.2 一站式信息检索
一站式(One Stop)信息检索是指用户通过一个检索工具能满足自己所有的信息检索需求。一站式信息检索将是网络信息检索服务的一种发展模式。一站式检索服务是人性化服务的重要体现,它将大量节约用户的检索时间。全球最大的搜索引擎Google正在朝着一站式服务的方向发展。12月,Google宣布与纽约公共图书馆和包括哈佛大学图书馆在内的4个主要图书馆合作,将这些图书馆的大约1500万册藏书扫描进自己的数据主库以提供网络用户检索。目前,Google已经为其用户提供了某种程度上的一站式的检索服务了。而其他越来越多的检索服务提供商将向一站式检索方向发展。
4.3 可视化
可视化指的是运用计算机图形学和图像处理技术,将数据转换为图形或图像在屏幕上显示出来,并进行交互处理的理论、方法和技术。据统计,获取信息有70%~80%靠视觉,20%靠听觉,10%靠触觉。用图像取代文字帮助人们检索的优点在于:图像的表达更生动、结束语形象、准确,效率更高,具有交互性、多维性、可视性等特点,可以大大加快检索速度,使时刻都在产生的海量数据得到有效利用。
4.4 商业化
目前网络信息检索系统已成为新的投资热点,网络信息检索系统不再仅仅是一种检索工具,而且是一种商业产品。10月,全球最大的中文搜索引擎提供商百度联合新浪等多家中文门户网站,共同推广“搜索引擎竞价排名”全新网络商业服务模式。网络信息检索的商业化还体现在联机和光盘检索逐渐进入网络环境。由于目前网络信息检索的检准率低,联网的收费联机和光盘检索依旧受到青睐,如世界著名的联机信息系统DIALOG、OCLC、EBSCO、Silverplatter,国内的万方数据资源系统、中国学术期刊光盘、重庆维普公司系列光盘等都纷纷在网上设立自己的网络检索入口。许多著名科技期刊的上网丰富了网络资源,它们大多数都是在提供印刷版的同时提供期刊的网上服务,包括收费检索。
5、小结
在的网络信息资源中寻找自己所需要的信息资源是一件极具挑战性的工作。为此,许多信息专家正在积极地研究探索,并且取得了不少成果。我们相信随着科学技术的进步,网络信息检索发展会越来越快,人们所利用的检索工具和手段的更替会更加频繁。
参考文献
[1]黄静.网络信息检索发展方向展望[J].Journal of Library and Information Sciences in Agriculture,(1):15-19.
[2]霍小梅,王小兰.网络信息检索的现状及发展趋势[J].图书馆论坛,(4):180-182.
[3]戴莉.网络信息检索的发展趋势[J].情报探索,(2):52-54.
[4]徐谦.网络信息检索的智能化趋势[J].图书馆理论与实践,(2):63-65.
[5]谢新洲.网络信息检索技术与案例[M].北京:北京图书馆出版社,2005:9.
[6]易向军.网络信息检索现状及未来[J].合肥学院学报, (7):90-92.
篇2:网络信息检索服务与分析论文
网络信息检索服务与分析论文
随着网络应用的不断普及,网络已经成为人们获取信息的重要场所。在对新的检索工具和检索技术进行探索和研究的过程中,应克服当下网络信息检索给我们带来的困难,加强对不同需求进行信息搜集和发送的智能化服务功能。
1、网络环境下信息检索的特点
1.1数据量巨大。
在网络环境下,数据量大的惊人。大数据量会导致一些难以预料的软件异常,流量也会难以控制,对各个环节的策略和算法选择将会更加复杂。
1.2多用户服务。
多用户模式的信息检索服务必须注重快速反应,注重对并发访问的支持,对公共数据的共享,对临时工作数据的清理等。如果要针对不同用户开展不同服务,就要获取并管理不同用户的个性化需求,使大量的信息通过不同的渠道,主动送到用户的手上。
1.3用户层次复杂。
网络环境下信息检索服务的用户中,大多数都不是专业用户,他们的层次区别较难,拥有不同的操作技能和操作知识,面对这些非专业的用户,将更加需要人性化的引导式信息服务。
2、智能化信息检索的含义
智能化信息检索是在信息检索的基础上提出来的,它是以用户为中心的信息检索技术,为不同用户提供不同的服务,并满足同一用户在不同时期的需求,通过收集和分析用户信息来学习用户的兴趣和行为,并综合利用这些用户信息,提高信息检索系统的性能,满足用户的个体信息需求。在具体实现过程中主要是通过观察和分析用户的搜索行为,从中识别出用户对信息需求的偏好,并且能够根据用户对搜索结果的评价,自觉地调整搜索策略,使得对于不同的检索请求,不同用户都能够得到最贴近自己需要的信息服务。
3、信息检索服务的主体技术
网络信息检索通常采用搜索引擎技术,该技术是为了解决“信息迷航”问题而提出的'。它通过相应的算法在互联网上搜索相关信息,并对信息进行组织和处理,从而为用户提供信息导航。
现阶段,网络搜索引擎有很多,用户比较常用的有google、有道、百度等等,这些搜索引擎能进行网络信息检索、信息过滤、个性化信息服务定制等比较有特色的服务,但是并没有实现真正意义上的智能化检索。在实际使用过程中,用户想要的不仅仅是有用的信息,他们更希望做信息消费的主人,使信息的搜索可以在一个相对主动的环境中进行。
4、智能信息索引的相关技术
要实现真正意义上的以自我为中心的检索服务就需要以下的相关技术进行支撑。
4.1智能代理技术。
智能代理又可以称之为智能体,它是在用户没有明确具体要求的情况下,根据用户需要,代替用户进行各种复杂的工作,如信息检索、筛选及整理,并能推测用户的意图,自动制定、调整和执行工作计划。
智能代理首先要建立个性化的数据库,在数据库中建立用户基本信息表(包括用户编号、用户名、姓名、年龄、性别等字段)、用户职业信息表(包括职业编号、职业类型、等级、职称等字段)和用户兴趣信息表(包括兴趣编号、兴趣类别、程度等字段),用来详细描述用户的个人情况,其中第一个字段可以设置成关键字。
然后建立用户检索策略表(包括策略编号、策略控制、检索词控制、检索时间控制、检索范围控制等字段)和用户检索评价表(包括检索编号、检索时间、检索词、检索结果数量、查全率、查准率等字段),同样的,第一个字段设置成关键字。检索策略表主要是给用户模型的检索定义一个比较完整的检索策略,检索评价表主要是对用户检索的满意度作一个简单的评价描述。
有了用户个性化数据库,一方面,在服务器端吸收智能代理技术的思想,引入个性化服务的理念,引入用户反馈机制来完善检索机制、提高检索命中率,同时也可提供面向个人的特殊检索服务。另一方面,信息检索用到智能代理主要集成在客户端,配合用户兴趣完成搜索,它会对用户信息需求、偏好进行区别、归纳、总结,分析用户的兴趣爱好,并借助学习的规则,自动、独立地代理用户查找用户感兴趣的信息。
4.2用户兴趣挖掘技术。
实现信息检索服务最重要的就是对用户的喜好和习惯进行分析,日前,通常使用两种方法:其一是通过用户主动提供自己的兴趣来得到用户的个性化向量;其二是在用户没有明确参与的情况下,系统通过观察用户行为来得到用户的兴趣,从而得到用户的个性化向量。使用第一种方法,可以选择下面两种方式:一是用户将自己感兴趣的信息类或在线文档分类后提供给系统,系统从这些文档或信息类中发现用户的兴趣;二是用户提供自己的研究方向和其它阅读爱好等信息,系统从这些信息中发现用户的兴趣。但是,由于用户的兴趣并不是一成不变的,而用户一般不可能提供所有的兴趣以及感兴趣的程度,因此还需要使用第一种方式进行补充。使用第二种方法是根据用户对推送页面的评价信息来更新用户的个性化向量。
5、结束语
智能化信息检索技术现在已经成为一项被广泛研究的领域,它需要多种技术相支持,我们虽取得一些成绩,但是道路还很漫长,真正实现信息搜索的智能化服务,还有待代理技术的智能性、主动性、自主性等得到进一步的提高。
篇3:信息检索论文
【摘要】随着计算机技术及网络技术的发展,网络信息检索显得越发重要。
本文主要综述了网络信息检索的全文数据库、搜索引擎、互联网“超链接”等现行检索模式及它的智能化、一站式化、可视化等发展趋势。
【关键词】网络信息检索;现状;发展趋势
1.信息检索概述
信息检索(Information Retrieval)是指将信息按照一定的方式组织和存储起来,并能根据信息用户的需要指出其中相关信息的过程,因此它的全称叫“信息存储与检索”。
随着互联网的发展,人类社会的信息化、网络化进程大大加快。
当今出现的一系列新型检索模式,包括网络信息规范控制标准等为网络检索技术的未来展现了新希望,与之相适应的信息检索的交流平台也迅速转移到以为核心的网络应用环境中,信息检索步入网络化时代,网络信息检索已基本取代了手工检索。
2.网络信息检索的现状
对大多数读者而言,检索并不意味着发现,而是获得。
人们希望不仅仅是提供宽泛的检索结果,而应该是计算机能试图理解用户提问的意图,并对检索结果进行适当的分类和排序。
但是,现有的搜索引擎大多是基于简单的关键词匹配,不能真正理解用户的检索意图;各个搜索引擎的信息搜集和索引建立有很大的不同,每个搜索引擎平均只能涉及到整个网上资源的30%~50%,而其中真正有用的信息也只占很小的比例,这就意味着使用任何一个搜索引擎都只能检索到网络中的部分资源。
目前网络检索面临一系列的挑战,网络信息量迅猛增加,人工已经无法对它们进行有效的分类、索引和利用;简单的关键词搜索,返回的信息量过大,已经让用户无法承担;网络信息组织的无序性;信息有用性评价困难;网络信息日新月异的更变;信息媒体的多样化;带宽等其它因素的制约,这些都给因特网信息的获取造成了极大的阻碍。
这样就造成了要求智能化、专业化、多元化、多媒体化的网络信息检索工具出现的呼声越来越高,并且有更多的人参与到其中来。
如此种种,给当今的网络信息检索研究带来了发展机遇,也给了它无限的发展空间。
3.网络信息检索的现行模式
3.1 网络全文数据库检索
网络全文数据库是以全文数据为数据库对象,并在网上提供全文检索服务的数据库。
按数据库的生产机构分类,可分为出版商全文期刊数据库和生产商全文期刊数据库。
前者主要是那些期刊出版单位在其出版的印刷期刊基础上建立的网络电子期刊全文数据库。
而后者则是由数据库生产商根据一定的主题或一定的收录范围整合一定数量的期刊出版物而产生的全文数据库。
国内全文数据库主要有中国学术期刊全文数据库。
3.2 网络搜索引擎检索
搜索引擎是一个专门的系统,它可以对互联网信息资源进行搜索整理和分类,并将其储存在网络数据库中供用户查询。
搜索引擎包括搜集信息、分类和用户查询等三大部分。
目前流行的搜索引擎有两大类:关键词全文检索式搜索引擎和分类目录式搜索引擎。
关键词全文检索式搜索引擎主要利用其内部的搜索机器人和蜘蛛程序,自动搜索来自互联网上的各种内容,在每一个关键词和所有相关的网页之间按照网页相关性原理建立一个对应关系,储存在其网络服务器的数据库中。
用户只要输入关键词就可以找到符合该关键词特征的所有被索引的网页,搜索结果以超链接的方式列表,搜索结果有简单介绍,用户点击相应的链接就可以进入相应的网络资源网站,从而找到所需信息。
用这种方式搜索到的结果通常数以百万计,但是相关性越高的信息,在搜索结果列表中的位置越靠前。
分类目录式搜索引擎将互联网信息按照一定的标准进行收集和分类,并编入相应目录,以层级和逐次分项的方式管理目录,查找信息可以按照分类目录一层层进入,最终找到所要的信息。
3.3 互联网“超链接”搜索
Web信息以超文本链接方式组织,基本组织单元是信息节点而不是字符串,信息节点之间通过链接进行联系。
超链接是网页必不可少的一个元素,同一主题或相关的信息因超链接构成了信息网。
超文本信息检索技术,以超文本信息节点之间的多种链接关系为基础,根据思维联想或查找信息的需要,通过链接从一个信息节点转到另一个信息节点。
4.网络信息检索的未来发展趋势
网络技术的发展,给网络信息检索及信息的网络化带来的极大的便利,进一步推动了网络信息检索理论和技术的快速发展。
怎样为网络用户提供高质量、高效率的检索方式是网络信息检索研究者的努力方向。
信息检索的对象已从传统的文本信息扩展到如今开放、动态、分布广泛的多媒体信息。
那么,网络信息检索的发展趋势如何呢?
4.1 智能化信息检索
智能化信息检索是基于自然语言处理的检索形式。
检索工具是对用户提供的以自然语言表达的检索要求进行分析,从而形成检索策略进行检索。
检索工具智能化的内涵在于检索工具具有学习、分析、辨别和推理的能力。
近年来,因特网上不断涌现的人工智能产品,如智能搜索引擎、智能浏览器、智能代理等,它们将提高网络信息检索的智能化程度,促进智能信息检索的发展。
网络中的智能代理通常是一个专家系统、一个过程、一个模块或一个求解单元。
智能代理可以获得用户的'信息需求,自动检索信息和推送检索结果信息。
多智能代理系统还具有信息发现、信息筛选、信息推送和信息导航功能,可满足专业研究人员的特定需求,实现网络信息检索与服务的智能化。
4.2 一站式信息检索
一站式(One Stop)信息检索是指用户通过一个检索工具能满足自己所有的信息检索需求。
一站式信息检索将是网络信息检索服务的一种发展模式。
一站式检索服务是人性化服务的重要体现,它将大量节约用户的检索时间。
全球最大的搜索引擎Google正在朝着一站式服务的方向发展。
12月,Google宣布与纽约公共图书馆和包括哈佛大学图书馆在内的4个主要图书馆合作,将这些图书馆的大约1500万册藏书扫描进自己的数据主库以提供网络用户检索。
目前,Google已经为其用户提供了某种程度上的一站式的检索服务了。
而其他越来越多的检索服务提供商将向一站式检索方向发展。
4.3 可视化
可视化指的是运用计算机图形学和图像处理技术,将数据转换为图形或图像在屏幕上显示出来,并进行交互处理的理论、方法和技术。
据统计,获取信息有70%~80%靠视觉,20%靠听觉,10%靠触觉。
用图像取代文字帮助人们检索的优点在于:图像的表达更生动、结束语形象、准确,效率更高,具有交互性、多维性、可视性等特点,可以大大加快检索速度,使时刻都在产生的海量数据得到有效利用。
4.4 商业化
目前网络信息检索系统已成为新的投资热点,网络信息检索系统不再仅仅是一种检索工具,而且是一种商业产品。
10月,全球最大的中文搜索引擎提供商百度联合新浪等多家中文门户网站,共同推广“搜索引擎竞价排名”全新网络商业服务模式。
网络信息检索的商业化还体现在联机和光盘检索逐渐进入网络环境。
由于目前网络信息检索的检准率低,联网的收费联机和光盘检索依旧受到青睐,如世界著名的联机信息系统DIALOG、OCLC、EBSCO、Silverplatter,国内的万方数据资源系统、中国学术期刊光盘、重庆维普公司系列光盘等都纷纷在网上设立自己的网络检索入口。
许多著名科技期刊的上网丰富了网络资源,它们大多数都是在提供印刷版的同时提供期刊的网上服务,包括收费检索。
5.小结
在的网络信息资源中寻找自己所需要的信息资源是一件极具挑战性的工作。
为此,许多信息专家正在积极地研究探索,并且取得了不少成果。
篇4:信息检索论文
摘要:
本文通过对纸质文献和电子文献的比较分析,指出纸质文献与电子文献各具特点,认为纸质文献和电子文献在未来的时间内会相互补充,共同存在。
关键词:
信息时代;纸质文献;电子文献;比较
当今时代,人类已经步入了一个的飞速发展的信息时代,在信息时代,信息也已成为人类社会发展必不可少的资源。它与能源、物质一起被认为是人类社会的三大支柱。在信息时代,计算机网络技术也遍及了全球的每一个角落。于此同时信息时代也给我们的工作、学习和生活带来了许多变化,例如文献的发展与变化就是极其明显的。最开是的时候是纸质文献到后来信息时代的发展又给我们带来了电子文献。同纸质文献相比,它具有轻便等等的优越性。
1、纸质文献(paper document)
以纸张为载体,用书写或印刷等方式记录知识的文献。纸质文献最早出现在中国,4世纪以后逐渐在世界各地传播和应用。
1.1纸质文献的优点
1.1.1纸质文献目前仍呈呈现着增长强势
现在在我们学习生活中大量纸质文献如影随形,从目前看,全世界每年出版图书370万种,期刊13万种,会议文献100多万篇,专利文献、技术标准、产品资料100万件以上,其中至少90%以上仍然是以印刷型为主的纸质文献。
1.1.2人们的已习惯阅读纸质文献
长期以来,人们一直与纸质文献相伴,纸质文献的生产和利用已经形成了一个相当完善和稳固的体系,且长时间阅读,只要光线自然柔和,对视力影响不大,阅读效果较好。因此,纸质文献在今后相当长的时间内仍将继续存在。
1.1.3纸质文献具有较强的权威性
纸质文献已经经历了上千年的洗礼,已建立了完善的编辑、生产、发行体制。各个书刊部门都建立了健全机构来保证图书文献的科学学术水平,所以发表的文献基本上都是得到科学权威认可的,因而具有一定的权威性。
1.1.4纸质文献更容易受到知识产权的保护
目前纸质文献的知识产权的颁布与实施已取得较理想的效果,但是对于电子文献的相关保护却依然被动。现代信息技术使得数字信息很容易被复制、修改,为侵权行为带来了极大方便。纸质文献有利于知识产权的保护,因为纸质文献在知识产权方面已有较完备的法规法律体系。
1.1.5保存方面
纸质文献更利于保存。
1.1.6纸质文献更符合当下情况
目前中国还有很多比较落后的地方并没有普及一系列的电子设备,如贫困地区的人并不能想我们一样每天都与各种电子产品打交道,所以他们更多的则是通过纸质文献的方式来阅读和查找自己所需要的种种资料。
1.2纸质文献的不足之处
1.2.1不利于资源节约型环境友好型社会的构建
纸质文献都是一木材为原料的,既浪费了国家宝贵的森林资源,生产过程中也造成了严重的环境污染,从而不利于我们当今所提倡的资源节约型环境友好型社会的建立。
1.2.2不利于阅读查找
纸质文献由于量大而不利于人阅读查找,查找资料的时候常常会让我们失去耐心,从而最终放弃查找。
1.1.3不利于携带
信息时代的发展,一只小小的U盘可以储存非常大的容量,相当于几十万册的图书,试问哪个更容易携带?
2、电子文献(Electronic literature)
电子文献,又称电子出版物。我国新闻出版署颁发了《电子出版物管理暂行规定》,规定中指出:电子出版物系指以数字代码方式将图、文、声、像等信息存储在磁光电介质上,通过计算机或具有类似功能的设备阅读使用,用以表达思想、普及知识和积累文化,并可复制发行的大众传播媒体。电子出版物的主要媒体形态有:软磁盘、只读光盘(CD—ROM)、交互式光盘(CD—I)、照片光盘(PHOTO—CD)、集成电路卡(ICCARD)等。
电子文件的产生,是计算机技术与通信技术在办公和管理领域的运用。电子文件的科技进步性体现为两方面:一方面是数字化生存,另一方面是网络化传递。
随着科技的进步,图书馆的文献结构正在发生迅速的变化,电子文献的崛起打破了纸质文献长期一统天下的局面,形成与纸质文献平分秋色的态势。尽管情况未必像有的学者提出的“今后电子文献将取代纸质文献”,但毫无疑问,新型的载体取代旧的载体是历史发展的必然趋势。电子文献将越来越多,其使用会越来越普及,越来越受读者欢迎。在相当长的时期内电子文献与纸质文献将各显特色,优势互补,共生共存。
2.1电子文献的优点
2.1.1有利于阅读检索
随着信息时代的发展,产生了许多检索文献的软件,通过数据库、索引文件、超文本等关系组成的网状结构。我们可以用自己喜欢的.软件进行关键词等等的检索出我们所需要的内容,这样可以为我们的阅读检索资料带来极大的方便,为我们节约不少的时间。
2.1.2传播迅速方便
电子文献还可以进行远距离的快速传播。网络上的信息可以传播到世界的每一个角落,即我们可以在网络上共享各种我们需要的文献。
2.1.3存储量非常大,利于携带
电子文献体积小,但存储容量大。一张7。62cm(3in.)软盘可容纳72万个汉字;一张CD-ROM光盘可存储650Mb,相当于30万汉字的图书1000册。存储《全国报刊索引》1993—全部内容,只需一张光盘,解决了图书馆空间紧张和用户查检利用的困难。
2.1.4具有多媒体信息存储和传递功能
电子文献内容丰富,既可表达文字等静态信息,也可以是集图、文、声、像为一体的动态信息,各种数据借助计算机实现任意组合编辑,可多次反复进行。形式多样,生动直观,便于我们对文献信息内容的理解和吸收。
2.2电子文献的不足之处
2.2.1造成电的浪费
电子文献的阅读,必须有电源,必须通过一系列特殊装置才能完成。
2.2.2阅读保健效果较差
电子文献在阅读过程中,荧光屏的闪烁和不清晰,长时间便会加重眼睛的负担从而对我们的视力造成影响。于此同时。久坐在电脑旁会加重引起颈椎疲劳,甚至导致疾病。从现代许多人来看,已经有很多上班族有视力和颈椎问题。所以电子文献的阅读保健效果较差。
2.2.3电子技术保护方面任然缺乏经验
光学载体的电子文献的保护层,一般为透明塑料,基层是经书或有机合成材料,稳定性差,在长期保护过程中,会慢慢氧化,使用中会造成电腐蚀,使载体变质,信息丢失。磁性载体的电子文献,易受温度、湿度、空气污染影响,从而增大使用中盘面的摩擦,损失信息。电子文献的存储与收藏,必须将环境控制在14—25℃之间,相对湿度以百分之四十五为好,同时还应注意防火、防光、防磁、防污染,维持一定的清洁度。只有这样才能有效地延长电子文献的寿命。电子文献相对纸质文献而言,更依赖环境条件和科学管理。
2.2.4信息可信度较低
由于缺乏统一管理机制,单纯的电子文献出版不像纸质文献那样经过严格的编审制度,文献质量得不到可靠保障,因而在学术评价中还不能与纸质文献相提并论。在科研考核、职称评定中也得不到认可,使人们对电子文献的可信度大打折扣。
2.2.5知识产权保护问题
纸质文献在知识产权和版权保护方面已有较完备的法律法规,而电子文献通过数码代码方式,在网络环境下,不仅使各类作品之间界限模糊、相互渗透,而且使作品复制、修改变得非常容易,影响了知识产权的保护。
3、结论
现在,在我们的学习工作生活中电子文献呈现增长强势,但有些只是印刷型纸质出版物的延伸和翻版。纸质文献在电子文献的冲击下也在努力求得生存与发展。首先,纸质文献的生产、传播和利用现代化(如电子排版,计算机检索等)使纸质文献本身具有更加强大的生命力;其次,纸质文献也出现了一种积极向网络靠拢的动向,不仅大量的名著被搬上了因特网,各个报刊社纷纷推出网络版,而且一些报刊社还提供了编辑部的电子信箱,鼓励作者通过电子邮件投稿,并与著者、读者展开对话。事实上,纸质文献在与电子文献展开竞争、争夺读者的同时,也正在加速与电子文献的融合。
电子文献和纸质文献经过多次的较量,最终将达到共存共荣,正如报刊、电视、广播最终达成平衡一样,这是一种趋势。互联网的出现,电子出版物的兴旺,又使纸质文献再次面临挑战,但是,正如电视业的崛起并没有使报业消亡一样,互联网的出现,电子出版物的兴盛,也不会使以印刷型为主的纸质文献不复存在。纸质文献也可以通过网络促销,扩大其销量。
所以我认为在未来一段时间内纸质文献与电子文献将互为补充、彼此共存、共同进步发展。
参考文献:
【1】刘莹,纸质文献与电子文献比较研究,-06-15
【2】蔡先金,赵海丽,电子文献释义及其与纸质文献比较,-04-30
【3】张瑞兰,纸质文献在信息时代的地位和作用,-08-15
篇5:信息检索课程论文
信息检索课程论文
信息检索就是根据信息用户的需要找出有关的信息的过程和技术,我们看看下面的信息检索课程论文。
信息检索课程论文
摘 要 文章针对高校在信息检索课程教学过程中存在的诸多问题,从教学目标、教材选择、教学模式、考核方法等方面提出改革措施,并对课程教学方式的创新进行了探索。
关键词 信息检索 教学改革 信息素质
,教育部在专业调整中将信息检索课程设置为“信息管理与信息系统”专业的主干课程之一,并很快成为信息管理领域理论研究与技术发展最具活力的分支学科。①目前,很多高校都开设了信息检索课程,实践证明,该课程对大学生的信息素质教育起到了作用,但是在教学过程中存在很多问题,影响了教学效果。
1 信息检索课程现状
目前学生对信息检索课程还存在很多误区,认为只要能通过搜索引擎检索检索几篇论文就是信息检索,没有必要上这门课。而从我们的实际调查情况来看,学生只会使用一两个数据库的极少部分功能,不会使用检索策略,也不能对检索结果进行筛选,整合,分析和利用。所以学生在掌握信息整合与分析能力方面远没有达到我们的预期目的。在信息技术不断发展的今天,信息检索课的教学内容却相对稳定,教学目标没有相应转变。教材的内容跟不上时代的发展,缺少网络环境下的实验项目;教学模式单一,学生学习积极性不高;没有综合性实验项目的建设;考核方式落后,达不到预期评价结果等。针对这些方面,急需对信息存储课程进行改革。
2 信息检索课程改革措施
2.1 构建以“信息素质培养”为核心的新的教学目标
传统的教学目标是检验学生是否掌握信息检索理论与检索方法,并没有重视学生对信息资源的整合与利用,换句话说,学生只是学会了一种使用工具而已。任何时候我们检索的目的都是利用信息,而检索工作本身只是一个准备工作。
在如今这个信息爆炸的时代,如何对信息进行整合、分析、利用才是我们从事所有研究工作需要的基本技能。因此在信息检索课程的教学中,我们要以培养学生“信息素质”为目标。②无论从教材选择,还是教学内容安排与实践环节都要从这个目标为出发点,努力培养学生对信息的整合,分析和利用的能力,使他们以后无论从事什么样的研究工作都可以敏锐地洞察信息需求,懂得如何获取解决问题的信息,更新自我知识体系并能进行相应的信息评估和利用,使他们具有终身学习的能力。
2.2 适时更新教材
目前信息检索课程的教材基本上都是偏重理论性,主要介绍信息检索方法,很多数据库的使用方法像说明书一样,存在很多重复性。适合学生专业背景与学习特点的教材几乎没有。信息检索课程有很多上机实验课,由于教材缺乏从专业背景出发的综合性试验项目,使得学生很难将理论与实践教学内容相结合。学生在学习过程中不可避免地感到枯燥无味,缺少学习积极性。因此我们急需内容新颖、实用,具有一定的科学性、知识性和专业针对性的教材。
2.3 开展多种教学模式
在传统教学模式中,都是以教师讲授为主,不断向学生灌输知识,从而让学生形成了被动学习的习惯。由于教学方式单一,不能调动学生的学习积极性,导致课堂教学枯燥无味,教学效果比较差的现象。为了改变这种教学现象,笔者对信息检索课的教学模式进行了一些研究,开展多种教学模式有助于提高学生的学习积极性、自主性和创造性。我们可以让学生在教师的指导下进行研究性、协作性和自主性学习。
2.3.1 研究性学习方式
目前国内高校对于本科生教育主要偏重于理论教学,缺少研究课题,使学生对所学专业的前沿知识与实际应用领域知之甚少。在信息检索课中,我们可以针对要求学生针对自己的专业背景查找相关文献。③例如针对计算机网络专业学生,我们可以让他们检索计算机网络方面的文献,然后指导他们如何从众多文献中整合自己需要的资源,找到自己感兴趣的研究方向,为后续实验项目打好基础。
2.3.2 协作学习方式
协作学习是指多个学习者利用学习资源,在沟通、亲合的气氛下,结成学习伙伴,形成团体意识,共同学(下转第83页)(上接第62页)习和互助学习。协作学习是网络环境下一种很重要的教学模式,它对促进学习伙伴的合作能力有着积极的促进作用。信息检索课是一门实践性很强的课,如何能使学生增强获取信息的意识,提高利用信息的能力尤为重要。通过协作学习,教师可以调动学生的积极性,培养创新能力,增强学生之间的沟通,更有利于培养学生的多方位能力。
教师作为协作学习问题的启迪者,能为学生设计能引起争论的信息检索初始问题,然后对学生进行分组,让他们运用所学的检索技术将讨论引向深入,进而提出信息检索的拓展性问题,不断提高学生的创新型思维能力。④
2.3.3 自主学习方式。
自主学习是以学生为主体,通过学生独立的分析、探索、质疑、创造等方法来实现学习目标。教师在信息检索课程中让学生自己查找本专业相关文献,激发他们的学习动机,养成一种自主学习的习惯。教师也可以给出很多研究性题目,让学生自己发现可以研究的创新点,进而激发学生的'主动性和学习热情,更好的达到该课预期的教学效果。
2.3.4 建设综合性实验项目
信息检索的课堂和上机实验教学能够让学生充分掌握相关检索技术,但这样还不能使学生迅速提高检索技能。为了能让其将所学理论与实践相结合,提高实验动手能力、综合分析能力,综合性实验项目的建设很有必要。⑤综合性实验项目的内容制定很重要,需难易适中,让学生有兴趣又不会望而生畏。在基本掌握所学知识后,要求学生开发一个网络资源导航库系统平台,以小组为单位拟定不同检索策略,搜集相关资源。对于计算机专业的学生,最好能要求他们在网络资源导航库的基础上设计门户网站,这样可以很好地培养他们的动手实践能力。
2.3.5 改革考核方式
信息检索课程以往都是采用平时成绩与期末考试成绩相结合的考核方式,这样不能真正测验学生对课程的掌握情况。对于实践性很强的课程,应趋向考核学生的知识掌握与应用情况。信息检索课成绩评定主要由检索策略研究报告和课程设计两部分组成,老师可以给定多个题目,学生给出不同的检索策略,并对检索结果做出评价,总结检索经验,最终形成检索策略研究报告;课程设计是结合自己的专业,根据拟定的研究方向,多途径搜集相关资料,通过对文献的整合,分析和利用最终完成课程设计。
3 总结
总之,在现代信息技术不断发展的今天,为了让学生适应时代的需要,我们必须对信息检索教学进行改革与创新。要从教学目标、教学内容、教学方式和考核方式等多方面进行改革,以网络信息检索为主体,以多种教学模式为辅助,以综合性实验项目建设为推动方式,努力培养适应新经济时代发展需要的智能型和创新型复合人才。
注释
① 张帆.信息存储与检索[M].高等教育出版社,.
② 马丽华.大学生的信息素质教育和信息检索教学探究[J].情报杂志,2010.29(12):241-242.
③ 叶青.网络环境下信息检索课的教学改革与创新[J].医学信息,(3).
④ 杨淑琼.论基于协作学习方式的信息检索课程教学[J].图书馆学研究,(18):67-69.
⑤ 尹志清.高职院校信息检索课程的教学改革[J].新课程研究,2009(147):32-33.
篇6:信息检索技术论文
[摘要]通过对近年来计算机科学、人工智能、专利文献加工等领域的发展进行总结,从多语言混合检索、分类检索、语义检索、图像检索以及辅助技术五个方面介绍专利文献计算机检索技术的最新发展。机器翻译技术和多边共同分类体系的完善有助于提高计算机检索效率、消除语言障碍,而语义检索、图像检索和文献自动处理技术的发展有望使面向不同层次用户的计算机智能化检索系统得以实现。
[关键词]专利文献 计算机检索 语义检索 图像检索
1、前言
近年来,计算机技术、语言学以及人工智能技术的发展促进了整个信息检索技术领域的发展,专利文献的计算机检索技术正成为情报检索领域研究的热点。下文拟从多语言混合检索、分类检索、语义检索、图像检索以及辅助技术五个方面介绍专利文献计算机检索技术的最新发展。
2、多语言混合检索
专利文献是由各国、各地区专利局或世界知识产权局出版的官方文献,因此一般以各局官方语言出版。虽然大部分专利文献是英语文献,但是仍然存在大量日文、中文、德文、法文及其他语种的文献。出版语言的多样性给专利文献的检索和利用带来了极大的障碍,要实现多语言混合检索,机器翻译是必不可少的技术。目前一些专利局在其上推出了机器翻译系统,例如我国国家知识产权局提供有汉英机器翻译,日本特许厅提供有日英机器翻译,韩国知识产权局提供有韩英机器翻译等,上述网络机器翻译系统对其他国家的用户阅读方便和使用本国专利文献起到了帮助作用。
随着计算机技术的发展,机器翻译的技术也迅速发展,从传统的基于规则的机器翻译扩展到了基于实例或模版的机器翻译、统计机器翻译等。尤其是近年来语言学和人工智能技术的发展,以语义描述或以知识描述为特征的智能机器翻译系统正逐步成为研究的热点。专利文献作为一种特殊的科技文献,由于其具有特定的句法和语言结构,同时例如权利要求书等具有法律公示性文件的作用,这对翻译的准确性提出了更高的要求,已有研究者通过在机器翻译系统内集成多个翻译引擎、对不同特点的内容使用不同引擎翻译的方式来提高翻译质量。
已有的机器翻译系统基本局限于单篇文献的机器翻译,无法实现真正的多语言混合检索。多语言混合检索系统不仅可以允许混合语言的检索式,而且同一个检索式还可以对不同语言的专利文献进行检索,其实现方式主要有如下三种:翻译检索式、翻译文献或者两者相结合的混合式。翻译检索式的工作量小,比较适合于因特网检索,但由于检索式通常缺乏语境,翻译难度较大;翻译文献的方式虽然有利于提高翻译质量,进而有利于文献检索,但存在的主要问题是翻译量太大、翻译时间长。
3、分类检索
分类号一直是专利文献检索的重要手段。目前除了基本涵盖各国专利文献的国际专利分类(IPC)之外,美国专利商标局、日本特许厅和欧洲专利局各自都有自己的分类体系,分别是UC、FI/FT和ECLA。IPC虽然通用,但存在分类标准不统一、分类条目不够完备、文献分类更新不及时等缺陷,导致使用IPC检索的效果欠佳。UC和FI/FT分别只能检索美国和日本的专利文献,ECLA虽然能够检索到多国的文献,但仍然不能有效地检索日本、韩国、中国等国的专利文献。
为改善这种局面,美国、日本和欧洲自即开始了“三边分类和谐计划”,该计划旨在推进ECLA、UC和FI三个分类体系的融合以增强分类号检索的功能,同时对现有IPC分类体系提出改进建议。依据召开的第27次三边会议,韩国知识产权局已经加入上述计划,而中国国家知识产权局也以观察国的身份参与这项工作。此外,近年来美国专利商标局、日本特许厅、欧洲专利局、韩国知识产权局和中国国家知识产权局五局积极开展合作,其中一个重要的合作项目是“共同的分类”。该项目的实施将有利于提高分类的一致性,扩展或细化部分技术领域的分类,进而提高检索的效率和质量。
不管是美日欧三方开展的“三边分类和谐计划”,还是五局共同开展的“共同的分类”项目,都必将推进专利文献分类体系的进一步发展,实现真正意义上的“基于检索的分类”,进一步增强分类号在专利文献计算机检索中的作用。
4、语义检索
当前专利文献检索的主要手段为关键词和分类号检索,而由于一词多义、一义多词,专利文献撰写、加工和翻译质量不一以及关键词的机械匹配等问题,本质上决定了其查全率和查准率受限制。随着计算技术、人工智能、自然语言处理等技术的发展,搜索引擎的智能化有望从根本上提高现有检索系统的检索质量。
搜索引擎的智能化具体表现为语义检索,也称为知识检索或概念检索。语义检索是对检索条件、信息组织及检索结果显示赋予一定语义成分的一种新的检索方式。语义检索的本质在于以语义为对象进行搜索,而不是对字符串进行简单的机械匹配,因此可避免关键词匹配检索中由于词和义不对应所导致的'问题。
语义检索过程一般包括对被检索的文档以及输入的检索式进行语义分析和匹配处理。这种语义分析处理依赖于词汇的语义描述技术以及分别用于词义鉴别和词汇过滤的语义识别技术和词汇链算法。可以通过诸如WordNet等语义词典对词汇实现较完备的语义描述,保证人和机器对词汇的理解一致。
最新发展的潜在语义索引通过将文献搜索过程中的向量空间模型和奇异值分解相结合,可以揭示文档中的词间关系,因而适于构建专利文献搜索引擎”…。利用语义进行检索还可以将专利文献中的非技术性信息考虑在内,例如将特定的技术概念和申请人、发明人等信息进行语义联系。此外,语义检索还可以从用户角度出发,考虑用户的检索需求,从而为诸如查新、侵权等不同目的的检索提供相应的结果。
近年来国内一些开发商也纷纷提供具有语义检索功能的专利文献检索系统,例如东方灵盾开发的专利检索系统和Patenticst网站。Patentics网站除了可以实现传统的关键词检索功能,还支持语义检索,仅通过输入检索所针对的专利文献号,即可自动对其进行语义分析、文献检索,并对结果进行相关度排序。当前专利文献检索领域还未广泛应用语义检索,但随着研究的深入,相信未来的搜索引擎不仅能利用语义技术提高检索的效率,还有望能对检索结果进行分析、评价,甚至自动生成检索报告。
5、图像检索
根据对图像检索所使用方法的特征可以分为基于文本的图像检索法(TBIR)和基于内容的图像检索法(cBIR)。专利文献一般都带有大量的附图,包括机械结构或化学结构式附图、电路图、方框图、流程图或曲线图等。与传统的关键词检索和分类号检索相比,CBIR更加直观、快速,而且可以克服因文字表述差异而导致的漏检,因此它正在成为专利文献检索领域的研究热点。专利文献的附图都是黑白二元图像(本文
所称专利是指发明和实用新型专利,不包括外观设计专利),不存在颜色和纹理等特征,因此专利文献的图像检索主要是基于形状和区域的图像特征。
虽然目前还没有成熟的专利文献图像检索系统,但一些研究机构已经开发出若干可专门用于专利文献的图像检索原型系统,例如IIT Kanpur的PATseek、Informatics and Telematics Institute的PatMediat以及LTUtechnologies公司的ImageSeeker等。PATseek专门针对美国专利文献进行图像检索,而PatMedia网站上的试验系统仅针对欧洲专利局的专利文献,这两个图像检索系统都可实现直接输入待检索的图像,系统自动进行相似度匹配,直接提供专利附图,同时还可以进行基于文本的图像检索。
典型的专利图像检索系统包括专利文献处理部分和图像检索部分,如图1所示:
文献处理部分又进一步包括文献预处理和视觉、文本元数据提取和索引两部分。前者是找出文献中的图形和对应的文字描述;后者则是进一步进行图像特征分析和文本分析,分别提取基本的图像特征以及能够表示图形含义的高层语义特征的关键词,由此分别形成索引后的图形特征矢量库、图像库、文本描述关键词库和知识库。在图像检索部分,基于上述提取的元数据,进行图像相似度匹配,同时还可以基于文本进行图像检索。与一般领域的图形检索相比,由于专利文献中每幅图形一般都对应有文字描述,即使不再进行人工标注或自动标注,都能提取到较好的高层语义特征,这对提高专利文献图形检索的准确性非常有帮助。
目前,专利文献图像检索系统仅处于试验阶段,只能对数量非常少的特定专利文献进行检索,且检索结果相关度还不是很高,但由于图像检索具有其他任何检索方式都不具备的优点,相信随着人们对专利文献图像检索技术的进一步研究以及语义检索技术的进一步发展,实现高精度的图像检索必将成为现实。
6、辅助技术
高质量的专利文献是提高检索质量的基础。专利文献分类、标引和摘要改写是专利文献加工的主要内容。传统的专利文献加工方法主要依赖于人工,其成本高且速度受限制,质量不统一。随着人工智能和计算机技术的发展,开始出现对专利文献进行自动分类、自动标引、自动摘要和自动聚类。
专利文献自动分类已经在欧洲、美国、日本得到了广泛的研究和尝试。例如欧洲专利局已经利用自然语言处理的相关技术实现了专利文献的自动初分类;对日本专利文献自动分类研究表明,对于使用K临近算法进行自动分类的情况下,先将专利文献按部分结构化为语义单元可以提高74%的效率。
PATExpert代表了目前较先进的专利文献自动处理技术的发展,通过基于语义网的语义处理技术实现了面向内容的专利文献自动处理,其中的一个主要技术是利用一定的语义表示结构实现专利文献知识层面的表达。该系统可以执行的处理任务包括:专利文献内容和元数据的自动抽取;全文、图像、相关性搜索引擎;专利文献的自动分类和聚类;面向多语言的辅助理解工具;专利价值自动评估等。
国内有一些研究机构开展了大量的基于IPC体系的专利文献自动分类的研究,这些研究大部分集中在统计分类技术。近年来随着人工智能技术的兴起,基于人工智能或语义的专利文献自动分类发展迅速,例如上文提到的Patentics试验系统也开始尝试对专利文献进行自动分类。
中文专利文献的自动处理仍处于研究阶段,虽然国外专利文献自动处理已经积累了许多宝贵经验,但由于中文表述的特殊性,许多技术还待消化和开发,例如汉语词汇之间的分词技术是制约自动标引质量的一个障碍。随着信息处理自动化相关技术的发展,专利文献的自动分类、自动标引、自动聚类和自动摘要正在逐步由半自动走向全自动化,这给搜索引擎的发展带来了极大的便利。同时,利用语义技术实现基于内容的自动处理将是未来的发展主流,也是提高专利文献自动处理质量的主要手段。
7、结语
专利文献计算机检索是一个涉及了多学科的研究领域,其中以语义检索为核心的技术推动了搜索引擎、机器翻译、图像检索等相关技术的发展,而由于专利文献的特殊性,分类体系和文献自动处理技术也在其中占据了重要地位。随着研究的进一步深入,现存的语言障碍和检索效率低下等缺陷在不久的将来必将逐渐被克服,不同层次的用户有望借助于智能化的自动检索系统便利地实现专业化检索。
篇7:网络信息检索应用心得
网络信息检索应用心得
通过一个学期的学习,对检索工具有了进一步的认识,特别是万方数据资源系统、CNKI中国知识网、维普资讯网…….这次课题研究我运用了CNKI检索工具进行检索。CNKI是全文数据库,按学科知识属性分为九个专辑,因为CNKI不能进行检索史的组合,检索时可采用高级检索或专业检索。检索时注意几点:一是运算符与其他数据库不同,“*”表示“与”,“+”表示“或”,“-”表示“非”,不能用括号优先运算。二是关键词不同于CBM中的自由词,CNKI中的关键词由作者提供,用关键词可能降低查全率。
第一步:选择查询范围
查询范围功能选项在左窗口下侧的检索导航栏中,通过它可指定检索进行的'范围,这里分类列出了九个总目录,在每个总目录的下面又分别设有详细的子目录可供用户进一步缩小选择。
第二步:选择检索项
您可以通过[检索项]右边的下拉列表选择一个您将要检索的项目名。
第三步:输入检索词您现在阅览的是工作总结网www.gzzongjie.cn/谢谢您的支持和鼓励!!!
输入检索词的方式有两种:一是直接在[检索词]输入框中进行手动输入;二是通过点击[检索项]右侧的 图标来从[检索词典库]返回一个检索词。
第四步:模式选择
模式选项分为两种:模糊匹配和精确匹配。当您想检索出“作者”是“王明”的所有刊物时,可能更加希望精确匹配出“王明”的全部作品,而不是将“王晓明”、“*王明*”等这样名字的作者的作品也包括其中。这就是二者的区别所在。
第五步:时间范围
您可以根据自己的需要设定所要检索刊物的时间范围。
第六步:范围选择
范围指的是您想要检索的作品的来源,有四个选项可供选择:全部、EI来源刊、SCI来源刊及核心期刊;
第七步:记录数和排序
记录数和排序两选择项是针对检索结果显示界面设定的,您可以自定义选择设定每页显示多少条记录及按什么方式对检索结果进行排序。本系统为您提供的每页显示记录条数最多为50。
第八步:检索
[1] [2] [3] 下一页
篇8:网络信息检索的方法
1 主题指南与搜索引擎结合使用
主题指南将信息系统地进行归类,可使用户方便地查找到某一大类信息,但其搜索范围较搜索引擎要小许多。搜索引擎查询较为全面而充分,可以提供最全面、最广泛的搜索结果,但所提供的信息不像主题指南那样层次结构清晰,显得繁多而杂乱。由于主题指南和搜索引擎各有优势,两者可以相互结合,取长补短,合理运用,以产生最佳结果。总之,选择合适的搜索引擎是信息检索至关重要的一步。搜索引擎在查询范围、检索能力、效率等方面各具特色,针对不同目的的检索,应选用不同的搜索引擎。
2 缩小检索范围
(1)采用恰当的检索表达式。在检索表达式的构造中,可采用把一个短语作为一个整体进行查询的办法,或者采用强制包含或排除特定关键词的办法限定检索范围。
(2)限定检索范围。当检索的范围过大时,可以对检索词的年代、语种、数量、学科等检索范围进行限定。这些限定检索的运用可以有效控制检索的相关性,从而提高检准率,使检索结果接近用户需求。
(3)利用进阶检索功能。进阶查询(Refine Query)是指利用前一次检索的结果作为后一次检索的依据,逐步缩小检索范围。
(4)搜索力求具体化。检索文献信息资源时,要明确检索课题的需求,限定查询范围,选择确切的检索词,使检索要求具体化、明确化。这样,有利于提高文献信息资源检索的查准率。
3 扩大检索范围
(1)使用同义词或近义词检索。目前,检索软件的智能化程度较低,容易漏检与关键词意思相近或一致的内容。此外,搜索引擎对网络信息资源中出现的多姓名的个人著者,更名的机关团体,同一事物的不同名称不像图书馆目录那样提供规范化的检索点,也容易出现漏检现象。因此,用户需要使用同义词、近义词或同一事物的不同名称尽可能全面地扩大检索范围。反映同一概念的检索词越多,就越能保证查全率。
(2)使用All-in-one整合型检索。All-in-one是指在统一的标准界面下,同一检索词用户只需输入一次即可委托多个搜索引擎查询。WWW上的信息资源非常庞大,没有一个搜索引擎能够搜索全部网页,同时使用多个搜索引擎能弥补单个搜索引擎数据库容量不足的缺陷。如NetLocator(http://nln.com)能在Yahoo!,Lycos,Altavista,Webcrowler 4个搜索引擎同时代理用户的检索指令,最大限度地确保文献信息资源的查全率。
4 使用组合搜索关键词
如果一个陌生人突然走近你,问你“北京”,你会怎样回答?大多数人会觉得莫名其妙,然后会再问这个人到底想问“北京”哪方面的事情。同样,如果你在搜索引擎中输入一个关键词“北京”,搜索引擎也不知道你要找什么,它也可能返回很多莫名其妙的结果。因此你要养成使用多个关键词搜索的习惯,当然,大多数情况下使用两个关键词搜索已经足够了,关键词与关键词之间以空格隔开。比如,你想了解北京旅游方面的信息,就输入“北京旅游”这样才能获取与北京旅游有关的信息。
5 强制搜索
通过添加英文双引号来搜索短语词,这一方法在查找名言警句时显得格外有用。例如用““京剧”+“脸谱””的搜索结果比“京剧+脸谱”更精确。
6 模糊搜索
搜索引擎中允许使用模糊查询,即用*号通配符代替不确定的字或词,每种搜索引擎都有各自的关键词技巧,除了通配符还可以用or或and逻辑运算符。
7 搜索之前先思考
网上的内容虽然很丰富,但必须先有人放上网。搜索引擎本事再大,也搜索不到网上没有的内容,而且,有些内容虽然存在网上,却因为各种原因,很可能成为漏网之鱼。所以在使用搜索引擎之前,应该先花几秒钟想一下,我要找的东西网上可能有吗?如果有,又可能在哪里?网页上会含有哪些关键字?
8 点击搜索结果前先分析
一次成功的搜索由两个部分组成:一个设计优秀的搜索请求和一个准确可信的搜索结果。在你点击任何一条搜索结果之前,快速地分析一下你的搜索结果的标题和网址,会帮你节省大量的时间。
篇9:信息检索的方式论文
信息检索的方式论文
【摘要】随着数据信息库积累的数据和主题越来越多,怎样快速,有效,经济地检索某个主题的所有信息,就成了一个十分热门的课题.本文中给出了计算机信息检索的策略和方法,以及最终有助于网络用户查找信息的检索技术。
【关键词】信息检索 检索策略
随着计算机技术和通讯技术的发展,信息检索的理论与实践也随之不断地推陈出新。其历史沿革可划分为手工检索,联机检索、光盘检索、网络信息检索等阶段。目前,计算机信息检索呈现出联机信息检索、光盘信息检索、网络信息检索并存的格局。如何判断计算机信息检索技能的高低?最重要的衡量指标之一,就是能否构造出合适的检索策略。只有构造出最佳检索策略,才能快速、准确地检索到所需信息。
一、检索策略的含义和作用
信息需求产生之后,如何在茫茫的信息海洋中查找需要的信息?利用哪些信息检索系统?检索提问怎么设计才能得到好的检索效果?信息检索策略对于解决这些问题具有重要的意义。
检索策略是指分析检索课题内容实质基础上,选择检索系统、检索途径、确定检索词及其相互间的逻辑关系等的信息检索方案。信息检索策略的实质是对检索过程的科学规划,其中关键在于构造能够确切表达信息需求的检索式。
检索策略的优劣是影响检索效果的非常重要的因素。正确的检索策略会优化检索过程,有助于取得最佳的检索效果。
二、检索策略的构造步骤
信息检索策略的构造一般包括分析用户信息需求、选择检索系统、确定检索用词、构造检索式、分析检索结果等。具体过程如下:
1.分析信息需求,明确检索要求。这是人们进行信息检索的出发点,不同类型的检索课题,信息需求的范围和程度也不尽相同。在这一环节中,要明确检索目的,明确检索课题内容涉及的主要学科范围和相关概念。对检索需求作出全面的认识。
2.选择检索系统。计算机检索系统主要包括各种数据库、搜索引擎等。依据对信息需求的分析,选择与检索课题相符、收录信息质量较高、检索功能比较完善的信息检索系统。检索系统的选择要求我们对目前可利用的检索系统有一个大概的了解,如检索系统所涉及的学科领域、文献类型、时间范围、检索方式、检索途径等。
3.选择检索方式和检索途径,确定检索词或检索式,选定限制条件。这是构造检索策略的核心步骤,在很大程度上决定着检索策略的优劣与检索效率的高低。
进入检索系统后,首先要在信息需求分析的基础上选择合适的检索方式和检索途径。
所谓检索方式,即以检索过程的繁简程度来区分的不同检索过程。基本的检索方式不外乎两种:初级检索和高级检索,只不过不同的数据库对初级检索的称谓不同,如:基本检索、快速检索、简单检索等。
检索途径,又叫检索字段、检索入口、检索项等。指输入的检索条件所查询的数据区域。不同数据库所设的途径并不相同,常用的检索途径有:题名、作者、关键词等。一般来说,选择题名作为检索途径,命中文献的.相关度会比较高。但如果检索内容比较冷僻,文献量较少时,可以扩展到关键词、主题等途径。
检索词或检索式的确定是构造检索策略的核心步骤,在很大程度上决定着检索策略的优劣与检索效率的高低。
检索词的确定是建立在检索课题概念分析的基础上。有时,检索课题会包含较复杂的主题内容,这就需要利用检索式来表达信息需求了。只有对检索课题的主题有全面、正确的逻辑分析,选全、选准检索词并能合理运用各种连接组配符号对其进行组配,才能构造出高质量的检索式。
实际上,在构造检索式前,首先要从宏观上确定利用什么方法得到检索结果。常用的方法是把检索课题剖析成若干个不同的词,再找出各词的相关词、同义词,并用布尔算符“OR”连接成子检索式,然后再用布尔算符“AND”把所有子检索式连接起来,构成一个总检索式。还可以先确定一个范围较广的概念集合,然后提高检索的专指度,得到一个较小的检索结果集合,直到得到满意的结果。
确定检索词或检索式后,还要根据需要选择合适的限制条件、排序依据等。
4.实施信息检索,获取原始信息。确定了检索词或检索式之后,即可开始检索操作。得到检索结果后,要根据课题需要对查全率和查准率进行分析与评价。如果必要,则要适当调整检索策略,完善检索结果,直至达到满意的效果。
参考文献:
[1]邱均平,赵蓉英,马瑞敏,李晔君.我国文献计量学信息计量学课程建设的理念与实践[J].图书情报知识.(03).
[2]马费成,望俊成,陈金霞,胡超.我国数字信息资源研究的热点领域:共词分析透视[J].情报理论与实践.2007(04).
[3]陈文勇.情报学研究的方法论认同与理论创新问题[J].情报资料工作.2007(01).
篇10:会计利用信息检索论文
摘要:本文探讨双语教学在生物医学信息检索课程中的应用,小结医学信息检索课程双语教学的方法和技巧,并基于教学实践,对潜在的问题提出相应的解决方案。
关键词:生物医学信息检索;双语教学;高等教育
前言
21世纪全球经济一体化,科学技术飞速发展,英语作为国际上的全球化通用语言,其重要性不言而喻,它发挥的马太效应已经愈来愈明显。而我国传统的英语教育更侧重于理论知识的学习,对更为实际的语言应用能力则有所忽视,尤其是专业英语的教育存在较大的空白,导致相当多的学生在专业领域内英语的实际运用能力有限。但是现如今,无论是各类型企业还是科研机构,对同时具备良好的专业知识和高水平的英语应用能力的人才的需求非常大。可以说,作为高层次的人才,仅仅具备专业知识,而英语应用能力存在短板会极大地限制专业水平的进一步提高,降低国际交流与协作的效率,对职业生涯造成无法低估的伤害。高等教育应从多方面入手,努力培养有国际视野的“专业+英语”复合型人才,满足这一需求。双语教学作为一种与国际接轨的教学模式,一方面有利于提高学生的英语学习能力,另一方面可以更快速更全面地获取专业相关的科技进展,有利于提升学生的专业水平。而生物医学信息检索是一门关于信息获取、知识更新的课程,只有当学生具备良好的英语能力,才能更高效更全面地获取最前沿的信息,学习最先进的知识,更好地服务于生物医学行业。将双语教学应用于生物医学信息检索,是一个事半功倍的方法。①②笔者在生物医学信息检索的双语教学实践中,总结一些方法与技巧,并对其潜在的问题提供相应的解决方案。
1方法与技巧
1.1精选教材且及时调整课程难度
“工欲善其事,必先利其器”,双语教学的首要问题便是双语教材的选择,教材选择的好与坏,直接影响着教学效果的好坏。教育部高等教育司曾提出:“在有条件的高等学校的某些信息科学和技术课程中推动使用国外优秀教材的影印版进行英语或双语教学,以缩短我国与国际先进水平的差距,同时也有助于强化我国大学生的英语水平。”原版外文教材在内容上更具有前瞻性、专业的前沿知识也更加规范和优越,更利于学生接触到新知识,选择原版外文教材也是营造全英文环境的一个有利措施,可以高效率地学习专业词汇的使用、专业内容的表达。但是,到目前为止,我国的生物医学信息检索的双语教材选择比较少。而直接采用美国等发达国家的生物医学信息检索原版教材,其课程内容并不一致,而且由于国外教材是按照英文的思维方式编写的,对于学生来讲难度较大,会对学生造成很大的学习压力。综合以上原因,我们在授课中参考国外的一部分原版教材以后,自编适合学生全英文的教材和练习。该教材兼顾学生按教学大纲要求掌握专业知识和基本技能,重点强调与现行的生物医学前沿进展的联系。最后在教学实践过程中,根据学生的学习和掌握情况随时进行修改和调整。
1.2多媒体教学结合上机实践
现代计算机和网络的普及大大减轻双语教学中的困难。随着网络技术的发展和网络信息资源的大幅度增长,生物医学信息检索也更多地在网络上进行。为配合这一现实的应用现状,我们在教学中采用教师多媒体讲授和学生上机实践相结合的方式,旨在让学生们能摆脱纸上谈兵的桎梏,充分地将字面的知识固化为自己掌握的本领,能利用网络进行生物医学信息的检索。教师在教学中利用课件控制,对临场情况做出及时的响应调整教学策略和学习内容,以适应动态教学环境所带来的变化。在多媒体演示教学环境中,老师可将操作过程和所得到的结果展现在学生面前,让学生亲自动手操作,以使学生对知识的理解更加具体透彻。上机实践使得整个教学环境由静态向动态转变。这个方式一则是充分发挥学生的积极主动性,从老师“教”转化为学生“学”,二则有利于学生将理论学习和技能提升有机地结合在一起。这一方式在没有增加学时的情况下,本科生的生物医学信息检索课程的教学质量有比较大的提升,得到学生的普遍好评。
1.3小班教学增强师生交流
双语教学要考虑到学生之间的水平差异,采用小班教学的模式。我们在教学中发现双语教学的最大困难在于学生之间存在专业英语水平的差异,尤其是对于生源来源广泛的民族院校,这种情况尤其突出,教师如何平衡这种差异、并且及时调整教学的进度和难度是重中之重。而小班教学的方式能够保证信息的充分交流和师生的顺畅沟通,有利于增进学生对专业知识的理解和应用,也可以给授课老师及时反馈。小班教学可以营造一个良好的每个人都可以参与其中的双语氛围,获得更好的教学效果。
2问题与对策
2.1加强专业英语学习
笔者在双语教学实践中发现,教学效果的好坏很大程度取决于学生自身的英文水平,尤其是专业英文水平。当学生的专业英文水平有限的时候,会出现不能理解关键词的准确含义、无法阅读摘要的主要内容,进而不能获得所需要的信息。在这种情形之下,无论老师如何讲授信息检索的原理,介绍信息检索的方法,对于学生来讲,都会出现茫然不知所措的状态。比如说指定检索癌症相关信息,部分同学只知道cancer可以表示癌症,不知道还有tumor、carcinoma也可以表示癌症,并且词义在医学领域存在差异。再比如,在表述胃癌的时候,可以用stomachcancer,也可以用gastricCancer。针对这一情况,笔者在授课之初会详细讲解MeSH(MedicalSubjectHeadings),即由美国国家医学图书馆建立的一套完整详细的生物医学领域的主题词库。同时,笔者也建议先导课的专业课老师在授课的过程中,尽量采用全英文幻灯片展示,中英文对照学习的`方式。上述措施可以有意识地帮助学生扩大专业词汇量和帮助学生理解专业描述,进而帮助学生克服双语教学中的最大障碍。这是从根本上解决双语教学对于学生来说较为困难的方式,也唯有真正具备良好的专业英语水平才可以从本质上掌握生物医学信息检索的方法,才能够满足今后的学习和工作的需求。另一方面,对于生物医学数据库的英文界面不熟悉才会增加学生学习的难度。笔者比较困惑的是,在上课之初,一部分同学不太理解starmenu的含义,对于全英文界面的数据库NCBI(NationalCenterforBiotechnologyInformation),ScienceDirect,Highwire,以及软件Endnote初次接触的时候更是如同看天书。这本身并不困难,但是会极大地增加学生的心理压力,所以这需要授课老师对界面进行详细的讲解和介绍,并给予学生足够的时间去熟悉界面,达到能够熟练掌握的水平,消除学生的畏难心理。
2.2循序渐进
为避免在学习过程中,学生出现习得性无助的情况,双语教学一定要采用循序渐进的方式进行。切忌一开始就加重学习任务加大学习难度,这样的结果是多数同学会跟不上老师的进度,产生严重的厌学心理,进而会完全放弃这门课程的学习。教师授课以前需要对学生的英文水平和专业覆盖面有一个大概的解,和学生沟通交流他们的学习兴趣、需求和困难所在,并根据获取的信息结合教学大纲及时调整授课的内容、重点和难点。当学生第一次接触到该门课程的双语学习时,教师需利用其最初的新奇感和参与意识激发同学们的学习兴趣,从简到难的学习进度中,让同学们自主地参与到课程的学习中来,收获到成功的喜悦是进一步深入学习的强大动力。教师在课堂讲授中要循序渐进地增加英语表达的比例,在遇到部分专业词汇时需要做详尽的中文解释;在遇到英文表意较为复杂的情况也需要辅以中文指导,全场和学生保持沟通顺畅,把握教学难点和内容。双语授课不能单纯为英文表达而表达,忽视学生在课堂上专业水平的提升。同时也可以让学生自发组成学习小组,让英语基础比较好的同学带动其他同学的学习,同学之间互相促进互相合作,形成一个良好的互动氛围,从教师的“教”彻底转变为学生的“学”,让所有的同学参与到这个过程中来,避免个别同学落后于集体学习进度的情况。
3结语
双语医学信息检索这门课程既有利于学生英语应用能力的提高,同时也有利于学生专业知识的扩展和深化,可以极大地增强学生在今后的深造和就业中的竞争力。虽然这门课中还存在很多问题有待我们做进一步思考与改进,但是只要我们勇于拓新,这门课一定会发挥其作用、展现其价值。随着高等教育中教育理念的更新,双语教学在医学信息检索教学课中的运用会真正服务于学生,服务于社会。
注释
①肖凤玲.医学信息检索课双语教学探析.科技情报开发与经济,2009.19(36):149-150.
②廖芮等.《医学信息检索与利用》课程双语教学实践优化模式.昆明医科大学学报,2014.35(3):167-170.
【网络信息检索论文】相关文章:
1.信息检索心得体会
2.信息检索心得
3.信息检索报告范文
4.网络信息安全论文
6.检索报告
8.网络信息安全探讨
9.网络舆情信息简报
10.网络信息安全承诺书






文档为doc格式