SQLServer2008中全文检索的实现
更新时间:2023-08-06 09:07:01 阅读量: 实用文档 文档下载
学术论坛
数字技术与应用
SQL Server2008中全文检索的实现
邓宪丽
(大庆油田有限责任公司 第九采油厂信息中心 黑龙江大庆 163853)
摘 要:本文介绍了在SQL Server2008中实现全文检索的过程、方法,为开发人员提供参考借鉴。关键词:全文索引 SQL Server2008 image字段中图分类号:TP399文献标识码:A文章编号:1007-9416(2010)12-0105-01
1 引言
随着计算机的普及和网络技术的发展,我厂的生产管理、数据查询、公文流转等大都实现了计算机管理,方便了信息交流与共享,提高了生产效率。但是,目前针对散落在个人、单位电脑中的WORD文档、电子表格以及多媒体汇报(PPT)文档等还没有一套完整的管理系统,既造成了存储资源的浪费,又不利于资源的共享。因此,需要一个文档信息管理系统,把这些分散的文档集中存储到数据库中,为用户提供一个统一的、可以多方式检索的平台,方便用户进行科学、高效地获取信息。
而对存储在数据库中的大量非结构化的文档数据进行查询时,通过普通的SQL语句是无法实现的(不能使用LIKE谓词来查询格式化的二进制数据);即使是非二进制的普通类型字段查询,对数百万行文本数据执行的 LIKE 查询可能需要花费几分钟时间才能返回结果;但对同样的数据,全文索引查询只需要几秒或更少的时间。因此要实现一个能够快速实现检索的文档管理平台,有必要应用全文检索技术。
择“定义全文索引”,进入全文索引向导对话框。
第四步,选择将要对其进行全文索引的列。
第五步,选择数据发生变化时,全文索引的更新方式。这里选择自动,以保证更改的数据随时会被检索到。
第六步,全文目录的作用是存储全文索引,要创建全文索引必须先创建全文目录。
第七步,定义填充计划可以添加或修改确定何时填充或重新填充全文目录的计划。第八步,完成全文索引向导。
以上是建立全文索引的全过程。完成建立后,使用全文索引语句,即可以对其进行全文检索。
4 全文索引语句CONTAINS和FREETEXT的使用
SQL Server 2008提供的全文索引语句主要有CONTAINS和FREETEXT。CONTAINS语句的功能是在表的所有列或指定列中搜索:词或短语、词或短语的前缀、另一个词附近的词、由另一个词的词尾变化生成的词(例如,词drive是drives、drove、driving和driven词尾变化的词干、比另一个词具有更高加权的词。
CONTAINS语句的语法格式为:
CONTAINS({column | *}), <contains_search condition>)
其中,column是搜索列,使用“*”时说明对表中所有全文索引列进行搜索。Contains_search_ condition 说明CONTAINS语句的搜索内容,其语法格式为:
{<simple_term>|<prefix_term>|<proximity_term>|<generation_term>|<weighted_term>}[{{AND|AND NOT|OR}<contains_search_condition>}] [...n]
下面就simple_term和prefix_term参数做简要说明:
simple_term是CONTAINS语句所搜索的单字或短语,当搜索的是一个短语时,必须使用双引号作为定界符。其格式为:
‘word’{“ phrase”|}
prefix_term说明CONTAINS语句所搜索的字或短语前缀,其格式为:
{“word*” | “phrase*”}
FREETEXT语句的功能是在一个表的所有列或指定列中搜索一个自由文本格式
2 全文索引简介
全文索引是以文本数据为主要处理对象,提供根据数据资料的内容来实现的信息检索。全文搜索通常用于基于Web的应用程序、文档管理系统以及自定义应用程序,以便对存储在数据库中的数据提供文本搜索功能。
Microsoft公司开发的SQL Server 2008是一款面向高端的数据库系统,它继承了SQL SERVER以前版本的一些强大的优势,界面更加友好。它的全文索引功能配置简单、使用方便,为索引和查询数据库中存储的结构化和非结构化文本数据提供了可靠、快速而灵活的方法。
的字符串,并返回与该字符串匹配的数据行。所以,FREETEXT语句所执行的功能又称做自由式全文查询。 使用 FREETEXT 谓词可以输入单词或短语的任意集合,甚至一个完整的句子。全文查询引擎将检查该文本,标识出所有重要的单词和名词短语,并
用这些条件在内部构造一个查询。
FREETEXT语句的语法格式为:FREETEXT({column | * },‘freetext_string’)
其中,column是被搜索列,使用“*”时说明对表中的所有全文索引列进行搜索。Freetext_string参数指出所搜索的自由文本格式字符串。
CONTAINS、FREETEXT作为谓词可直接用在WHERE子句的条件中,两者的区别在于CONTAINS对所查询的所有词语执行完全匹配查询而FREETEXT则执行词根查询(如搜索 “root beer”时,系统将返回至少与“ root”和 “beer”这些词语之一匹配的所有行)。
以下是在.net2008中,对用main_files 表的image字段file_body进行全文检索的实现。查询语句为selectfile_id,file_name,file_typefrom main_files where contains(file_body,‘总结’)
5 结语
相对于“google”、“百度”这些价格昂贵、架构复杂的搜索引擎来讲,本文介绍的全文索引功能要简单,但是实现方便、成本低廉,并且完全可以满足企业级的需求。另外,本文只介绍了在SQL Server2008中如何实现全文索引,在其他数据库引擎中同样可以实现,如ORACLE,用户可根据需要自行选择。作者简介:邓宪丽,女,助理工程师,2006年毕业于大庆石油学院石油工程专业,毕业后从事计算机工作。
3 全文索引实现过程
下面以多媒体信息管理平台为例,详细介绍一下全文索引的实现方法。
第一步,登陆SQL Server 2008服务器第二步,在SQL Server中建立一个使用全文索引的数据库dmtpt,要选中使用全文索引选项。在该数据库中建立一个存储文档文件的表main_files。
第三步,在main_files表上点击右键,选
Digital technology and application 数字技术与应用105
正在阅读:
苏教版 3 年级上册同步作文训练04-29
SAS课程设计报告12-31
八年级物理第五章透镜及其应用复习提纲 - 随堂练习 - 单元测试10-06
2021幼儿园大班下学期教学计划报告05-20
2014版无纺布专用料项目(立项及贷款用)可行性研究报告编制机构04-29
美国“天定命运论”浅析04-22
招聘启事格式02-17
proguard使用指南12-17
北碚区矿产资源总体规划05-03
- 教学能力大赛决赛获奖-教学实施报告-(完整图文版)
- 互联网+数据中心行业分析报告
- 2017上海杨浦区高三一模数学试题及答案
- 招商部差旅接待管理制度(4-25)
- 学生游玩安全注意事项
- 学生信息管理系统(文档模板供参考)
- 叉车门架有限元分析及系统设计
- 2014帮助残疾人志愿者服务情况记录
- 叶绿体中色素的提取和分离实验
- 中国食物成分表2020年最新权威完整改进版
- 推动国土资源领域生态文明建设
- 给水管道冲洗和消毒记录
- 计算机软件专业自我评价
- 高中数学必修1-5知识点归纳
- 2018-2022年中国第五代移动通信技术(5G)产业深度分析及发展前景研究报告发展趋势(目录)
- 生产车间巡查制度
- 2018版中国光热发电行业深度研究报告目录
- (通用)2019年中考数学总复习 第一章 第四节 数的开方与二次根式课件
- 2017_2018学年高中语文第二单元第4课说数课件粤教版
- 上市新药Lumateperone(卢美哌隆)合成检索总结报告
- 全文检索
- SQLServer2008
- 实现
- 石材干挂件种类介绍
- 中北大学图书馆学科馆员制度建设研究
- 科目四个人小结,可能有用
- 梦幻西游跑商终极方法
- 2017年安徽省二级建造师继续教育建筑工程主项选修试题及个人答案
- 2005年江苏省造价员考试土建案例试题解析
- 聚乳酸-羟基乙酸导管移植修复坐骨神经损伤后的力学特性分析
- 常用材料的热物性值
- 防护员防护知识培训
- 长江之歌导学案
- 两委换届选举开展“结对共建、和谐换届”活动总结
- 有趣的股市比喻
- 路长全经典语录-教学范文
- 中国商业银行市场营销分析
- 工厂初期验货报告表格
- 老年糖尿病合并心脑血管疾病的危险因素分析
- 复数的三角形式及乘除运算
- 《庐陵文化读本》知识竞赛
- 汽车超级大全(介绍和标志)
- 新闻传播硕士专硕《新闻与传播专业基础》北大考研真题