全文索引(目录)

概念

数据库【存储】|【全文目录】节点是用于保存和管理【全文索引】的节点。全文目录通常是由同一数据库中的零个或多个数据表的全文索引构成的。需要注意的是,只能为每个数据表创建一个全文索引。因此,一旦在某个数据表上创建了全文索引,那么该数据表将只能隶属于一个全文目录。换言之,一个数据库可以包含一个或多个全文目录,一个全文目录可以包含一个或多个全文索引,但一个数据表只能隶属于一个数据库全文目录和全文索引。

使用全文索引的主要步骤如下

(1)首先需要创建全文目录。

(2)然后将需要创建全文索引的数据表中的数据填充到全文目录中。这一过程也被称为填充全文索引。
(3)完成上述两步之后,即可开始使用全文索引功能。

创建全文目录的方法非常简单。通过SSMS以及T-SQL都可以实现创建全文目录的功能。

全文索引的优缺点和注意事项:

(1)全文索引可对char、varchar、nchar、nvarchar、text、ntext、p_w_picpath、xml、varbinary 或 varbinary(max) 类型字段进行检索,是解决海量数据模糊查询的好办法。

(2)一个表只能建立一个全文索引(但可以对多个字段)。
(3)与like的比较 MSDN解释

Like的区别

与全文搜索不同,LIKE Transact-SQL 谓词仅对字符模式(char、varchar、nchar、nvarchar)有效。另外,不能使用 LIKE 谓词来查询格式化的二进制数据。此外,对大量非结构化的文本数据执行 LIKE 查询要比对相同数据执行同样的全文查询慢得多。对数百万行文本数据进行的 LIKE 查询可能需要几分钟的时间才能返回结果;而对于同样的数据,全文查询只需要几秒甚至更少的时间,具体取决于返回的行数及其大小。另一个考虑因素是 LIKE 仅对整个表执行简单模式扫描。相反,全文查询可识别语言,它在索引和查询时应用特定的转换,例如,筛选非索引字并进行同义词库和变形扩展。这些转换可帮助 全文查询改进其撤回以及结果的最终排名

全文索引的用法:

全文检索语句主要有CONTAINSFREETEXT

(1)CONTAINS语句的功能是在表的所有列或指定列中搜索:一个字或短语;一个字或短语的前缀;与一个字相近的另一个字;一个字的派生字;一个重复出现的字。CONTAINS是基于全文索引进行查询的,查询结果受系统全文索引分词的方法影响查询结果会不全

(2)FREETEXT语句的功能是在一个表的所有列或指定列中搜索一个自由文本格式的字符串,并返回与该字符串匹配的数据行。所以,FREETEXT语句所执行的功能又称做自由式全文查询。

T-SQL语句

SELECT *  FROM  dbo.test WHERE CONTAINS(d,'基数行')

 

====================================示例=========================================

--检查数据库test是否支持全文索引,如果不支持

--则使用sp_fulltext_database 打开该功能

if(select databaseproperty('test','isfulltextenabled'))=0

  execute sp_fulltext_database 'enable'

go

--建立全文目录fulltext_News

execute sp_fulltext_catalog 'fulltext_News','create'

go

--News表建立全文索引数据元

execute sp_fulltext_table 'News','create','fulltext_News','PK_News'

go

--设置全文索引列名

execute sp_fulltext_column 'News','Title','add'

execute sp_fulltext_column 'News','ContentIndex','add'

go

--建立全文索引

--activate,是激活表的全文检索能力,也就是在全文目录中注册该表

execute sp_fulltext_table 'News','activate'

go

--填充全文索引目录

execute sp_fulltext_catalog 'fulltext_News','start_full'

go

--检查全文目录填充情况

While fulltextcatalogproperty('fulltext_News','populateStatus')<>0

begin

--如果全文目录正处于填充状态,则等待30秒后再检测一次

waitfor delay '0:0:30'

end

 

dbcc dropcleanbuffers

set statistics time on

select * from News where Title like '%%'--时间:16593,记录:10207

select * from News where charindex('',Title)>0--时间:17210,记录:10207

select * from News where CONTAINS(Title,'') and id=588158005105--时间:2313,记录:774

select * from News where FREETEXT(Title,'')--时间:2295,记录:774

 

参考文档:http://www.jb51.net/article/43796.htm