您正在查看 "Database" 分类下的文章
2008年01月17日 星期四 15:59
除了硬件资源 [如内存(3GB 限制)、磁盘速度和 CPU 速度] 以外,全文搜索性能还受到 Microsoft SQL Server 和 Microsoft Full-Text Engine for SQL Server (MSFTESQL) 服务对这些资源的争用情况的影响。MSFTESQL 服务只对磁盘进行写操作,而 SQL Server 会对磁盘进行读写操作。从性能角度出发,关键是很好地优化 MSFTESQL 服务,以便获得最佳使用效果。
全文搜索性能包含两个方面:
全文索引性能
|
2008年01月17日 星期四 15:21
Microsoft SQL Server 2005 中的全文搜索由 Microsoft Full-Text Engine for SQL Server (MSFTESQL) 服务提供支持。MSFTESQL 服务有两个角色,即索引支持和查询支持。
全文搜索的组件
全文搜索的体系结构由下列组件构成:
Microsoft Full-Text Engine for SQL Server (MSFTESQL)
Microsoft Full-Text Engine Filter Daemon (MSFTEFD),它包含下列组件:
|
2008年01月17日 星期四 15:14
当 varbinary(max) 或 image 列中某一单元包含带有特定文件扩展名的文档时,全文搜索会使用筛选器来解释二进制数据。筛选器会从文档中提取文本化信息并将其提交用于建立索引。
使用 sys.fulltext_document_types 目录视图可标识 Microsoft SQL Server 2005 实例中所包含的筛选器列表。许多类型的文档可以存储在单个 varbinary(max) 或 image 列中。对于每个文档,SQL Server 根据文件扩展名来选择正确的筛选器。由于当文件存储在 varbinary(max) 或 image 列中时其文件扩展名不可见,因此文件扩展名 |
2008年01月17日 星期四 15:10
断字符和词干分析器用于对所有全文索引数据执行语言分析。语言分析将涉及到查找词边界(断字)和组合动词(词干分析)。语言分析规则因语言而异,可以为每个全文索引列指定不同的语言。每种语言的断字符能够使得为该语言生成的词更加准确。如果断字符用于整个语系而不是特定的子语言,将使用该语系中的主要语言。例如,使用法语断字符来处理加拿大法语文本。如果某一特定语言没有可用的断字符,将使用非特定语言断字符。使用非特定语言断字符时,词将在非特定语言字符(如空格和标点符号)处断开。
Microsoft SQL Server |
2008年01月17日 星期四 14:25
全文索引是一种特殊类型的基于标记的功能性索引,由 Microsoft SQL Server 全文引擎 (MSFTESQL) 服务创建和维护。创建全文索引的过程与创建其他类型的索引的过程差别很大。MSFTESQL 不是基于某一特定行中存储的值来构造 B 树结构,而是基于要索引的文本中的各个标记来创建倒排、堆积且压缩的索引结构。
创建和维护全文索引的过程称为"索引填充"。Microsoft 支持下列全文索引填充:
|
|
|