-
Sphinx搜索引擎架构及使用手册(V1.1版本),适用于MySQL结合场景
资源介绍
一、XX网搜索引擎架构设计: 3
1、搜索引擎架构图(基于PHP+MySQL+Sphinx): 3
2、搜索引擎架构设计思路: 3
⑴、调用方式最简化: 3
⑵、创建索引、查询速度快: 3
⑶、按服务类型进行分离: 4
⑷、“主索引+增量索引”更新方式: 4
⑸、“Ext3文件系统+tmpfs内存文件系统”相结合: 4
⑹、中文分词词库: 5
二、MYSQL+SPHINX+SPHINXSE安装步骤: 5
1、安装python支持 5
2、编译安装LibMMSeg 5
3、编译安装MySQL 5.1.26-rc、Sphinx、SphinxSE存储引擎 5
4、创建Sphinx索引文件和MySQL数据文件存放目录 6
5、创建MySQL配置文件(以线上配置文件为准) 6
⑴、创建配置文件/mysql/3306/my.cnf(以db11的3306端口为例) 6
⑵、创建配置文件/mysql/3406/my.cnf(以db11的3406端口为例) 8
6、制作一份MySQL Slave供搜索引擎使用 10
7、创建快捷启动、停止、重启、杀死MySQL进程的脚本(以db11的3306端口为例) 10
三、SPHINX配置: 11
1、生成Sphinx中文分词词库 11
⑴、词典的构造 12
⑵、词典文件格式 12
⑶、XX网搜索引擎的中文分词词库 12
2、创建Sphinx主索引文件、增量索引文件存放目录 12
3、创建Sphinx配置文件 13
4、初始化sphinx.conf中配置的全部索引 13
5、创建两个shell脚本,一个用来创建主索引、一个用来创建增量索引。 13
⑴、主索引更新脚本 13
①、创建脚本build_main_index.sh: 13
②、赋予主索引更新脚本可执行权限: 13
③、每天凌晨定时重建主索引: 13
⑵、增量索引更新脚本 13
①、创建脚本build_delta_index.sh: 13
②、赋予增量索引更新脚本可执行权限: 14
③、每3分钟自动重建一次搜索引擎的增量索引: 14
6、启动Sphinx守护进程(searchd) 14
7、配置服务器开机启动时需要自动执行的命令(以db11为例) 14
8、创建Sphinx存储引擎表: 14
⑴、设置/etc/hosts 14
⑵、登录运行在3306端口的MySQL服务器(提供“搜索查询服务”): 14
⑶、创建数据库“Sphinx”和相对应的Sphinx表(SQL语句): 15
示例SQL: 15
四、如何通过SQL语句调用搜索引擎: 15
1、搜索应用实例 15
⑴、XX网北京出租房搜索 15
⑵、XX网北京小区搜索 15
⑶、在指定字段中搜索(例如在字段“title”中搜索关键字“中关村”) 16
2、SphinxSE存储引擎及SQL语法详细说明 16
- 上一篇: C#爬取某网站数据
- 下一篇: 北京租房数据 五千条无重复