Coreseek配置指南

更新时间:2023-10-20 03:10:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

Esky 2014年12月31日 12:55:19

Coreseek配置指南

目录

Coreseek配置指南 ............................................................................................................................. 1

1.软件安装 .................................................................................................................................... 2

1.1.安装操作系统 ............................................................................................................. 2 1.2.安装软件 ..................................................................................................................... 2 2.安装测试 ................................................................................................................................. 3

2.1.测试mmseg分词 ..................................................................................................... 3 2.2.测试coreseek搜索 ..................................................................................................... 4 3.修改配置文件 ......................................................................................................................... 4 4.生成索引文件 ......................................................................................................................... 6 5.php调用api文件说明 ........................................................................................................ 7 6.使用phpapi主要代码如下................................................................................................. 8 7.最终效果 .................................................................................................................................. 11 8. Sphinx增量索引 ................................................................................................................... 11

1 / 13

Esky 2014年12月31日 12:55:19

1.软件安装 1.1.安装操作系统

安装centos5.5,操作系统语言选择中文。 安装mysql数据库 #yum install mysql* 安装gcc编译环境 # yum install gcc*

1.2.安装软件

下载coreseek软件

#wget http://www.coreseek.cn/uploads/csft/3.2/coreseek-3.2.14.tar.gz # tar xzvf coreseek-3.2.14.tar.gz # cd coreseek-3.2.14 需要提前安装gcc的编译环境。 安装mmseg # cd mmseg-3.2.14 # ./bootstrap

# ./configure --prefix=/usr/local/mmseg3 //这里的目录为安装位置 # make && make install

2 / 13

Esky 2014年12月31日 12:55:19

安装coreseek # cd csft-3.2.14

# sh buildconf.sh #输出的warning信息可以忽略,如果出现error则需要解决 #./configure --prefix=/usr/local/coreseek --without-unixodbc --with-mmseg --with-mmseg-includes=/usr/local/mmseg3/include/mmseg/ --with-mmseg-libs=/usr/local/mmseg3/lib/ --with-mysql //mmseg的目录一定要和前面的安装的位置相对应 //如果提示mysql问题,可以查看MySQL数据源安装说明 # make && make install

2.安装测试

2.1.测试mmseg分词

需要预先设置好字符集为zh_CN.UTF-8.如果操作系统安装时已经选择中文可以忽略。 [root@localhost coreseek-3.2.14]# cd testpack/ [root@localhost testpack]# pwd /root/coreseek-3.2.14/testpack

[root@localhost testpack]# cat var/test/test.xml //确保正确显示中文

愚人节最佳蛊惑爆料 谷歌300亿美元收购百度 1270131607

据国外媒体报道,谷歌将巨资收购百度,涉及金额高达300亿美元。谷歌借此重返大陆市场。

该报道称,目前谷歌与百度已经达成了收购协议,将择机对外公布。百度的管理层将100%保留,但会将项目缩减,包括有啊商城,以及目前实施不力的凤巢计划。正在进行测

….

3 / 13

Esky 2014年12月31日 12:55:19

[root@localhost testpack]# /usr/local/mmseg3/bin/mmseg -d /usr/local/mmseg3/etc var/test/test.xml

…..

/x /x /x 愚人/x 节/x 最佳/x 蛊惑/x 爆/x 料/x /x 谷/x 歌/x 300/x 亿/x 美元/x 收购/x 百/x 度/x /x

/x /x /x 1270131607/x /x

/x /x /x 据/x 国外/x 媒体/x 报道/x ,/x 谷/x 歌/x 将/x 巨资/x 收购/x 百/x 度/x ,/x 涉及/x 金额/x 高达/x 300/x 亿/x 美元/x 。/x 谷/x 歌/x 借/x 此/x 重返/x 大陆/x 市场/x 。/x

/x /x 该/x 报道/x 称/x ,/x 目前/x 谷/x 歌/x 与/x 百/x 度/x 已经/x 达成/x 了/x 收购 ……

2.2.测试coreseek搜索

[root@localhost]# /usr/local/coreseek/bin/indexer -c etc/csft.conf –all //生成索引

[root@localhost]# /usr/local/coreseek/bin/search -c etc/csft.conf 社工库

…. words:

1. '社': 97517 documents, 98945 hits 2. '工': 73205 documents, 79934 hits 3. '库': 29779 documents, 32015 hits

3.修改配置文件

社工库使用mysql数据库。在使用coreseek之前确保mysql配置正常。可以正常访问。Coreseek的配置文件位置/usr/local/coreseek/etc 修改csft.conf

[root@localhost etc]# cat csft.bak

#

# Minimal Sphinx configuration sample (clean, simple, functional)

4 / 13

Esky 2014年12月31日 12:55:19

#

source src1 {

type = mysql //数据库类型

sql_host = localhost //数据主机 sql_user = root //用户名 sql_pass = centos //密码 sql_db = sgk //数据库名

sql_port = 3306 # optional, default is 3306 sql_query_pre = SET NAMES utf8 // 设定字符 sql_query_info_pre = SET NAMES utf8

sql_query = \\ SELECT id, source, username,password, email,realname,mobile,tel,idcard,qq,others FROM data_1 // 设定查询语句

sql_query_info = SELECT * FROM data_1 WHERE id=$id }

source src2 {

type = mysql sql_host = localhost sql_user = root sql_pass = centos sql_db = sgk

sql_port = 3306 # optional, default is 3306 sql_query_pre = SET NAMES utf8 sql_query_info_pre = SET NAMES utf8 sql_query = \\ SELECT FROM data_2

sql_query_info = SELECT * FROM data_2 WHERE id=$id }

index test1 {

source = src1 source = src2 //多张数据表建立索引

path = /usr/local/coreseek/var/data/test1 //索引文件位置

5 / 13

id,

source,

username,password,

email,realname,mobile,tel,idcard,qq,others\\

本文来源:https://www.bwwdw.com/article/pebf.html

Top