Django_haystack全文搜索


haystack是全文搜索的框架,支持whoosh、solr、Xapian、Elasticsearc四种全文检索引擎,点击查看官方网站

whoosh是用纯Python编写的全文搜索引擎,虽然性能比不上sphinx、xapian、Elasticsearc等,但是无二进制包,程序不会莫名其妙的崩溃,对于小型的站点,whoosh已经足够使用,点击查看whoosh文档

jieba是一款免费的中文分词包,如果觉得不好用可以使用一些收费产品。

一、全文搜索配置

1)在环境中安装依赖包

pip install django-haystack
pip install whoosh
pip install jieba

2)在项目配置文件settings.py中注册应用

INSTALLED_APPS = (
    ...
    'haystack',
)

3)在项目配置文件settings.py中指定搜索引擎

# haystack全文搜索配置
HAYSTACK_CONNECTIONS = {
    'default': {
        # 使用whoosh引擎
        'ENGINE': 'haystack.backends.whoosh_backend.WhooshEngine',
        # 索引文件存储路径
        'PATH': os.path.join(BASE_DIR, 'whoosh_index'),
    }
}

# 当添加、修改、删除数据时,自动生成索引
HAYSTACK_SIGNAL_PROCESSOR = 'haystack.signals.RealtimeSignalProcessor'
# 修改haystack 默认返回数据量。默认20
HAYSTACK_SEARCH_RESULTS_PER_PAGE = 1

4)在项目的urls.py中添加路由

path('search/', include('haystack.urls'))

Django_haystack全文搜索

5)在haystack中使用jieba分词包

修改haystack源码包目录下的 ./backends/whoosh_backend.py文件

from jieba.analyse import ChineseAnalyzer
#将StemmingAnalyzer()替换为 ChineseAnalyzer()
schema_fields[field_class.index_fieldname] = TEXT(stored=True, analyzer=StemmingAnalyzer()), field_boost=field_class.boost, sortable=True)

Django_haystack全文搜索

二、生成索引文件

1)在需要进行全文搜索的模型类同目录下,新建一个search_indexes.py文件(注:文件名称不能自定义),在其中定义

from haystack import indexes

# 导入需要创建索引的模型类
from apps.goods.models import GoodsSKU


class GoodsSKUIndex(indexes.SearchIndex, indexes.Indexable):
    # 索引字段 use_template=True指定根据表中的哪些字段建立索引文件的说明放在一个文件中
    text = indexes.CharField(document=True, use_template=True)

    def get_model(self):
        # 返回创建索引模型类
        return GoodsSKU

    # 建立索引的数据
    def index_queryset(self, using=None):
        return self.get_model().objects.all()

2)在templates下面新建目录search/indexes/goods,其中search/indexes/为固定名称,goods为创建索引模型类对应的应用名称。

并在目录下新建一个文件goodssku_text.txt,goodssku为模型类小写,后面部分为固定名称。

Django_haystack全文搜索

 

 

3)在goodssku_text.txt文件中指定索引字段

# 指定索引的字段
{{ object.name }}   # object为固定值,可以看成是模型类的实例
{{ object.desc }}
{{ object.goods.detail }}

4)使用命令生成索引文件

python manage.py rebuild_index

Django_haystack全文搜索

 

 

索引文件存储在settings中配置的目录下,即whoosh_index

Django_haystack全文搜索

 

三、使用全文搜索

 

原创文章,作者:Maggie-Hunter,如若转载,请注明出处:https://blog.ytso.com/268376.html

(0)
上一篇 2022年6月19日
下一篇 2022年6月19日

相关推荐

发表回复

登录后才能评论