Milvus的深度实践是怎样的

这篇文章将为大家详细讲解有关Milvus的深度实践是怎样的,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。

Milvus作为一个开源的分布式向量搜索引擎,凭借其出色的产品设计和工程实现,已被多家不同行业的科技公司融合进各种行业解决方案中。

Milvus向量搜索引擎可以对接包括图片识别,视频处理,声音识别,自然语言处理等深度学习模型,为向量化后的非结构数据提供搜索分析服务。

 

那么,用户是如何使用Milvus呢?

首先用户将通过深度学习模型将非结构化数据转化为特征向量导入Milvus库中,Milvus对特征向量进行存储并建立索引。检索时,先将待搜索的非结构化数据转换为特征向量,然后在Milvus中进行搜索,Milvus将返回搜索结果,再通过特征向量结果找到对应的非结构化数据。

Milvus搜索引擎架构如图

Milvus的深度实践是怎样的
 

基于人脸识别技术的“一人一档”是当前在人像管理中常见的应用场景,通过对道路卡口摄像头采集的数据集进行聚类归档,从而建立人像档案,并将各个档案打上标签,首先是人脸聚类,是指对前端摄像头收集来的人脸照片进行分类,将同一个人的照片聚为一类,然后建立每个人的个人档案。“一人一档”在智慧城市,智能安防等诸多领域都有广泛应用。然而,城市中各个卡口每天收集到的人脸图片数量高达千万级,在庞大的数据集中,要快速又精确的完成对人脸的聚类并非易事。

为了更加高效地完成人脸聚类,云从结合Milvus向量搜索引擎实现了大规模实时人脸聚类,基于动态数据建立一人一档。在其中一款产品的研发场景 中,首先将数千万张人脸图片提取为特征向量,再将转化好的数千万条向量导入Milvus的表中。然后通过Milvus批量搜索功能,对给定的一个批量(N张)的人脸图片向量在导入好的底库中进行搜索,得到底库中分别与这数百张人脸图片相似度为Top-K个人脸,结果集为N*K张人脸,即完成了底库中对这N张人脸图片的初步聚类。

得益于Milvus向量搜索引擎的加速,在数千万级别的图库中,在数秒内就能完成上千张人脸图片的聚类,平均每张人脸图片的聚类只需数十毫秒,同时召回率保持在95%以上。

该场景下的人脸聚类实现流程:

Milvus的深度实践是怎样的    

Milvus的高性能、高召回率有效助力了“人脸聚类,一人一档”的系统建设,能保证档案系统数据的及时更新、保证数据的鲜活性。从而可以充分利用采集到的数据,挖掘数据价值。

关于Milvus的深度实践是怎样的就分享到这里了,希望以上内容可以对大家有一定的帮助,可以学到更多知识。如果觉得文章不错,可以把它分享出去让更多的人看到。

原创文章,作者:Maggie-Hunter,如若转载,请注明出处:https://blog.ytso.com/225693.html

(0)
上一篇 2022年1月8日
下一篇 2022年1月8日

相关推荐

发表回复

登录后才能评论