mongodb指南(翻译)(二十) – developer zone – 索引(四)地理信息索引详解大数据

MongoDB支持2维地理信息索引。它被设计用来进行脑海中基于位置的查询,诸如“查找距离我的位置最近的N个场所”。它还可以高效的处理额外的查询条件,比如“查找距离我的位置最近的N个博物馆”。

为了可以使用这种索引,你需要在你的对象中设置一个字段,该字段可以是一个子对象或者前两个元素为x,y坐标的数组(或者y,x-只要一致就行;为了确保一致性,推荐在你的客户端代码中使用保持排序的词典/hashes。)。

一些例子:

{ loc : [ 50 , 30 ] } //SUGGESTED OPTION
{ loc : { x : 50 , y : 30 } }
{ loc : { foo : 50 , y : 30 } }
{ loc : { lon : 40.739037, lat: 73.992964 } }

创建该索引

db.places.ensureIndex( { loc : "2d" } )

默认情况下,该索引假定你在索引经度/维度,并且这些值的范围是[-180,180].

如果你在索引其他东西,你可以指定一些选项:

db.places.ensureIndex( { loc : "2d" } , { min : -500 , max : 500 } )

这会对索引扩容来存储-500到500范围的值。地理信息边界搜索目前是限制在长方形和圆形之内不含边界以外。你不能插入边界[min,max)之外的值。例如,

使用上面的代码,点(-500,500)不能被插入并且会触发一个错误(但是,点(-500,499)是可以的)。

db.places.ensureIndex( { loc : "2d" } , { bits : 26 } )

bits参数设定了2D geo-hash值的精度,存储位置的最小记录。默认情况下,精度设置为26位,这大体等同于(经度,纬度)定位的1步长,默认的边界为(-180,180)。要对拥有更大边界的空间建立索引,可以将位数增大到最大值32.

当前,你仅能为每一个集合创建一个地理信息索引。

模糊大小数组语法仅能使用在不低于V1.9的版本,在“foo.bak”中的“2d”可以引用的内嵌字段类似于:

{ foo : [ { bar : [ ... ] } ] }

这个限制即使在并不是每个文档都有多个位置时依然存在并且数组大小为1.在老版本中,你需要将内嵌位置嵌入到非数组中:

{ foo : { bar : [ ... ] } }

查询

该索引可以用来进行精确查询:

db.places.find( { loc : [50,50] } )

当然,这并不是很有趣。更重要的是查询某个点附近的点,并且不需要精确匹配:

db.places.find( { loc : { $near : [50,50] } } )

上面的查询寻找离(50,50)最近的点并且按距离排序后返回(这里不需要增加排序参数)。使用limit()指定最大返回个数(默认返回100个):

db.places.find( { loc : { $near : [50,50] } } ).limit(20)

你还可以对$near增加一个最大距离的参数:

db.places.find( { loc : { $near : [50,50] , $maxDistance : 5 } } ).limit(20)

所有地理空间查询中的距离同文档坐标系统中的单位一样(除了接下来讨论的球面查询)。例如,如果你索引的区域大小为[300,300),表示一个300*300平米地段,并且你有在(10,20)和(10,30)的两个文档,代表在(x,y)的点,又可以查询这些位置点 $near:[10,20],$maxDistance:10.距离单位和你的坐标系统一样,因此这个查询查找距离该点10米以内的目标点。

联合索引

MongoDB地理信息索引支持可选的从键。如果你经常对地址和其他属性同时查询,可以增加其他属性到该索引。其他属性作为索引的注解,可以让过滤执行的更快。例如:

db.places.ensureIndex( { location : "2d" , category : 1 } );
db.places.find( { location : { $near : [50,50] }, category : 'coffee' } );

geoNear命令

尽管find()函数是通常的首先,MongoDB还是提供了一个执行类似功能的geoNear命令。geoNear命令可以在查询结果中返回每个点距离查询点的距离,也有一些故障诊断信息。

合法的选项有:“near”,”num”,”maxDistance”,”distanceMultiplier”和“query”。

> db.runCommand( { geoNear : "places" , near : [50,50], num : 10 } );
> db.runCommand({geoNear:"asdf", near:[50,50]})
{
"ns" : "test.places",
"near" : "1100110000001111110000001111110000001111110000001111",
"results" : [
{
"dis" : 69.29646421910687,
"obj" : {
"_id" : ObjectId("4b8bd6b93b83c574d8760280"),
"y" : [
1,
1
],
"category" : "Coffee"
}
},
{
"dis" : 69.29646421910687,
"obj" : {
"_id" : ObjectId("4b8bd6b03b83c574d876027f"),
"y" : [
1,
1
]
}
}
],
"stats" : {
"time" : 0,
"btreelocs" : 1,
"btreelocs" : 1,
"nscanned" : 2,
"nscanned" : 2,
"objectsLoaded" : 2,
"objectsLoaded" : 2,
"avgDistance" : 69.29646421910687
},
"ok" : 1
}

上面的命令返回距离(50,50)最近的10个点。(在该集合上面检查2d索引时会自动确定loc字段)

如果你需要增加过滤器,可以这样做:

> db.runCommand( { geoNear : "places" , near : [ 50 , 50 ], num : 10,
... query : { type : "museum" } } );

query可以是任意常规的mongo query。
文章转自:http://www.cnblogs.com/xinghebuluo/archive/2012/01/18/2308753.html

原创文章,作者:ItWorker,如若转载,请注明出处:https://blog.ytso.com/tech/bigdata/9618.html

(0)
上一篇 2021年7月19日 11:26
下一篇 2021年7月19日 11:26

相关推荐

发表回复

登录后才能评论