关于PostgreSQL JSONB的匹配和交集问题(在线怀孕咨询医生)学到了

随心笔谈3年前发布 admin
235 0 0

文章摘要

这篇文章介绍了PostgreSQL的JSONB数据类型及其匹配操作符@>的使用方法。@>用于判断右参数是否是左参数的子图,适用于匹配JSON数据的子结构。例如,`?column?`可以匹配包含在其父节点中的字段。文章通过多个示例展示了@>操作符的使用场景,强调了其与传统子图匹配的区别。 此外,文章还介绍了@|操作符,用于检查两个JSONB字段的交集,即两者是否存在共同的关键字。通过这些操作符,可以高效地处理复杂的JSON匹配逻辑,并结合GIN索引提升查询性能。文章还提到,@>操作符特别适合标签匹配和树状数据的查询,例如在NLP任务中根据标签快速检索相关数据。 需要注意的是,@>操作符仅在右参数是左参数的真子集时才匹配成功,这为开发者提供了强大的数据处理能力。文章最后提到,虽然JSONB功能丰富,但使用过程中仍需注意其局限性,例如无法处理非空交集的条件查询,此时可能需要使用@|操作符或其他方法。



PostgreSQL 自从支持 JSONB 到现在,已经有十余年,这十多年来,社区为 JSONB 提供了很多强大的功能。就我个人而言,其实最常用的还是匹配操作  。

把JSON数据看作一个抽象语法树(AST)的话,这个操作符判断右参数是不是左参数的子图。

这里本来应该有个图示, 但是周末的时候临时有个数据集在处理,所以没有时间去找合适的工具了。简单举几个例子,下面这个例子得到true,这应该很好理解:

select ” ;
————–
t

而它也可以匹配更复杂的情况,下面这个例子也是 true:

select ”;
?column?
———-
t
(1 row)

下面这个例子可能新用户会有点儿迷惑,但是其实也很好的契合了这个规则:

select ”;
?column?
———-
t
(1 row)

但是应该注意的是,下面这个例子结果是 false:

select ”;
?column?
———-
f
(1 row)

这也不难理解, 和  不相等。

下面这个例子比较有意思:

select ”;
?column?
———-
t
(1 row)

这里要注意的是,比较一个 JSON 数组是否匹配另一个时,它并不要求两个数组的顺序相等,只要右边是左边的真子集就可以:

select ”;
?column?
———-
t
(1 row)

这个规则契合了PostgreSQL的倒排索引,PostgreSQL的gin索引,JSONB 字段类型和匹配操作 @> 成为了一个非常有力的组合。在过去几年里,我习惯为一些重要的业务表加上一个类型为 JSONB 的meta 字段,并对其建立 gin 索引

create index idx_xxx_meta on xxx using(gin);

需要注意的是指定索引类型时的 create index 语法。

这样的设计可以解决很多传统上难以解决的问题,例如我可以给每个条目打上一个 tag 列表,取带有某几个 tag 的条目就是一个简单的匹配查询:

select xxx from data_table where meta @> ”

因为有gin索引的帮助,这个搜索的性能足够常规的互联网应用所需。

甚至我的在 CSDN NLP 组的同事还挖掘出了新的用法。我们在一个存储树节点的表里,保存了一个 meta 字段,其中有一个 path 列表,存储当前字段在树中的路径,它的每一项都是 这样的结构,而我们搜索某一个节点下面的所有子节点,包括其隔代的子节点时,仅需要执行这样一个查询:

select xxx from tree_node where meta @> ”

当然这个匹配操作也有它的限制,它在右边是左边的真子图的情况下才会匹配成功。例如我希望查找 tags 列表中包含我搜索项中的任何一个(即两者存在非空交集)的情况,用这种方法就不行了。此时我们需要另一个运算符 

select ‘[“tag1”, “tag2”, “tag3”]’::jsonb ?| ‘{tag2, tag3}’;
?column?
———-
t
(1 row)

select ‘[“tag1”, “tag2”, “tag3”]’::jsonb ?| ‘{tag2, tag3, tag5}’;
?column?
———-
t
(1 row)

select ‘[“tag1”, “tag2”, “tag3”]’::jsonb ?| ‘{tag5}’;
?column?
———-
f
(1 row)

注意这几个例子,首先右边的运算符不再是jsonb,而必须是 ,其次它其实是检查 key 值——也就是可以通过 gin 索引存储的值:

select ”;
?column?
———-
t
(1 row)

PostgreSQL 支持 JSON 和 JSONB 已经有十余年,每一个版本都在积极的增强其 JSON 数据处理能力,即使我近十年来的积极探索和学习,也没有全面的了解。这个交集运算也是近期在 NLP 组的工作过程中才注意到的。

到此这篇关于PostgreSQL JSONB的匹配和交集的文章就介绍到这了,更多相关PostgreSQL JSONB内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

您可能感兴趣的文章:利用Mybatis向PostgreSQL中插入并查询JSON字段postgresql的jsonb数据查询和修改的方法postgresql 实现修改jsonb字段中的某一个值对Postgresql中的json和array使用介绍如何获取PostgreSQL数据库中的JSON值教你在PostgreSql中使用JSON字段的方法

© 版权声明

相关文章