java-避免使用appengine爆炸索引和实体组写速率限制

我有一个其中有课程,主题和标签的应用程序.每个主题可以位于许多课程中,并具有许多标签.我想查找具有特定标签x且位于特定课程y中的每个主题.

>天真的,我给每个标准列出了课程ID和标签ID,因此我可以从Topic中选择*,其中tagIds = x& courseIds = y.我认为此查询将需要一个爆炸式的索引:具有30个课程和30个标签的我们正在查看〜900个索引条目,对吗?在50 x 20的分辨率下,我远远超过了5000个条目的限制.
>我可以从tagIds = x的Topic中选择*,然后使用for循环遍历结果,仅选择其courseIds.contain(y)的Topic.这将返回比我感兴趣的结果更多的结果,并花费大量时间对这些结果进行反序列化,但是索引仍然很小.
>我可以从tagIds = x的主题中选择__KEY__,并从CourseIds = y的主题中选择__KEY__,然后在我的应用程序代码中找到交集.如果集合很小,这可能不是不合理的.
>我可以创建一种带有tagId和courseId字段的联接表TopicTopLookup.这些实体的父键将指向相关主题.然后,我需要为CourseId x tagId x相关主题ID的每种组合制作一个TopicTagLookup实体.这实际上就像创建我自己的索引一样.它仍然会爆炸,但是不会有5000个条目的限制.但是,现在,我需要将5000个实体写入同一实体组,这将超出实体组的写入速率限制!
>我可以预先计算每个查询. TopicTagQueryCache实体将保存tagId,courseId和List< TopicId>.然后查询看起来就像从TopicTagQueryCache选择*,其中tagId = x&& courseId = y,获取主题ID列表,然后在列表上使用getAllById调用.与#3类似,但每个courseId x tagId只有一个实体.不需要实体组,但是现在我有了这个潜在的庞大清单,可以进行事务维护.

Appengine似乎非常适合您可以预先计算的查询.我只是不太了解一种有效地预先计算此查询的方法.这个问题基本上可以归结为:

什么是组织数据的最佳方法,以便我们可以进行设置操作,例如在课程和标签的交集中查找主题?

解决方法:

您对选项的评估是正确的.不过,如果您不需要任何排序条件,则App Engine数据存储区已使用合并联接策略为您完成了选项3.您只需在选项1中详细说明即可进行查询,而无需任何类型或不等式过滤器,App Engine会在数据存储区内部进行合并联接,并仅返回相关结果.

选项4和5与this talk中记录的关系索引模式相似.

上一篇:在循环中如何在Python上找到数组中元素的索引


下一篇:带有重复索引的增量Numpy多维数组