python – 从GoogleAppEngine Model中删除重复项?

我有两个Google App Engine模型.我运行了几次我的cron,现在我的数据存储区中有重复的条目.如果很容易删除我的整个数据存储区并再次上传我的数据,我会的.但是上次上传需要4个小时,所以我想知道在模型中的“标题”字段中是否有快速删除具有重复名称的条目?

解决方法:

快?可能不是.

如果你确实想要删除dupes,我的方法是编写一个remote_api脚本.查询所有实体的模型,按标题排序,并获取100个批次.保留标题的本地Python字典.如果您遇到新标题,请将其添加到字典中.如果遇到已知标题,请将实体添加到删除批处理,并在继续执行下一个查询批处理之前刷新删除.

当您可以清除数据存储区并重新导入时,可能需要进行大量工作.

上一篇:数控AGC实现(转)


下一篇:mysql – 查询从SQL中删除重复项