我有两个Google App Engine模型.我运行了几次我的cron,现在我的数据存储区中有重复的条目.如果很容易删除我的整个数据存储区并再次上传我的数据,我会的.但是上次上传需要4个小时,所以我想知道在模型中的“标题”字段中是否有快速删除具有重复名称的条目?
解决方法:
快?可能不是.
如果你确实想要删除dupes,我的方法是编写一个remote_api脚本.查询所有实体的模型,按标题排序,并获取100个批次.保留标题的本地Python字典.如果您遇到新标题,请将其添加到字典中.如果遇到已知标题,请将实体添加到删除批处理,并在继续执行下一个查询批处理之前刷新删除.
当您可以清除数据存储区并重新导入时,可能需要进行大量工作.