将大量的XML数据导入到Google App Engine中

问题描述:

我想要导入到App Engine数据存储中的XML数据量相当大(约为200MB)。将大量的XML数据导入到Google App Engine中

到目前为止,我已经尝试创建模型并使用cElementTree解析器来加载实体,但这需要很长时间。

我也担心数据存储如何处理这么多的数据,以及是否有更好的方法。

所以我的问题是,什么是解析XML到App Engine的最快方式,是否有更好的后端,将处理存储数十万个实体/记录。

+1

App Engine的数据存储可以处理那么多的数据。你需要考虑的是你的数据需要什么索引,因为不需要的索引会减慢写入速度并增加你的存储需求。 您正在写入本地主机的数据存储(dev_appserver)还是远程数据存储?因为除非您使用sqllite选项,否则本地数据存储将非常缓慢。 – Calvin 2011-02-22 21:27:13

+0

很高兴知道。我目前正在使用本地开发服务器,所以这就是为什么它很慢。 – 2011-02-22 21:28:54

我会去支持从XML源读取数据的Bulk Loader
关于XML的大小,Datastore完全没有问题来处理这种数据量。

+2

本网站提供了一个使用bulkloader和xml数据的示例:http://bulkloadersample.appspot.com/(同样,底部链接的视频也很有用) – Calvin 2011-02-22 21:42:10