混合模式下的熊猫数据帧无法序列化为hdf5?

在Pandas中,似乎无法存储混合类型的数据框:

store = HDFStore('play.h5')
df = DataFrame([{'a': 1, 'b': 'hello'}, {'a': 5, 'b': 'world'}])
store.put('df', df, table=True, compression='zlib')

这提供了一个例外:当前无法以表格式存储混合类型的DataFrame对象

这是由于熊猫的某些固有限制还是仅仅是将来的美好生活?鉴于此限制,HDFStore似乎不是很有用,因为许多数据帧都是混合类型的.

解决方法:

表格格式以记录形式存储所有数据,即所有值都存储在单个列中.有一种可以使用的替代表格式(每个DataFrame列一个列),但是我还没有实现.基本上,表格式旨在支持查询

但是,如果执行table = False,则可以存储混合类型的DataFrame.欢迎对这些功能进行更多的工作.

上一篇:2.7 序列化(保存)tensor


下一篇:安装caffe碰到的坑(各种.so未找到)