您好, 欢迎来到 !    登录 | 注册 | | 设为首页 | 收藏本站

使用Python和NumPy的超大型矩阵

使用Python和NumPy的超大型矩阵

PyTables和NumPy是必经之路。

PyTables将以HDF格式(可选压缩)将数据存储在磁盘上。我的数据集经常得到10倍压缩,这在处理数千万或几亿行时非常方便。它也非常快。我5岁的笔记本电脑可以像sql一样执行GROUP BY聚合,处理数据的速度为1,000,000行/秒。对于基于Python的解决方案来说还不错!

再次作为NumPy重新数组访问数据非常简单:

data = table[row_from:row_to]

HDF库负责读取相关的数据块并将其转换为NumPy。

python 2022/1/1 18:25:00 有440人围观

撰写回答


你尚未登录,登录后可以

和开发者交流问题的细节

关注并接收问题和回答的更新提醒

参与内容的编辑和改进,让解决方法与时俱进

请先登录

推荐问题


联系我
置顶