您好, 欢迎来到 !    登录 | 注册 | | 设为首页 | 收藏本站

Python从HDFS读取文件作为流

Python从HDFS读取文件作为流

您需要xreadlines,它可以从文件读取行而不将整个文件加载到内存中。

现在,我看到了您的问题,您只需要从Popen对象中获取stdout管道即可:

cat = subprocess.Popen(["hadoop", "fs", "-cat", "/path/to/myfile"], stdout=subprocess.PIPE)
for line in cat.stdout:
    print line
python 2022/1/1 18:29:52 有465人围观

撰写回答


你尚未登录,登录后可以

和开发者交流问题的细节

关注并接收问题和回答的更新提醒

参与内容的编辑和改进,让解决方法与时俱进

请先登录

推荐问题


联系我
置顶