将多个JSON记录读取到Pandas数据框中

注意：（read_json自0.19.0开始）现在支持行分隔的json ：

In [31]: pd.read_json('{"a":1,"b":2}\n{"a":3,"b":4}', lines=True)
Out[31]:
   a  b
0  1  2
1  3  4

或使用文件/文件路径而不是json字符串：

pd.read_json(json_file, lines=True)

这将取决于您DataFrames的大小，该大小会更快，但是另一种选择是用于str.join将多行“ JSON”（注意：它不是有效的json）粉碎为有效的json并使用read_json：

In [11]: '[%s]' % ','.join(test.splitlines())
Out[11]: '[{"a":1,"b":2},{"a":3,"b":4}]'

对于这个小例子，它的速度较慢，如果大约100，则更大，这是相似的，可观的收益…

In [21]: %timeit pd.read_json('[%s]' % ','.join(test.splitlines()))
1000 loops, best of 3: 977 µs per loop

In [22]: %timeit l=[ json.loads(l) for l in test.splitlines()]; df = pd.DataFrame(l)
1000 loops, best of 3: 282 µs per loop

In [23]: test_100 = '\n'.join([test] * 100)

In [24]: %timeit pd.read_json('[%s]' % ','.join(test_100.splitlines()))
1000 loops, best of 3: 1.25 ms per loop

In [25]: %timeit l = [json.loads(l) for l in test_100.splitlines()]; df = pd.DataFrame(l)
1000 loops, best of 3: 1.25 ms per loop

In [26]: test_1000 = '\n'.join([test] * 1000)

In [27]: %timeit l = [json.loads(l) for l in test_1000.splitlines()]; df = pd.DataFrame(l)
100 loops, best of 3: 9.78 ms per loop

In [28]: %timeit pd.read_json('[%s]' % ','.join(test_1000.splitlines()))
100 loops, best of 3: 3.36 ms per loop

注意：那时联接速度非常快。

其他 2022/1/1 18:15:44 有509人围观

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节

关注并接收问题和回答的更新提醒

参与内容的编辑和改进，让解决方法与时俱进

请先登录

推荐问题

使用Jenkins管道将多个git repos签出到同一作业中

使用Jenkins管道将多个git repos签出到同一作业中

其他 2022-01-01 738
将多个PDF文件合并/转换为一个PDF

将多个PDF文件合并/转换为一个PDF

其他 2022-01-01 616
如何将多行bash代码粘贴到终端中并一次运行？

如何将多行bash代码粘贴到终端中并一次运行？

其他 2022-01-01 520
在没有DTYPE列的情况下将多个类映射到Hibernate中的表

在没有DTYPE列的情况下将多个类映射到Hibernate中的表

其他 2022-01-01 603
如何将多个PNG合并为一个大PNG文件？

如何将多个PNG合并为一个大PNG文件？

其他 2022-01-01 568
使用jQuery的$ .ajax（）将多个Json对象作为数据传递

使用jQuery的$ .ajax（）将多个Json对象作为数据传递

JS 2022-01-01 506
在Node.js中将多个文件写入循环

在Node.js中将多个文件写入循环

Node 2022-01-01 626
一次将多个文件上传到Struts2 @Action

一次将多个文件上传到Struts2 @Action

其他 2022-01-01 560
可以使用fopen将多个进程追加到文件中，而没有任何并发??问题吗？

可以使用fopen将多个进程追加到文件中，而没有任何并发??问题吗？

其他 2022-01-01 523
将多个JSON记录读取到Pandas数据框中

将多个JSON记录读取到Pandas数据框中

其他 2022-01-01 509
将多字节字符串截断为n个字符

将多字节字符串截断为n个字符

其他 2022-01-01 524
通过套接字将多个客户端编程到一台服务器

通过套接字将多个客户端编程到一台服务器

其他 2022-01-01 577
MySQL将多行连接为列

MySQL将多行连接为列

MySQL 2022-01-01 541
如何在Tomcat中将多个上下文映射到同一个war文件？

如何在Tomcat中将多个上下文映射到同一个war文件？

其他 2022-01-01 515
通过jQuery ajax（）将多个复选框数据发送到PHP

通过jQuery ajax（）将多个复选框数据发送到PHP

php 2022-01-01 487
将多个PHP变量传递给shell_exec（）？

将多个PHP变量传递给shell_exec（）？

php 2022-01-01 487
将多个文件添加到目录中时，FileSystemWatcher的文件访问错误

将多个文件添加到目录中时，FileSystemWatcher的文件访问错误

其他 2022-01-01 497
使用Java使用iText将多个图像添加到单个pdf文件中

使用Java使用iText将多个图像添加到单个pdf文件中

java 2022-01-01 545
将多个源ArrayList同步到单个目标列表中

将多个源ArrayList同步到单个目标列表中

其他 2022-01-01 542
Java：使用PreparedStatement将多行插入MySQL

Java：使用PreparedStatement将多行插入MySQL

MySQL 2022-01-01 508

将多个JSON记录读取到Pandas数据框中

撰写回答

推荐问题

使用Jenkins管道将多个git repos签出到同一作业中

将多个PDF文件合并/转换为一个PDF

如何将多行bash代码粘贴到终端中并一次运行？

在没有DTYPE列的情况下将多个类映射到Hibernate中的表

如何将多个PNG合并为一个大PNG文件？

使用jQuery的$ .ajax（）将多个Json对象作为数据传递

在Node.js中将多个文件写入循环

一次将多个文件上传到Struts2 @Action

可以使用fopen将多个进程追加到文件中，而没有任何并发??问题吗？

将多个JSON记录读取到Pandas数据框中

将多字节字符串截断为n个字符

通过套接字将多个客户端编程到一台服务器

MySQL将多行连接为列

如何在Tomcat中将多个上下文映射到同一个war文件？

通过jQuery ajax（）将多个复选框数据发送到PHP

将多个PHP变量传递给shell_exec（）？

将多个文件添加到目录中时，FileSystemWatcher的文件访问错误

使用Java使用iText将多个图像添加到单个pdf文件中

将多个源ArrayList同步到单个目标列表中

Java：使用PreparedStatement将多行插入MySQL

分类汇总

您的鼓励是对我最大的支持