从json中的脚本输出中抓取

您需要手动设置FEED_FORMAT和FEED_URI设置：

settings.overrides['Feed_FORMAT'] = 'json'
settings.overrides['Feed_URI'] = 'result.json'

如果要将结果放入变量中，可以定义一个 Pipeline将项目收集到列表中的类。使用spider_closed信号处理程序查看结果：

import json

from twisted.internet import reactor
from scrapy.crawler import Crawler
from scrapy import log, signals
from scrapy.utils.project import get_project_settings


class MyPipeline(object):
    def process_item(self, item, spider):
        results.append(dict(item))

results = []
def spider_closed(spider):
    print results

# set up spider    
spider = TestSpider(domain='mydomain.org')

# set up settings
settings = get_project_settings()
settings.overrides['ITEM_PIPELINES'] = {'__main__.MyPipeline': 1}

# set up crawler
crawler = Crawler(settings)
crawler.signals.connect(spider_closed, signal=signals.spider_closed)
crawler.configure()
crawler.crawl(spider)

# start crawling
crawler.start()
log.start()
reactor.run()

仅供参考，看看Scrapy如何解析命令行参数。

其他 2022/1/1 18:15:42 有348人围观

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节

关注并接收问题和回答的更新提醒

参与内容的编辑和改进，让解决方法与时俱进

请先登录

推荐问题

从Servlet内检索从JSON发送为JSON的数据

从Servlet内检索从JSON发送为JSON的数据

Jave 2022-01-01 736
如何从javascript中的Razor Model对象获取JSON对象

如何从javascript中的Razor Model对象获取JSON对象

javascript 2022-01-01 696
从Java启动Windows服务

从Java启动Windows服务

java 2022-01-01 695
从javascript对象访问父对象的父对象

从javascript对象访问父对象的父对象

javascript 2022-01-01 679
是否可以从JSP下载二进制文件？

是否可以从JSP下载二进制文件？

其他 2022-01-01 586
从Java中的.p12文件获取PrivateKey对象

从Java中的.p12文件获取PrivateKey对象

java 2022-01-01 607
从jsp输出中删除空格

从jsp输出中删除空格

其他 2022-01-01 619
从jquery $ .ajax到angular $ http

从jquery $ .ajax到angular $ http

JS 2022-01-01 615
如何将参数从JQuery传递到ASP.NET WebMethod？

如何将参数从JQuery传递到ASP.NET WebMethod？

dotnet 2022-01-01 657
Gson-从Json转换为类型化ArrayList

Gson-从Json转换为类型化ArrayList

其他 2022-01-01 659
如何将数组列表从jsp发送到servlet

如何将数组列表从jsp发送到servlet

Jave 2022-01-01 575
我如何从Jenkins中的提交消息中获取JIRA发行号

我如何从Jenkins中的提交消息中获取JIRA发行号

其他 2022-01-01 696
无法从JSP访问WEB-INF下定义的CSS文件

无法从JSP访问WEB-INF下定义的CSS文件

CSS 2022-01-01 591
如何从JSON字符串自动生成C＃类文件

如何从JSON字符串自动生成C＃类文件

c# 2022-01-01 625
从Javascript对象中选择随机属性

从Javascript对象中选择随机属性

javascript 2022-01-01 572
如何从JPA persistence.xml外部化属性？

如何从JPA persistence.xml外部化属性？

其他 2022-01-01 600
从JPA 2.1开始，如何命名ManyToOne引用的外键约束？

从JPA 2.1开始，如何命名ManyToOne引用的外键约束？

其他 2022-01-01 592
如何从Java验证HTML？

如何从Java验证HTML？

java 2022-01-01 585
从Jenkins Workflow（Pipeline）插件获取登录Jenkins的用户名

从Jenkins Workflow（Pipeline）插件获取登录Jenkins的用户名

其他 2022-01-01 575
使用DAO将值从Java类传递到jsp页面

使用DAO将值从Java类传递到jsp页面

java 2022-01-01 587

从json中的脚本输出中抓取

撰写回答

推荐问题

从Servlet内检索从JSON发送为JSON的数据

如何从javascript中的Razor Model对象获取JSON对象

从Java启动Windows服务

从javascript对象访问父对象的父对象

是否可以从JSP下载二进制文件？

从Java中的.p12文件获取PrivateKey对象

从jsp输出中删除空格

从jquery $ .ajax到angular $ http

如何将参数从JQuery传递到ASP.NET WebMethod？

Gson-从Json转换为类型化ArrayList

如何将数组列表从jsp发送到servlet

我如何从Jenkins中的提交消息中获取JIRA发行号

无法从JSP访问WEB-INF下定义的CSS文件

如何从JSON字符串自动生成C＃类文件

从Javascript对象中选择随机属性

如何从JPA persistence.xml外部化属性？

从JPA 2.1开始，如何命名ManyToOne引用的外键约束？

如何从Java验证HTML？

从Jenkins Workflow（Pipeline）插件获取登录Jenkins的用户名

使用DAO将值从Java类传递到jsp页面

分类汇总

您的鼓励是对我最大的支持