crapy管道以正确的格式导出csv文件

我从头开始，下面的spider应该与

scrapy crawl amazon -t csv -o Amazon.csv --loglevel=INFO

因此，使用电子表格打开CSV文件对我来说是

希望这可以帮助：

import scrapy

class AmazonItem(scrapy.Item):
    rating = scrapy.Field()
    date = scrapy.Field()
    review = scrapy.Field()
    link = scrapy.Field()

class AmazonSpider(scrapy.Spider):

    name = "amazon"
    allowed_domains = ['amazon.co.uk']
    start_urls = ['http://www.amazon.co.uk/product-reviews/B0042EU3A2/' ]

    def parse(self, response):

        for sel in response.xpath('//table[@id="productReviews"]//tr/td/div'):

            item = AmazonItem()
            item['rating'] = sel.xpath('./div/span/span/span/text()').extract()
            item['date'] = sel.xpath('./div/span/nobr/text()').extract()
            item['review'] = sel.xpath('./div[@class="reviewText"]/text()').extract()
            item['link'] = sel.xpath('.//a[contains(.,"Permalink")]/@href').extract()
            yield item

        xpath_Next_Page = './/table[@id="productReviews"]/following::*//span[@class="paging"]/a[contains(.,"Next")]/@href'
        if response.xpath(xpath_Next_Page):
            url_Next_Page = response.xpath(xpath_Next_Page).extract()[0]
            request = scrapy.Request(url_Next_Page, callback=self.parse)
            yield request

其他 2022/1/1 18:18:32 有485人围观

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节

关注并接收问题和回答的更新提醒

参与内容的编辑和改进，让解决方法与时俱进

请先登录

推荐问题

如何在JavaScript中将浮点数转换为整数？

如何在JavaScript中将浮点数转换为整数？

javascript 2022-01-01 1274
如何枚举JavaScript对象的属性？

如何枚举JavaScript对象的属性？

javascript 2022-01-01 1233
在JavaScript中删除数组元素-Delete与Splice

在JavaScript中删除数组元素-Delete与Splice

SQL 2022-01-01 1249
JavaScriptWays to circumvent the same-origin policy

JavaScriptWays to circumvent the same-origin policy

javascript 2022-01-01 1110
如何获取JavaScript对象的类？

如何获取JavaScript对象的类？

javascript 2022-01-01 964
使用Hibernate Criteria API编写HQL子句

使用Hibernate Criteria API编写HQL子句

其他 2022-01-01 1016
编译bcrypt时出错-node.js

编译bcrypt时出错-node.js

Node 2022-01-01 861
JavaScript中两个日期之间的月份差异

JavaScript中两个日期之间的月份差异

javascript 2022-01-01 896
查看JavaScript中的所有超时/时间间隔？

查看JavaScript中的所有超时/时间间隔？

javascript 2022-01-01 801
如何使用bcrypt在PHP中对密码进行哈希处理？

如何使用bcrypt在PHP中对密码进行哈希处理？

php 2022-01-01 928
如何从javascript中的Razor Model对象获取JSON对象

如何从javascript中的Razor Model对象获取JSON对象

javascript 2022-01-01 942
[ScriptMethod（ResponseFormat = ResponseFormat.Json）]

[ScriptMethod（ResponseFormat = ResponseFormat.Json）]

其他 2022-01-01 996
javascript属性名称中允许使用破折号吗？

javascript属性名称中允许使用破折号吗？

javascript 2022-01-01 755
如何检查是否使用Javascript加载了外部（跨域）CSS文件

如何检查是否使用Javascript加载了外部（跨域）CSS文件

javascript 2022-01-01 894
如何使用JavaScript创建文档对象

如何使用JavaScript创建文档对象

javascript 2022-01-01 914
从javascript对象访问父对象的父对象

从javascript对象访问父对象的父对象

javascript 2022-01-01 912
使用javascript和服务器端禁用/启用requiredFieldValidators

使用javascript和服务器端禁用/启用requiredFieldValidators

javascript 2022-01-01 917
如何在JavaScript中将字符串转换为布尔值？

如何在JavaScript中将字符串转换为布尔值？

javascript 2022-01-01 896
如何通过JavaScript重新触发WebKit CSS动画？

如何通过JavaScript重新触发WebKit CSS动画？

javascript 2022-01-01 859
检测JavaScript中的箭头键按下

检测JavaScript中的箭头键按下

javascript 2022-01-01 724

crapy管道以正确的格式导出csv文件

撰写回答

推荐问题

如何在JavaScript中将浮点数转换为整数？

如何枚举JavaScript对象的属性？

在JavaScript中删除数组元素-Delete与Splice

JavaScriptWays to circumvent the same-origin policy

如何获取JavaScript对象的类？

使用Hibernate Criteria API编写HQL子句

编译bcrypt时出错-node.js

JavaScript中两个日期之间的月份差异

查看JavaScript中的所有超时/时间间隔？

如何使用bcrypt在PHP中对密码进行哈希处理？

如何从javascript中的Razor Model对象获取JSON对象

[ScriptMethod（ResponseFormat = ResponseFormat.Json）]

javascript属性名称中允许使用破折号吗？

如何检查是否使用Javascript加载了外部（跨域）CSS文件

如何使用JavaScript创建文档对象

从javascript对象访问父对象的父对象

使用javascript和服务器端禁用/启用requiredFieldValidators

如何在JavaScript中将字符串转换为布尔值？

如何通过JavaScript重新触发WebKit CSS动画？

检测JavaScript中的箭头键按下

分类汇总

您的鼓励是对我最大的支持