您好, 欢迎来到 !    登录 | 注册 | | 设为首页 | 收藏本站

python爬虫入门

5b51 2022/1/14 8:25:24 python 字数 9968 阅读 862 来源 www.jb51.cc/python

1.从guthub项目地址下载项目源码,请支持作者本人。 2.安装提到的各种库。 Python爬虫入门八之BeautifulSoup的用法

概述

1. 从下载项目源码,请支持作者本人。

2. 安装提到的各种库。

顺便学习一下beautiful soup的用途:

3.  

安装MysqL,net start MysqL   启动报错:

报错1,系统找不到指定的文件

解决方案:根据错误日志,修改注册表。

注册表:把注册表里的路径改为自己解压缩后MysqLd.exe所在的文件路径。

修改注册表有三种方式:。我选择用windows的注册表修改器--regedit.exe:

显示:MySQL 服务正在启动 ..MySQL 服务已经启动成功。成功解决。

配置环境变量:将c:\mysql\bin 路径加入path,可以直接启动mysql。

启动: net start MysqL

停止: net stop MysqL

设置密码:MysqL> set password='XXX'; 

报错2:ERROR 1372 (HY000): Password hash should be a 41-digit hexadecimal number

问题原因:你输入的密码是明文。不允许这么输入。

解决办法:用select password('你想输入的密码');查询出你的密码对应的字符串,用户命令中替换你的密码。

--本地连接  :MysqL –uroot -p  

--远程连接  :MysqL –uwgb –hXXX.XXX.XXX.XXX –p 

安装python-MysqL

4. 获取cookie

5. 修改config.ini文件,运行init.sql文件MysqL>source d:\test\ss.sql 或者 MysqL>\. d:\test\ss.sql

6. 报错3:ConfigParser MissingSectionHeaderError: File contains no section headers.

修改配置文件中的数据库连接等相关信息,修改后执行程序,文件头部被追加了信息:\xef\xbb\xbf,然后ConfigParser解析出错 

解决在window下面用记事本编辑文件的时候,如果保存为UNICODE或UTF-8,分别会在文件的开头加上两个字节“\xFF\xFE”和三个字节“\xEF\xBB\xBF”。 

fig.cfg').read()
    #Window下用记事本打开配置文件修改保存后,编码为UNICODE或UTF-8的文件文件头
    #会被相应的加上\xff\xfe(\xff\xfe)或\xef\xbb\xbf,然后再传递给ConfigParser解析的时候会出错
    #,因此解析之前,先替换掉
    content = re.sub(r"\xfe\xff","",content)
    content = re.sub(r"\xff\xfe",content)
    content = re.sub(r"\xef\xbb\xbf",content)
    open('BaseConfig.cfg','w').write(content)

7.解决UnicodeEncodeError: 'ascii' codec can't encode characters in position问题

解决方案:加上:

import sys
reload(sys)
sys.setdefaultencoding( "utf-8" )

总结

以上是编程之家为你收集整理的python爬虫入门全部内容,希望文章能够帮你解决python爬虫入门所遇到的程序开发问题。


如果您也喜欢它,动动您的小指点个赞吧

除非注明,文章均由 laddyq.com 整理发布,欢迎转载。

转载请注明:
链接:http://laddyq.com
来源:laddyq.com
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。


联系我
置顶