【我问Crossin】爬虫学习该如何入门?

1

程序中使用了列表,运行过程中报错:

IndexError: list index out of range

这是由于列表的下标索引值超过了列表的总长度。
举例:

>>>l = [1,2] >>>l[5] IndexError: list index out of range

为了避免这种情况,可以使用 len() 函数取得列表的总长,再进行索引

if len(l) > 5:
   print(l[5])

2
如何将一个 py 文件打包为 exe 文件?

将 .py 文件打包为 exe 文件可以使用 cx_freeze 、py2exe 、Pyinstaller 等库可以操作。

我们之前有过一篇用 cx_freeze 打包 pygame 打飞机游戏的文章:将打飞机游戏打包成 exe

cx_freeze 官方文档:http://cx-freeze.readthedocs.io/en/latest/overview.html
py2exe 官方文档:http://www.py2exe.org/index.cgi/Tutorial

3
如何入门爬虫学习?

在学习爬虫之前,你至少需要以下基础:

基础的 Python 知识:

  • 基本的数据结构知识:list 、dict 以及对其处理的方法处理爬下来的数据

  • 条件判断(if等):用来解决爬虫过程中哪些要哪些不要的问题

  • 循环和迭代(for while ):用来循环,重复爬虫动作

  • 文件读写操作:用来读取参数、保存爬下来的内容等

  • 函数的基本知识

了解一个或多个跟网络请求相关的库或模块,比如 urllibrequests 等
了解基本的文档树内容,知道基本的 html 标签
了解 beautifulsoup4 的基本用法

然后就可以开始做一些项目了,比如爬豆瓣妹子图等,边学边做,逐渐提高姿势水平。
知乎上有一些关于入门爬虫的好问题,不妨先去了解一下:
如何入门爬虫:https://www.zhihu.com/question/20899988
如何学习python爬虫:https://zhuanlan.zhihu.com/p/21479334
利用爬虫技术能做到哪些很酷很有趣很有用的事情?:https://www.zhihu.com/question/27621722
零基础如何学爬虫基础?:https://www.zhihu.com/question/47883186


(0)

相关推荐