【我问Crossin】爬虫学习该如何入门?
1
程序中使用了列表,运行过程中报错:
IndexError: list index out of range
这是由于列表的下标索引值超过了列表的总长度。
举例:
>>>l = [1,2] >>>l[5] IndexError: list index out of range
为了避免这种情况,可以使用 len()
函数取得列表的总长,再进行索引
if len(l) > 5:
print(l[5])
2
如何将一个 py 文件打包为 exe 文件?
将 .py 文件打包为 exe 文件可以使用 cx_freeze 、py2exe 、Pyinstaller 等库可以操作。
我们之前有过一篇用 cx_freeze 打包 pygame 打飞机游戏的文章:将打飞机游戏打包成 exe
cx_freeze 官方文档:http://cx-freeze.readthedocs.io/en/latest/overview.html
py2exe 官方文档:http://www.py2exe.org/index.cgi/Tutorial
3
如何入门爬虫学习?
在学习爬虫之前,你至少需要以下基础:
基础的 Python 知识:
基本的数据结构知识:list 、dict 以及对其处理的方法处理爬下来的数据
条件判断(if等):用来解决爬虫过程中哪些要哪些不要的问题
循环和迭代(for while ):用来循环,重复爬虫动作
文件读写操作:用来读取参数、保存爬下来的内容等
函数的基本知识
了解一个或多个跟网络请求相关的库或模块,比如 urllib、requests 等
了解基本的文档树内容,知道基本的 html 标签
了解 beautifulsoup4 的基本用法
然后就可以开始做一些项目了,比如爬豆瓣妹子图等,边学边做,逐渐提高姿势水平。
知乎上有一些关于入门爬虫的好问题,不妨先去了解一下:
如何入门爬虫:https://www.zhihu.com/question/20899988
如何学习python爬虫:https://zhuanlan.zhihu.com/p/21479334
利用爬虫技术能做到哪些很酷很有趣很有用的事情?:https://www.zhihu.com/question/27621722
零基础如何学爬虫基础?:https://www.zhihu.com/question/47883186