- 基本库的使用
一般爬虫第一个学的库是urllib
urllib
是一个收集了多个用到 URL 的模块的包:
urllib.request
打开和读取 URLurllib.error
包含urllib.request
抛出的异常urllib.parse
用于解析 URLurllib.robotparser
用于解析robots.txt
文件
一般爬虫第一个学的库是urllib
urllib
是一个收集了多个用到 URL 的模块的包:
urllib.request
打开和读取 URLurllib.error
包含 urllib.request
抛出的异常urllib.parse
用于解析 URLurllib.robotparser
用于解析 robots.txt
文件