Python爬虫

作者：AlbertWen 添加时间：2021-05-31 17:20:34 修改时间：2026-05-08 16:44:50 分类：23.Python编程编辑

Python收藏 | Pandas收藏 | Java爬虫 | Python爬虫 | 【爬虫】相关资源（代理） | PyWinAuto收藏

MitmProxy中文文档、Scrapy爬虫框架、Selenium 之chromedriver下载

==》把chromedriver路径设置到系统环境变量下即可使用

设置代理、自定义头信息

pip install selenium
pip install selenium-wire

Selenium反爬设置

Selenium

经验分享：

捕获异常时，统一使用如下异常类型（Exception）代码：使用具体化的异常类（如：TimeoutException）的话，容易漏写其他类型的异常，导致程序中断

try:
	element_page_list = WebDriverWait(driver, Loading_Timeout_10sec).until(
		ec.presence_of_all_elements_located((By.CSS_SELECTOR, ".s-pagination-container .s-pagination-strip span"))
	)
except Exception as e:
	logger_exception("没有查询到【分页记录】")

页面跳转（多窗口）：

find_element_by_css_selector()

浏览器获取CSS选择器技巧：元素选择器 -> 右键HTML元素节点 -> Copy -> Copy Selector

Python爬虫 - Selenium（1）安装和简单使用详细介绍Selenium的依赖环境在Windows和Centos7上的安装及简单使用
Python爬虫 - Selenium（2）元素定位和WebDriver常用方法详细介绍定位元素的8种方式并配合点击和输入、提交、获取断言信息等方法的使用
Python爬虫 - Selenium（3）控制浏览器的常用方法详细介绍自定义浏览器窗口大小或全屏、控制浏览器后退、前进、刷新浏览器等方法的使用
Python爬虫 - Selenium（4）配置启动项参数详细介绍Selenium启动项参数的配置，其中包括无界面模式、浏览器窗口大小设置、浏览器User-Agent (请求头)等等
Python爬虫 - Selenium（5）鼠标事件详细介绍鼠标右击、双击、拖动、鼠标悬停等方法的使用
Python爬虫 - Selenium（6）键盘事件详细介绍键盘的操作，几乎包含所有常用按键以及组合键
Python爬虫 - Selenium（7）多窗口切换详细介绍Selenium是如何实现在不同的窗口之间自由切换
Python爬虫 - Selenium（8）frame/iframe表单嵌套页面详细介绍如何从当前定位的主体切换为frame/iframe表单的内嵌页面中
Python爬虫 - Selenium（9）警告框(弹窗)处理详细介绍如何定位并处理多类警告弹窗
Python爬虫 - Selenium（10）下拉框处理详细介绍如何灵活的定位并处理下拉框
Python爬虫 - Selenium（11）文件上传详细介绍如何优雅的通过send_keys()指定文件进行上传
Python爬虫 - Selenium（12）获取登录Cookies，并添加Cookies自动登录详细介绍如何获取Cookies和使用Cookies进行自动登录
Python爬虫 - Selenium（13）设置元素等待详细介绍如何优雅的设置元素等待时间，防止程序运行过快而导致元素定位失败
Python爬虫 - Selenium（14）窗口截图详细介绍如何使用窗口截图
Python爬虫 - Selenium（15）关闭浏览器详细介绍两种关闭窗口的区别

不灭的焱

革命尚未成功，同志仍须努力下载Java21

设置代理、自定义头信息

Selenium反爬设置

Selenium

Requests

cookie

session

桌面自动化（流程机器人）

不灭的焱

革命尚未成功，同志仍须努力 下载Java21

设置代理、自定义头信息

Selenium反爬设置

Selenium

Requests

cookie

session

桌面自动化（流程机器人）

革命尚未成功，同志仍须努力下载Java21