不灭的焱

加密类型:SHA/AES/RSA下载Go
复合类型:切片(slice)、映射(map)、指针(pointer)、函数(function)、通道(channel)、接口(interface)、数组(array)、结构体(struct) Go类型+零值nil
引用类型:切片(slice)、映射(map)、指针(pointer)、函数(function)、通道(channel) Go引用

作者:AlbertWen  添加时间:2022-08-16 09:13:38  修改时间:2025-11-28 13:40:39  分类:04.数据采集/爬虫  编辑

Playwright获取页面元素的outerHTML

作者:AlbertWen  添加时间:2022-08-14 21:08:35  修改时间:2025-12-02 09:37:53  分类:04.数据采集/爬虫  编辑

Playwright Chromium 界面模式运行默认窗口尺寸较小,可通过如下方式控制

作者:AlbertWen  添加时间:2022-08-14 00:50:23  修改时间:2025-11-17 17:03:38  分类:04.数据采集/爬虫  编辑

Playwright收藏

作者:AlbertWen  添加时间:2022-08-10 00:28:55  修改时间:2025-12-03 20:52:48  分类:04.数据采集/爬虫  编辑

Playwright 是微软在 2020 年初开源的新一代自动化测试工具,它的功能类似于 Selenium、Pyppeteer 等,都可以驱动浏览器进行各种自动化操作。它的功能也非常强大,对市面上的主流浏览器都提供了支持,API 功能简洁又强大。虽然诞生比较晚,但是现在发展得非常火热。

作者:AlbertWen  添加时间:2022-07-13 10:08:27  修改时间:2025-11-30 09:59:41  分类:04.数据采集/爬虫  编辑
作者:AlbertWen  添加时间:2022-06-28 23:22:40  修改时间:2025-12-06 13:52:03  分类:04.数据采集/爬虫  编辑

python模块库需要 pillow 和 pytesseract 这两个库,直接pip install 安装就好了。

作者:AlbertWen  添加时间:2022-06-28 14:35:08  修改时间:2025-11-29 13:21:52  分类:04.数据采集/爬虫  编辑
作者:AlbertWen  添加时间:2022-06-22 14:50:49  修改时间:2025-11-23 18:07:46  分类:04.数据采集/爬虫  编辑

go-cqhttp:基于 Mirai 以及 MiraiGo 的 OneBot Golang 原生实现

MyQQ:稳定 · 高效 · 免费的QQ机器人框架

作者:AlbertWen  添加时间:2022-06-14 19:56:23  修改时间:2025-12-06 15:38:01  分类:04.数据采集/爬虫  编辑
作者:AlbertWen  添加时间:2022-06-08 09:01:47  修改时间:2025-12-07 07:02:53  分类:04.数据采集/爬虫  编辑

项目中,需要用爬虫去抓取页面数据,然后解析出其中的联系方式,如:“邮箱”和“电话号码”,刚开始,大伙潜意识地想到直接用正则表达式去提取,网上也有很多现成的“邮箱”和“电话号码”的正则表达式。代码跑了一段时间后,发现抓取到的“邮箱”数据到是挺正常,而“电话号码”的书写方式却千奇百怪,先前找到的正则就不那么灵敏,总而言之,解析出来的“电话号码”一看就很假,销售人员打过去,肯定也报空号。