Beautiful Soup 是一个可以从HTML或XML文件中提取数据的Python库.它能够通过你喜欢的转换器实现惯用的文档导航,查找,修改文档的方式.Beautiful Soup会帮你节省数小时甚至数天的工作时间.

一、VScode导入BeautifulSoup库

因为电脑环境不相同,你VScode使用的python和本地的python可能不是同一个
1.找到VScode运行的python
在VScode下随便运行一个python脚本,出现的黄色的路径就是VScode运行的python
在这里插入图片描述
2.找到该路径下对应的script文件中pip.exe
在这里插入图片描述
这个pip.exe就是专门下载东西用的
3.在命令行输入pip install bs4下载BeautifulSoup库
在这里插入图片描述
4.在vscode下运行from bs4 import BeautifulSoup
如果没有报错就是导入成功
在这里插入图片描述

二、安装JSFinder工具

JSFinder是一款用作快速在网站的js文件中提取URL,子域名的工具。
下载地址:https://github.com/Threezh1/JSFinder
在这里插入图片描述
下载好之后之间解压,在该目录下运行JSFinder.py
python JSFinder.py -u https://www.baidu.com(以百度为例)
在这里插入图片描述
提取了非常多的URL和子域名

Logo

CSDN联合极客时间,共同打造面向开发者的精品内容学习社区,助力成长!

更多推荐