python爬虫之re模块

本文介绍如何通过python的re模块对网页文本进行解析,获得你想要的内容。

阅读全文 »

Python request库入门

一.简介与安装

Requests 是⽤Python语⾔编写,基于urllib,采⽤Apache2 Licensed开源协议的 HTTP 库,该模块主要用来发送 HTTP 请求。

阅读全文 »

python爬虫入门

一.什么是爬虫

网络爬虫(Crawler)又称网络蜘蛛,或者网络机器人(Robots)。它是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。爬虫通过程序模拟用户访问网页的过程,解析网页源代码或通过抓包获取网页上所含的文字,图片,视频等资源,并将其保存下来。

阅读全文 »

欢迎来到我的博客,在这里我会分享我的学习心得体会,偶尔也会分享一些其他内容,感谢各位支持ღ( ´・ᴗ・` )!!