600字范文,内容丰富有趣,生活中的好帮手!
600字范文 > python打开网页获取网页内容方法总结

python打开网页获取网页内容方法总结

时间:2021-07-29 05:16:18

相关推荐

python打开网页获取网页内容方法总结

在学习python爬虫的过程中,总会遇到要获取网页内容的时候,下面就对如何获取网页内容进行总结。

方法一:

>import urllib>url="" #这里是需要获取的网页>content=urllib.open(url).read() #使用urllib模块获取网页内容>print content #输出网页的内容 功能相当于查看网页源代码

方法二:

>import urllib2>from bs4 import BeautifulSoup #这里需要导入BeautifulSoup >url="">content=urllib2.urlopen(url)>soup=BeautifulSoup(content) #将网页内容转化为BeautifulSoup 格式的数据>print soup

方法三:

>import requests>content=requests.get(url).content>print content

这里是使用的python的requests模块获取网页的内容。

方法四:

>import codecs #导入codecs模块>f=codecs.open(url,"r","utf-8") #使用codecs函数以打开的方式打开url 设置默认的编码方式为utf-8>content=f.read()>f.close()>print content

这里是使用的python的codecs模块。

推荐:

BeautifulSoup的安装可以查看博客。

python中的模块安装及更新方法,可以查看博客(pip,easy_install)。

解决python中出现乱码问题,可以查看博客。

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。