推荐专题：

600字范文 > python抓取贴吧_零基础写python爬虫之抓取百度贴吧代码分享

python抓取贴吧_零基础写python爬虫之抓取百度贴吧代码分享

时间：2021-02-06 08:29:08

相关推荐

python抓取贴吧_零基础写python爬虫之抓取百度贴吧代码分享

这里就不给大家废话了，直接上代码，代码的解释都在注释里面，看不懂的也别来问我，好好学学基础知识去！

# -*- coding: utf-8 -*-

#---------------------------------------

# 程序：百度贴吧爬虫

# 版本：0.1

# 作者：why

# 日期：-05-14

# 语言：Python 2.7

# 操作：输入带分页的地址，去掉最后面的数字，设置一下起始页数和终点页数。

# 功能：下载对应页码内的所有页面并存储为html文件。

#---------------------------------------

import string, urllib2

#定义百度函数

def baidu_tieba(url,begin_page,end_page):

for i in range(begin_page, end_page+1):

sName = string.zfill(i,5) + '.html'#自动填充成六位的文件名

print '正在下载第' + str(i) + '个网页，并将其存储为' + sName + '......'

f = open(sName,'w+')

m = urllib2.urlopen(url + str(i)).read()

f.write(m)

f.close()

#-------- 在这里输入参数 ------------------

# 这个是山东大学的百度贴吧中某一个帖子的地址

#bdurl = '/p/2296017831?pn='

#iPostBegin = 1

#iPostEnd = 10

bdurl = str(raw_input(u'请输入贴吧的地址，去掉pn=后面的数字：\n'))

begin_page = int(raw_input(u'请输入开始的页数：\n'))

end_page = int(raw_input(u'请输入终点的页数：\n'))

#-------- 在这里输入参数 ------------------

#调用

baidu_tieba(bdurl,begin_page,end_page)

以上就是python抓取百度贴吧的一段简单的代码，非常的实用吧，各位可以自行扩展下。

本内容不代表本网观点和政治立场，如有侵犯你的权益请联系我们处理。

网友评论

网友评论仅供其表达个人看法，并不表明网站立场。

相关阅读

python爬取小说写入txt_零基础写python爬虫之抓取百度贴吧并存储到本地txt文件改进版...

2024-03-10

零基础Python爬虫实现(百度贴吧)

2023-05-11

Python零基础网络爬虫：抓取4A级猎头公司数据

2024-05-18

初学用python写爬虫这里分享给大家一段爬取百度贴吧的代码(用面向对象的思想写的)

2022-05-08

扩展阅读

: Python破解反爬虫：最新反爬虫有道翻译中英文互译破解附代码

: 零基础学习 Python 之条件语句

: 零基础学习 Python（之条件语句）

: 零基础学习 Python（之 for 循环语句）

: 带你零基础学python 我喜欢的话：人生苦短（我用python）

: 风变编程Python小课学习体验：零基础学编程并不难

最近发布

一次有趣的科学小实验600字作文

2024-08-07

初次见海的感受: 我的海边初体验

2024-08-07

初中月考之后作文600字

2024-08-07

小学生的神奇植物探秘之旅：九篇600字作文集

2024-08-07

失败是成功之母作文600字初中(优秀13篇)

2024-08-07

用微笑征服世界优秀作文600字

2024-08-07

推荐专题

国庆趣事600字作文那一次我真难忘600字特别的一天作文600字总结作文600字冬雪作文600字幸福的颜色600字追求理想的作文600字以挫折为话题的作文600字我的价值观作文600字以阅读为题的作文600字续写变色龙600字自我介绍作文600字男生编科幻故事作文600字礼物作文600字初二写理想的作文600字