600字范文,内容丰富有趣,生活中的好帮手!
600字范文 > python爬关键词百度指数_python爬虫-抓取搜狗指数(-_-感觉这标题不好起呀)

python爬关键词百度指数_python爬虫-抓取搜狗指数(-_-感觉这标题不好起呀)

时间:2022-01-08 08:25:33

相关推荐

python爬关键词百度指数_python爬虫-抓取搜狗指数(-_-感觉这标题不好起呀)

学这篇文章的内容你需要:requests模块

然后你还需要会dict、list,一点基础也可以,我不敢保证人人能看懂

先来张样图(:

sogou index

本想输出表格形式,可能脑子不够用,懒得想了就放弃了,这样也可以(自我感觉)(:

来分析分析网页,链接在这,打开网址,是这样的

其实之前是准备搞百度的,谁知这家伙搜索还要登录,然后登录又要费时间,索性就放弃百度了,搜狗不需要登录,这很爽

先随便搜一个关键字吧,比如python

我之前看有人爬百度指数的时候他说百度的结果用了什么很麻烦的设计,但是搜狗指数数据在源码就找得到

但是如果你就这样直接用requests请求后再用正则匹配源码里的数据那你就和我一样成傻子的,我当时也是看到源码,心想:我擦,这么简单,用正则就可以了撒,然后等我代码写完了:

调试也完了后在网页点了一个“PC趋势”后我瞄了一眼,看到了开发工具有一条请求,点进一看,返回的JSON格式数据,然后我又点了一下“整体趋势”

一样有请求,顺手点了一下,看了看返回结果:

心里一亿只草泥马狂奔。。。。我差点没哭出来,我特么辛辛苦苦写的正则

然后咱们说说步骤把:1、分析链接参数/getRenderData?kwdNamesStr=python&timePeriodType=MONTH&dataType=SEARCH_ALL&queryType=INPUT,“?”后面的都是参数

kwdNamesStr:关键字

timePeriodType:查询的时间段,分为:周、月、年(WEEK、MONTH、YEAR)记住请求的时候是大写的

dataType:搜索的平台,分为:PC、WAP(移动),SEARCH_ALL表示整体,SEARCH_PC表示PC...

queryType:我也不知道这啥玩意,反正带着请求就好了,没什么印象2、开始请求

转成JSON格式更好分析

infoList:就是这里的数据

topPvDataList:对本文没点用,本身也就没啥用。。。

我们要取的数据就是infoList里的,pvList是详细的,取很简单

infoList里的分析:ratioWapChain 移动环比

ratioWapMonth 移动同比

avgWapPv 移动搜索指数

ratioChain 整体环比

ratioMonth整体同比

kwdName 关键字名

avgPv 整体搜索指数/平均值

现来看看infoList的代码:

ok,完工了,然后你们自己完善,或者看看我的源码也可以,虽然不是什么很牛b的程序,哈哈哈

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。