今日看点

明星热度动态排行

发表于话题:明星热度排行榜
发布时间:2021-05-08

参考: B站_葩葩数据_2021年4月流量明星百度搜索指数动态排名.
小姐姐讲的非常好,希望多多关注、点赞。

流程

1.微博爬取排名前120的明星2.百度指数获取明星热度值3.flourish生成动态排行
明星排行数据来源: 微博-超话排行-明星.
明星热度数据来源: 百度指数.
动态排行生成工具: flourish Bar chart race.

1.微博爬取排名前120的明星

import requests import pandas as pd import numpy as np import time import re import json import demjson import datetime as dt from lxml import etree from selenium import webdriver # 获取namelist headers = { "Accept": "application/json, text/plain, */*", "Accept-Encoding": "gzip, deflate, br", "Accept-Language": "zh-CN,zh;q=0.9", "Cache-Control": "no-cache", "Connection": "keep-alive", "Cookie": "你的cookie", # 换成你的cookie "Host": "huati.weibo.cn", "Pragma": "no-cache", "Referer": "https://huati.weibo.cn/discovery/super", "sec-ch-ua-mobile": "?0", "Sec-Fetch-Dest": "empty", "Sec-Fetch-Mode": "cors", "user-agent":"你的user-agent", # 换成你的user-agent "X-Re-With": "XMLHttpRequest" } name_list = [] base_url = "https://huati.weibo.cn/aj/discovery/rank?cate_id=2&page={page}&topic_to_page=&block_time=0&star_type=star&from=&wm=&isvivo=false" for i in range(1,7): url = base_url.format(page=i) page_text = requests.get(url=url,headers=headers).text ex = '"display_name":"(.*?)","toprank"' page_name_list = re.findall(ex, page_text, re.S) for name in page_name_list: name_list.append(name) name_list # with open("name.txt","a+",encoding="utf-8") as fp: # fp.write()

运行结果:

2.百度指数获取明星热度值

headers = { "user-agent":"自己的user-agent", "cookie":'自己的cookie' } # 爬取百度指数每日值(需要解码,可一次爬取大量数据) def decrypt(ptbk, data): d = {} res = [] for i in range(len(ptbk)//2): d[ptbk[i]] = ptbk[len(ptbk)//2 + i] for x in data: res.append(d[x]) return "".join(res) def get_ptbk(uniqid): url = 'https://index.baidu.com/Interface/ptbk?uniqid={}'.format(uniqid) response = requests.get(url=url, headers=headers).text whh = demjson.encode(response, encoding='utf-8') h1 = json.loads(whh) h2 = json.loads(h1).get("data") return h2 def get_dailydata(keyword, start, end): url = f'https://index.baidu.com/api/SearchApi/index?area=0&word=[[%7B%22name%22:%22{keyword}%22,%22wordType%22:1%7D]]&startDate={start}&endDate={end}' res = requests.get(url, headers=headers) j = res.json() uniqid = j.get('data').get('uniqid') ptbk = get_ptbk(uniqid) data = j.get('data').get('userIndexes')[0].get('all').get('data') res = decrypt(ptbk, data) return res # 爬取多人的百度指数并制作成字典 def make_dict(name_list, sy, sm, sd, ey, em, ed): start = str(dt.date(sy, sm, sd)) end = str(dt.date(ey, em, ed)) data_dict = {} for name in name_list: print(name+" loading...") try: data_dict[name] = get_dailydata(name, start, end).split(',') except: break time.sleep(2) return data_dict data_d = make_dict(name_list, 2021,1,1,2021,5,4) start = dt.date(2021,1,1) end = dt.date(2021,5,5) # 注意:end要比抓取的end日期多一天 day_list = [] for i in range(start.toordinal(), end.toordinal()): day_list.append(str(dt.date.fromordinal(i))) df = pd.DataFrame(data_d, index=day_list) # 对空白数据进行填充 df.replace('','0',inplace=True) # 取当前日期和前两天的日期的平均值作为当天的热度值 df_rolling = df.rolling(window=3).mean().round(0) # 生成表格 根据flourish的需求需要将表格进行处理 df_rolling.transpose().to_excel("百度热度.xls")

3.flourish生成动态排行

将生成的表格导入flourish中,效果图如下图所示:

标签组:[cookie] [data] [百度指数

本文来源:https://www.kandian5.com/articles/3048.html

相关阅读

未羊的象征意义

十二生肖羊的象征意义古人视羊为“德畜”,善群、好仁、死义、知礼。善群,羊喜欢聚群。好仁指羊善良,有角但不好斗。死义指羊被宰杀时安静,视死如归,故有宣王“以羊易牛”的故事。知礼指羊知恩,羊羔跪乳象征孝道...

2025-06-30

午马的象征意义

十二生肖马的象征意义作为六畜之首,马除用作交通运输,还是强大的军事装备。战国以“万乘之国”,“千乘之国”等马拉战车的数量来形容国力强弱。马在中华民族的文化中地位极高,有一系列的象征和寓意。中华民族有“...

2025-06-30

生肖猪的诗词欣赏

猪是大家非常熟悉的家畜,民间称其为六畜之首。在生肖属相中排在最后,让猪作十二生肖的压阵之物,倒也名副其实。古文中,关于猪的文字有不同的表达方式,一起来欣赏古人关于猪的诗词吧。猪肉颂[宋]苏轼净洗铛,少...

2025-06-30

酉鸡的象征意义

十二生肖鸡的象征意义鸡最显著的象征意义就是守信、准时,自古以来,都有金鸡报晓。意味着天将明。深入探究,还能引申到由黑暗到光明的象征。下面就让我们一起来看看十二生肖鸡有什么样的象征意义。《韩诗外传》概括...

2025-06-30

子鼠的象征意义

鼠虽然口碑不佳,相貌也不讨人喜欢,还落得个“老鼠过街,人人喊打”的千古骂名,但从社会、民俗和文化学的角度来看,它早已脱胎换骨,由一个无恶不作的害人精,演化出来一个具有无比灵性,聪慧神秘的小生灵。鼠的特...

2025-06-30

谶纬神学

秦焚书坑儒之后,除易经外,方士儒书基本绝迹,靠儒生的记忆背诵才流传下来。汉朝时,五经通过年迈的儒者得到复原,以汉隶书写,称今文经学。但后来在孔子故居发现隐藏了一部分儒经,以孔子时代的蝌蚪文记载,刘歆做...

2025-06-30

生肖兔的诗词欣赏

古人对兔子的喜爱不仅来源于月兔,关于兔子的诗词有很多,一起来欣赏一下吧。白兔 欧阳修天冥冥,云蒙蒙,白兔捣药姮娥宫。玉关金锁夜不闭,窜入涤山千万重。滁泉清甘泻大壑,滁草软翠摇轻风。渴饮泉,困栖草,滁人...

2025-06-30

生肖龙的诗词欣赏

龙是最具代表性的传统文化之一,龙在中华历史中的文化非常丰富。文人墨客对龙也是十分崇拜,一起来欣赏一下关于龙的诗词吧。黑潭龙【唐】白居易黑潭水深黑如墨,传有神龙人不识。潭上驾屋官立祠,龙不能神人神之。丰...

2025-06-30

战国八派

由于孔子的思想学说体系涉及范围相当广泛,孔门弟子对孔子言论和思想的理解不尽相同,难免会产生歧见。所以,孔子逝世以后,孔门弟子就开始逐步分化。到了战国的中后期,儒学在成为“显学”的同时,在儒家内部也形成...

2025-06-30

儒学唐宋明的发展

唐代道统唐代韩愈提出“道统”之说,《原道》认为“尧以是传之舜,舜以是传之禹,禹以是传之汤。汤以是传之文武周公,文武周公传之孔子,孔子传之孟轲。”韩愈又说:“孟轲师子思,子思之学,盖出曾子。自孔子没,群...

2025-06-30