首页社会文化娱乐时事综合国际旅游汽车时尚情感音乐教育搞笑

明星热度动态排行

发表于话题：明星热度排行榜

发布时间：2021-05-08

参考： B站_葩葩数据_2021年4月流量明星百度搜索指数动态排名.
小姐姐讲的非常好，希望多多关注、点赞。

流程

1.微博爬取排名前120的明星2.百度指数获取明星热度值3.flourish生成动态排行
明星排行数据来源：微博-超话排行-明星.
明星热度数据来源：百度指数.
动态排行生成工具： flourish Bar chart race.

1.微博爬取排名前120的明星

import requests import pandas as pd import numpy as np import time import re import json import demjson import datetime as dt from lxml import etree from selenium import webdriver # 获取namelist headers = { "Accept": "application/json, text/plain, */*", "Accept-Encoding": "gzip, deflate, br", "Accept-Language": "zh-CN,zh;q=0.9", "Cache-Control": "no-cache", "Connection": "keep-alive", "Cookie": "你的cookie", # 换成你的cookie "Host": "huati.weibo.cn", "Pragma": "no-cache", "Referer": "https://huati.weibo.cn/discovery/super", "sec-ch-ua-mobile": "?0", "Sec-Fetch-Dest": "empty", "Sec-Fetch-Mode": "cors", "user-agent":"你的user-agent", # 换成你的user-agent "X-Re-With": "XMLHttpRequest" } name_list = [] base_url = "https://huati.weibo.cn/aj/discovery/rank?cate_id=2&page={page}&topic_to_page=&block_time=0&star_type=star&from=&wm=&isvivo=false" for i in range(1,7): url = base_url.format(page=i) page_text = requests.get(url=url,headers=headers).text ex = '"display_name":"(.*?)","toprank"' page_name_list = re.findall(ex, page_text, re.S) for name in page_name_list: name_list.append(name) name_list # with open("name.txt","a+",encoding="utf-8") as fp: # fp.write()

运行结果：

2.百度指数获取明星热度值

headers = { "user-agent":"自己的user-agent", "cookie":'自己的cookie' } # 爬取百度指数每日值（需要解码，可一次爬取大量数据） def decrypt(ptbk, data): d = {} res = [] for i in range(len(ptbk)//2): d[ptbk[i]] = ptbk[len(ptbk)//2 + i] for x in data: res.append(d[x]) return "".join(res) def get_ptbk(uniqid): url = 'https://index.baidu.com/Interface/ptbk?uniqid={}'.format(uniqid) response = requests.get(url=url, headers=headers).text whh = demjson.encode(response, encoding='utf-8') h1 = json.loads(whh) h2 = json.loads(h1).get("data") return h2 def get_dailydata(keyword, start, end): url = f'https://index.baidu.com/api/SearchApi/index?area=0&word=[[%7B%22name%22:%22{keyword}%22,%22wordType%22:1%7D]]&startDate={start}&endDate={end}' res = requests.get(url, headers=headers) j = res.json() uniqid = j.get('data').get('uniqid') ptbk = get_ptbk(uniqid) data = j.get('data').get('userIndexes')[0].get('all').get('data') res = decrypt(ptbk, data) return res # 爬取多人的百度指数并制作成字典 def make_dict(name_list, sy, sm, sd, ey, em, ed): start = str(dt.date(sy, sm, sd)) end = str(dt.date(ey, em, ed)) data_dict = {} for name in name_list: print(name+" loading...") try: data_dict[name] = get_dailydata(name, start, end).split(',') except: break time.sleep(2) return data_dict data_d = make_dict(name_list, 2021,1,1,2021,5,4) start = dt.date(2021,1,1) end = dt.date(2021,5,5) # 注意：end要比抓取的end日期多一天 day_list = [] for i in range(start.toordinal(), end.toordinal()): day_list.append(str(dt.date.fromordinal(i))) df = pd.DataFrame(data_d, index=day_list) # 对空白数据进行填充 df.replace('','0',inplace=True) # 取当前日期和前两天的日期的平均值作为当天的热度值 df_rolling = df.rolling(window=3).mean().round(0) # 生成表格根据flourish的需求需要将表格进行处理 df_rolling.transpose().to_excel("百度热度.xls")

3.flourish生成动态排行

将生成的表格导入flourish中，效果图如下图所示：

标签组：[cookie] [data] [百度指数]

本文来源：https://www.kandian5.com/articles/3048.html

上一篇：你的蔡徐坤已上线！6月明星热度排行榜新鲜出炉

下一篇：中国十大选秀女明星排行榜李宇春兼具实力，第七名热度高

相关阅读

: 未羊的象征意义

十二生肖羊的象征意义古人视羊为“德畜”，善群、好仁、死义、知礼。善群，羊喜欢聚群。好仁指羊善良，有角但不好斗。死义指羊被宰杀时安静，视死如归，故有宣王“以羊易牛”的故事。知礼指羊知恩，羊羔跪乳象征孝道...

2025-06-30

: 午马的象征意义

十二生肖马的象征意义作为六畜之首，马除用作交通运输，还是强大的军事装备。战国以“万乘之国”，“千乘之国”等马拉战车的数量来形容国力强弱。马在中华民族的文化中地位极高，有一系列的象征和寓意。中华民族有“...

2025-06-30

: 生肖猪的诗词欣赏

猪是大家非常熟悉的家畜，民间称其为六畜之首。在生肖属相中排在最后，让猪作十二生肖的压阵之物，倒也名副其实。古文中，关于猪的文字有不同的表达方式，一起来欣赏古人关于猪的诗词吧。猪肉颂[宋]苏轼净洗铛，少...

2025-06-30

: 酉鸡的象征意义

十二生肖鸡的象征意义鸡最显著的象征意义就是守信、准时，自古以来，都有金鸡报晓。意味着天将明。深入探究，还能引申到由黑暗到光明的象征。下面就让我们一起来看看十二生肖鸡有什么样的象征意义。《韩诗外传》概括...

2025-06-30

: 子鼠的象征意义

鼠虽然口碑不佳，相貌也不讨人喜欢，还落得个“老鼠过街，人人喊打”的千古骂名，但从社会、民俗和文化学的角度来看，它早已脱胎换骨，由一个无恶不作的害人精，演化出来一个具有无比灵性，聪慧神秘的小生灵。鼠的特...

2025-06-30

: 谶纬神学

秦焚书坑儒之后，除易经外，方士儒书基本绝迹，靠儒生的记忆背诵才流传下来。汉朝时，五经通过年迈的儒者得到复原，以汉隶书写，称今文经学。但后来在孔子故居发现隐藏了一部分儒经，以孔子时代的蝌蚪文记载，刘歆做...

2025-06-30

: 生肖兔的诗词欣赏

古人对兔子的喜爱不仅来源于月兔，关于兔子的诗词有很多，一起来欣赏一下吧。白兔欧阳修天冥冥，云蒙蒙，白兔捣药姮娥宫。玉关金锁夜不闭，窜入涤山千万重。滁泉清甘泻大壑，滁草软翠摇轻风。渴饮泉，困栖草，滁人...

2025-06-30

: 生肖龙的诗词欣赏

龙是最具代表性的传统文化之一，龙在中华历史中的文化非常丰富。文人墨客对龙也是十分崇拜，一起来欣赏一下关于龙的诗词吧。黑潭龙【唐】白居易黑潭水深黑如墨，传有神龙人不识。潭上驾屋官立祠，龙不能神人神之。丰...

2025-06-30

: 战国八派

由于孔子的思想学说体系涉及范围相当广泛，孔门弟子对孔子言论和思想的理解不尽相同，难免会产生歧见。所以，孔子逝世以后，孔门弟子就开始逐步分化。到了战国的中后期，儒学在成为“显学”的同时，在儒家内部也形成...

2025-06-30

: 儒学唐宋明的发展

唐代道统唐代韩愈提出“道统”之说，《原道》认为“尧以是传之舜，舜以是传之禹，禹以是传之汤。汤以是传之文武周公，文武周公传之孔子，孔子传之孟轲。”韩愈又说：“孟轲师子思，子思之学，盖出曾子。自孔子没，群...

2025-06-30

热门话题

综合推荐文章

《特战荣耀》没来得及的告别真的会难过很久……

《特战荣耀》怎么这么虐我的破云天不能整整齐齐吗？

全世界最好的“破云天”！

晒出“破云天”三人合照，说道：“永远的破云天”……

如梦之梦武汉站首演一周年快乐我口袋只剩玫瑰一片……

《山河月明》中@颖儿Yinger 饰演的徐妙云，一直是朱棣的贤内助……

《山河月明》@颖儿Yinger 演的徐妙云，真的是朱棣的贤内助吧……

《恰似故人归》定档，迪丽热巴任嘉伦终于要换新造型了

台媒拍到陈立农欧阳娣娣逛街，称两人的互动就像小情侣日常……

190328到220328 恭喜我们肖战王一博《陈情令》《无羁》

综合热门文章

泉城“跤王”抗日故事

《特战荣耀》没来得及的告别真的会难过很久……

破解韩国最凶风水局，历届总统悲惨下场是青瓦台诅咒还是另有隐情

晒出“破云天”三人合照，说道：“永远的破云天”……

中国901灵异部队，探索大自然的未知(国家机密)

全世界最好的“破云天”！

台媒拍到陈立农欧阳娣娣逛街，称两人的互动就像小情侣日常……

艰难中守护上海青年冲在战“疫”一线

《恰似故人归》定档，迪丽热巴任嘉伦终于要换新造型了

《山河月明》@颖儿Yinger 演的徐妙云，真的是朱棣的贤内助吧……

声明: 本站部分内容来源网络，如果你是该内容的作者，并且不希望本站发布你的内容，请与我们联系

我们将在24小时内删除

友情链接：网站地图