用数据分析来挖掘一下大家最喜欢的抖音视频都有哪些.docx
- 文档编号:16854945
- 上传时间:2023-07-19
- 格式:DOCX
- 页数:13
- 大小:1.56MB
用数据分析来挖掘一下大家最喜欢的抖音视频都有哪些.docx
《用数据分析来挖掘一下大家最喜欢的抖音视频都有哪些.docx》由会员分享,可在线阅读,更多相关《用数据分析来挖掘一下大家最喜欢的抖音视频都有哪些.docx(13页珍藏版)》请在冰点文库上搜索。
用数据分析来挖掘一下大家最喜欢的抖音视频都有哪些
【导语】之前有个朋友提到了抖音数据的获取。
问我这样的行业前景如何,说实话我哪知道啊...不过也给我提供了一些分析思路,还是要感谢这位读者。
所以本次就来分析一下抖音的那些大V们。
来探索一下什么样的视频在抖音里最受欢迎。
一、获取分析
信息肯定不是去抖音获取的,而是从某平台爬取的。
具体的就不透露了,万一哪天被查水表了该怎么办。
主要包含了大V们的昵称、性别、类型、点赞数、粉丝数以及视频数。
一共有2840位抖音大V,粉丝数都是50w+。
二、数据可视化
1、性别分布情况
2000多位大V,除去未知性别的,男女比例基本在「1:
1」。
可视化代码如下:
defcreate_gender(df):
"""
性别
"""
df=df.copy()
df.loc[df.gender=='gender']='未知'
df.loc[df.gender==1'gender']='男性'
df.loc[df.gender==2'gender']='女性'
gender_message=df.groupby(['gender'])
gender_com=gender_message['gender'].agg(['count'])
gender_com.reset_index(inplace=True)
#生成饼图
attr=gender_com['gender']
v1=gender_com['count']
pie=Pie("抖音大V性别分布情况"title_pos='center'title_top=)
pie.add(""attrv1radius=[4075]label_text_color=Noneis_label_show=Truelegend_orient="vertical"legend_pos="left"legend_top="%10")
pie.render("抖音大V性别分布情况.html")
2、点赞数TOP10
点赞数都是过亿的存在,就问你怕不怕。
其中「浙有正能量」和「人民日报」这两个都是属于弘扬中国正能量的。
泱泱大中华,复兴在当下,国强则无惧,龙行在天涯。
可视化代码如下:
defcreate_likes(df):
"""
点赞数
"""
df=df.sort_values('likes'ascending=False)
attr=df['name'][:
10]
v1=["{}".format(float('%.1f'%(float(i)/100000000)))foriindf['likes'][:
10]]
#生成柱状图
bar=Bar("抖音大V点赞数TOP10(亿)"title_pos='center'title_top='18'width=800height=400)
bar.add(""attrv1is_convert=Truexaxis_min=yaxis_label_textsize=12is_yaxis_boundarygap=Trueyaxis_interval=is_label_show=Trueis_legend_show=Falselabel_pos='right'is_yaxis_inverse=Trueis_splitline_show=False)
bar.render("抖音大V点赞数TOP10.html")
3、粉丝数TOP10
粉丝数前十,大部分大V都是娱乐圈的。
这也是当下所流行的~可视化代码如下:
defcreate_fans(df):
"""
粉丝数
"""
df=df.sort_values('fans'ascending=False)
attr=df['name'][:
10]
v1=["{}".format(float('%.1f'%(float(i)/10000)))foriindf['fans'][:
10]]
#生成柱状图
bar=Bar("抖音大V粉丝数TOP10(万)"title_pos='center'title_top='18'width=800height=400)
bar.add(""attrv1is_convert=Truexaxis_min=yaxis_label_textsize=12is_yaxis_boundarygap=Trueyaxis_interval=is_label_show=Trueis_legend_show=Falselabel_pos='right'is_yaxis_inverse=Trueis_splitline_show=False)
bar.render("抖音大V粉丝数TOP10.html")
4、各类型点赞数汇总分布图
「蓝V」「娱乐」「生活」「美女」「搞笑」「帅哥」「音乐」这些类型的抖音视频,应该算是在抖音里较受欢迎的。
蓝V是抖音上的一个认证方式,主要是针对企业。
从上面可以看出大部分是媒体这一块,内容则主要是一些时事以及那些正能量视频,可视化代码如下。
defcreate_type_likes(df):
"""
类型点赞数
"""
dom=[]
likes_type_message=df.groupby(['type'])
likes_type_com=likes_type_message['likes'].agg(['sum'])
likes_type_com.reset_index(inplace=True)
fornamenuminzip(likes_type_com['type']likes_type_com['sum']):
data={}
data['name']=name
data['value']=num
dom.append(data)
#生成矩形树图
treemap=TreeMap("各类型抖音大V点赞数汇总图"title_pos='center'title_top='5'width=800height=400)
treemap.add('各类型抖音大V点赞数汇总图'domis_label_show=Truelabel_pos='inside'is_legend_show=False)
treemap.render('各类型抖音大V点赞数汇总图.html')
5、各类型粉丝数汇总分布图
「娱乐」类型大V的粉丝数遥遥领先,位居第一。
其次便是「美女」「生活」「音乐」「帅哥」「文化」「蓝V」类型的。
结合一下点赞数的数据,我们就能知道在抖音里什么样的视频大家比较喜欢。
便是「娱乐」「生活」「美女」「帅哥」「音乐」「蓝V」这几个类型。
可视化代码如下:
defcreate_type_fans(df):
"""
类型粉丝数
"""
dom=[]
fans_type_message=df.groupby(['type'])
fans_type_com=fans_type_message['fans'].agg(['sum'])
fans_type_com.reset_index(inplace=True)
fornamenuminzip(fans_type_com['type']fans_type_com['sum']):
data={}
data['name']=name
data['value']=num
dom.append(data)
#生成矩形树图
treemap=TreeMap("各类型抖音大V粉丝数汇总图"title_pos='center'title_top='5'width=800height=400)
treemap.add('各类型抖音大V粉丝数汇总图'domis_label_show=Truelabel_pos='inside'is_legend_show=False)
treemap.render('各类型抖音大V粉丝数汇总图.html')
6、视频粉丝点赞三维度图
视频越多并不意味着点赞数就越多,粉丝数就越多。
不过还是会有个例出现,比如「浙有正能量」,1744个视频,4.6亿点赞数。
可视化代码如下:
defcreate_scatter(df):
"""
三维度散点图
"""
#生成数据列表
data=[list(i)foriinzip(df['videos']df['fans']df['likes']df['name'])]
#生成散点图
x_lst=[v[]forvindata]
y_lst=[v[1]forvindata]
extra_data=[v[2]forvindata]
sc=Scatter("抖音大V视频数粉丝数点赞数三维度"title_pos='center'title_top='5'width=800height=400)
sc.add(""x_lsty_lstextra_data=extra_datais_visualmap=Truevisual_dimension=2visual_orient="horizontal"visual_type="size"visual_range=[500000000]visual_text_color="#000"visual_range_size=[530])
sc.render('抖音大V视频数粉丝数点赞数三维度.html')
7、平均视频点赞数TOP10
第一居然被一个珠宝商给霸占了,我觉得肯定有猫腻。
于是便去抖音看了一眼。
真不知道它的粉丝和点赞数怎么来的。
或许和圈内的删库一样,小哥删视频跑路了。
可视化代码如下:
defcreate_avg_likes(df):
"""
平均点赞数
"""
df=df[df['videos']>]
df.eval('result=likes/(videos*10000)'inplace=True)
df['result']=df['result'].round(decimals=1)
df=df.sort_values('result'ascending=False)
attr=df['name'][:
10]
v1=df['result'][:
10]
#生成柱状图
bar=Bar("抖音大V平均视频点赞数TOP10(万)"title_pos='center'title_top='18'width=800height=400)
bar.add(""attrv1is_convert=Truexaxis_min=yaxis_label_textsize=12is_yaxis_boundarygap=Trueyaxis_interval=is_label_show=Trueis_legend_show=Falselabel_pos='right'is_yaxis_inverse=Trueis_splitline_show=False)
bar.render("抖音大V平均视频点赞数TOP10.html")
8、平均视频粉丝数TOP10
妥妥的娱乐圈大佬。
反正我是一个没关注,你们呢?
可视化代码如下。
defcreate_avg_fans(df):
"""
平均粉丝数
"""
df=df[df['videos']>]
df.eval('result=fans/(videos*10000)'inplace=True)
df['result']=df['result'].round(decimals=1)
df=df.sort_values('result'ascending=False)
attr=df['name'][:
10]
v1=df['result'][:
10]
#生成柱状图
bar=Bar("抖音大V平均视频粉丝数TOP10(万)"title_pos='center'title_top='18'width=800height=400)
bar.add(""attrv1is_convert=Truexaxis_min=yaxis_label_textsize=12is_yaxis_boundarygap=Trueyaxis_interval=is_label_show=Trueis_legend_show=Falselabel_pos='right'is_yaxis_inverse=Trueis_splitline_show=False)
bar.render("抖音大V平均视频粉丝数TOP10.html")
三、总结
我们常说,刷抖音就是浪费时间。
讲道理,抖音上也是有不少技术流的大佬,当然内容上更趋向于视频制作。
比如下面这几位,鼎鼎大名的「黑脸V」。
所以,也不全是一无是处。
如果哪天你也能学会制作出那些吊炸天的视频,也是一种收获。
当然路很长,慢慢走~
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 分析 挖掘 一下 大家 最喜欢 视频 哪些