好久没有更新了,今天小周来求偶,呸,是做一期关于近期B站求偶视频的分析。
求偶如火如荼啊
想法起源很简单,近期「我在B站学习」的时候啊,经常刷到下图所示的五花八门的求偶视频,可谓是五花八门,八仙过海啊。万物皆可卷,「求偶视频也卷起来了」,你的求偶姿势不正确,求偶成功的概率也低很多。
这个时候广大有求偶需求的小伙伴就有疑问了,「到底怎么样在B站上求偶才是正确的姿势呢」下面我们来科学分析一波
1 求偶视频相关数据
主要是通过在B站搜索字样得出的前50页视频的数据
视频up主
视频名字,时长,上传日期,视频链接
视频播放量,点赞数,收藏数,弹幕数,投币数
本来还想获取封面图片调个api来个up主的性别和颜值分析,可惜技术太菜了没搞定
2 求偶视频热度
B站求偶视频发布量
搜索到的求偶视频最早是于2016年10月上传的,月度视频量一直处于低迷状态,直到2021年7月份,视频量突然大幅度增加。
对标题进行人工智能处理,发现之前的求偶视频大多是上传的「动物求偶」视频,在2021年7月及之后的视频更多是「人类求偶」,所以后续的分析都以2021年7月之后的视频为准。
去掉爬取到的up主为和的动物求偶纪录片,视频有66个,剩余有634个视频供分析。
动物求偶纪录片标题词云3 求偶视频质量分类
家有家法,卷也要有卷法,我们需要定义判断求偶视频质量优劣的卷法,进一步筛选出优质视频,供广大求偶人士借鉴学习。
高低质量定义
现在我们有各个视频的时长,播放量,点赞数,收藏数,弹幕数,投币数,如何来判断视频质量呢?
收藏,点赞,发弹幕,投币等行为都代表观众对视频的某种喜爱程度,我们可以考虑给每个指标设置一个符合此逻辑的权重,给各个视频打个总分,以总分来判断视频的高低质量。
层次分析法判定权重
那么「如何更为合理的赋予权重呢」?这就需要用到数学建模里经常见到的「层次分析法」啦。层次分析法是多目标决策问题 的一个解决方案。
建立层次模型
层次模型
目标是为了筛选高质量求偶视频,准则包括收藏,点赞,弹幕,投币,方案即为各个待分类视频。
构造判断矩阵
判断矩阵其实就是拍脑袋
拍脑袋法则
经过专家(我)拍板,构造判断矩阵如下
作一致性检验
准则层:最大特征值5.047158,CR=0.009508,检验通过
此处鸣谢的代码
各个指标权重用权重计算各个视频质量分
按照权重计算得分并均一化(Min-Max scaling),最终转化为满分为100的标准得分,一顿操作下来得到得分分布如下图所示
求偶视频得分分布
第一100分-卧龙
第二23分-凤雏
查看具体数据发现最高分100仅有一个,且附近是断层的,我们去掉这个最高分再看一下分布
大部分求偶视频都处于0-5分的水平,占比达到97.9%,5分以上的视频仅有13个。也不整什么聚类模型了,「这13个视频是当之无愧的高质量求偶视频」。
4 高质量求偶视频特征
康康这13个高质量求偶视频有何特征,以便大家模仿学习一下如何求偶
视频封面分析
这个封面越好看,流量越高,我们所说的质量也就越高。显而易见,就不进一步用数据说明了(我爬不下来封面)
颜值就是正义
视频标题分析
好的标题事半功倍,从这13个的标题来看,「高质量」这个词汇是流量密码,多多引用~
视频时长分析
从上述散点图来看,「视频的得分与视频时长无明显线性相关关系」,视频时长平均为172秒,其中高质量视频(TOP13)平均为201秒,大家可以根据自己的话痨长度自由发挥。
5 求偶建议
经过一顿操作,最后的结论是求偶吧,首先封面好看点,其次标题党一点(比如用高质量字眼),最后话术可以参考我们筛选出的B站上的高质量求偶视频(Top13),这样就更容易获得传播流量。
当然最终求偶转化率的高低(成功找到对象)还是要看缘分,听说B站最近有个叫「国王排名」的动漫特别火,利好求偶哦。
领取专属 10元无门槛券
私享最新 技术干货