阅读难度:★★☆☆☆
技能要求:机器学习、数据可视化
字数:1500字
阅读时长:6分钟
本文接上一期《
用word2vec解读延禧攻略人物关系
》,从另外一个角度(色彩),对延禧的剧照及海报的颜色在数据上进行技术解读。通过从网上收集的剧照、海报图片等,经MCCQ算法及word2vec的训练,构建配色图谱,最后通过可视化的方式进行展示。
1
技术原理
网上有一篇分析《延禧攻略》色彩的文章,不过一看就是人工提取出来的颜色。我们用机器提取颜色看看效果怎么样?见下图:
上面的5个是人工提取的,下面的8个是机器提取出来的。从数量上及真实还原图片颜色的角度,机器更加灵活可控。
我们再让机器从画面上提取更多的颜色出来,见下图:
瞬间提取18个颜色,并且可以快速得得到颜色的HEX及RGB对应的色值。
这里面提取颜色的算法是MCCQ算法:
Median-Cut Color Quantization
中位切分算法
“一个蛋糕切成八块只能切三刀应该怎么切?”这道题目应该大部分人都见过吧,中位切分算法的原理有点像切蛋糕。只不过我们是把一张图片的像素投射到一个色彩空间里,这个色彩空间就是一个长方体。假设我们需要提取出6个主题颜色,我们先找到最长的一边切割,保证切割后的2个长方体内包含的像素数量相同,只要不断地重复这个过程,直至我们把1个长方体切成6份,每一份长方体包含的像素数量相同。这6个长方体所代表的颜色,就是我们所要找的6个主题颜色。
2
探索色彩规律
MCCQ除了从1张图中提取颜色,还可以从大量的图片中总结色彩规律。我们先从网上收集一些图片,大概1300张:
先从1300张剧照中提取主体颜色,共计15600个色块,见下图:
密密麻麻的颜色看起来一点规律都没有,我们再次把颜色进行提炼,继续使用MCCQ算法,并且我们把颜色的色值对应到中国传统颜色的名称上,见下图:
如上所示,我们从15600个剧照颜色中找到了20个中国传统色的名称及颜色。
ps:下次有人问到《延禧攻略》用到的传统颜色有哪些,回答以上的20个,是不是显得有文化多了?
3
海报的配色
从网上下载80张海报图片,如下图所示:
我们继续从80张海报中提取主体颜色,共计2736个,同样的也是看起来密密麻麻的,如下图:
我们把2736个海报颜色提取出使用最多的20个,并分类到对应的中国传统颜色上,如下图:
可以看出海报的用色浓重,对比强。除了海报设计的配色规律,还可以针对单张海报提取配色:
4
配色图谱
接下来我们来构建一个色彩的图谱,主要关注颜色配色比例及搭配方案。我们继续使用15600个剧照颜色,先映射到传统颜色空间,然后使用word2vec计算每个颜色的向量。最后,保留前50个用量最大的颜色,节点越大表示颜色被使用次数越多,他们之间的连线表示颜色经常同时出现在一张图片中。如下图:
我们探索下这个配色图谱,把鼠标移动至赫红色,可以查看赫红色建议搭配的其他颜色,及之间的比例关系,如下图:
淡绿色相关的搭配及配色比例:
枣红色相关的配色方案:
以上为全文。
图谱体验地址,公众号回复“色彩”,获取。
-----------
9月
我们在9.1号准备了一期的workshop,帮助0基础的同学掌握编程技能及设计技能,花一天时间即可学会小程序开发&设计。课程特点:线下面对面沟通,高效学习,同时可以获得线上的指导。
领取专属 10元无门槛券
私享最新 技术干货