为电商网站构建出色的搜索功能绝非易事。搜索功能除了要让消费者找到高度相关的商品外,更重要的是如何在短时间内为其找到心仪的款式。如果搜索可以做好,卖家商品也就获得了更多的展示机会,消费者也有了更靠谱的选择,最终将带来更多的销售额。
在Etsy,搜索功能要面临更大的挑战。因为平台的特殊性,该网站的库存不是可以整齐分类的大规模生产的商品。相反,其200万商家提供的6000万件商品中有75%是手工制作的,可以说每件都是独一无二的。从搜索关键字和消费者给出的信息中很难提取出与产品listing相匹配的关键字。
Etsy的首席技术官Mike Fisher说:“我们的卖家不会在入库时输入‘蓝色衬衫’这样的产品描述。”那样意味着将标准搜索技术应用于含有海量商品的网站上出现的搜索结果只会具有普遍意义而不能“一击命中”消费者需求。Fisher举例说:“如果我们输入‘包’,它只会向我们展示不尽其数的包(而不会因风格而缩小范围)。”
Etsy认为,平台要想提高搜索质量,向消费者展示的商品不仅要符合他们的搜索条件而且要能得出符合他们特定审美偏好的商品。这样一来,也能够增加他们在看到搜索结果时,会喜欢他们所看到的东西的几率。这对买家和卖家来说都是一个福音。但要想这样做公司需要“教会”它的搜索引擎如何识别风格。
Fisher说,经过大约一年的努力,Etsy已经训练出了一种机器学习模型,可以根据文本和图片线索有效地确定网站上符合该风格的商品。该公司即将开始在Etsy上测试这种基于新算法的搜索结果。而且Etsy认为,它所开发的技术的功能给应用程序带来的益处远不止是让搜索更具相关性这么简单。
表达自我的43种方式
在Etsy的技术专家需要量化风格时,该公司的销售团队的工作人员已经花时间了解到了“市场在销售什么、人们在买什么、平台上人们在制作什么”这些便于机器学习的基础信息。该团队运用这些数据量化了43种不同风格的商品,如“浪漫”、“几何”、“星际”、“极简抽象主义”、“热带”、“中世纪”、“质朴”和“波西米亚”等。
Etsy卖家甚至曾经还制定了一份包含某一特定风格的13万条listing列表。这对于他们来说可能尚且可以满足销售目的,但是在训练算法时却显得微不足道。以43种风格作为框架,Fisher的团队从一个月的搜索查询中收集了300万个数据点,以供其机器学习模型使用。
使用现成的ML模型(机器学习会在对数据进行训练后生成一个模型,之后该模型对测试数据进行预测,预测结果为每条数据属于哪种类别)可以很好地解决许多AI挑战。但是Etsy目前还没能这么做。Fisher表示,由于卖家在描述中大多不能准确地传达产品的风格,因此只扫描文本会产生不尽人意的结果。同样,标准的图片识别方法也无法独立完成工作,因为产品风格不单是由色彩花纹或其他易于算法接收的视觉效果决定的。
Etsy在一个模型中找到了它的解决方案,该模型将文本分析与基于其43种风格的图片识别方法相结合。例如,算法会将某个绘有鲸鱼图案的艺术品归入“航海”的主题中,无论该商品listing是否包含该关键字。这一功能开辟了将消费者引导到其他航海主题产品的可能性,即使他们与“鲸鱼”无关。
(图源:Etsy)
有一个令人放心的迹象可以表明该算法正确地对产品进行了分类:当Etsy绘制出已识别其样式的商品销售图表时,显示它们就已经被算法“读懂”了。被模型识别为“热带”的商品在夏季达到其销售峰值,“浪漫”属性的商品在情人节和与送礼相关的其他节日期间表现优异。Fisher说:“这让我们坚信,不仅我们的款式识别准确无误,而且它们确实引起了消费者的共鸣。”
到目前为止,Etsy在致力于读懂风格的路上一直在创建、微调和测试其算法。现在该公司已准备将其投入使用。很快它将根据特定用户执行的最近10次搜索来测试基于风格样式的搜索结果,即使他们搜索相同的关键字,平台也会为每个人提供一组自定义产品。这只是风格识别算法初始阶段最直接的作用——改善用户的产品发现。
除了搜索之外,Etsy还会将算法的机器学习技术应用到网站的其他方面。在测试中,Fisher的团队对商品给出了自身的“直接式样评分”,用来体现它们呈现出的特定风格的强度。这么做是符合逻辑的,因为呈现出特定外观的产品,如星际元素强烈的商品或者天体产品本身,要比那些在风格上打擦边球或风格不鲜明的产品要卖得更好。这些数据可以用于相关的卖家工具,帮助卖家确定他们是否具有强烈的个人风格,这在琳琅满目的手工艺品的修罗场里至关重要。
(编译/雨果网 谢欣欣)
领取专属 10元无门槛券
私享最新 技术干货