Py学习  »  机器学习算法

利用机器学习,这个APP的用户从0增至400万

论智 • 6 年前 • 561 次点击  
作者:Gabriel Aldamiz
编译:Bing

编者按:本文作者Gabriel Aldamiz是时尚软件Chicisimo的创始人兼CEO,这款APP专注于为女性提供穿衣搭配建议,利用人工智能吸引了众多用户。本文就详细解释了该APP的设计思路和机器学习方法,以下为论智对原文的编译。

三年前我们发布了Chcisimo,目标是自动为用户提供穿搭建议。今天,该应用已拥有超过400万名女性用户,我们在这里将帮助过我们的数据和机器学习方法分享出来。

服装搭配是了解一个人品味的最好工具,了解消费者的品味将改变在线时尚

如果我们想打造一款与人类水平相当的自动衣物搭配软件,那就需要了解人们对时尚的品味。朋友可以给你提供建议,因为她了解你平时穿衣的喜好。但如何建立一个能学习时尚品味的系统呢?

在此之前,我们也进行过与个人口味有关的项目,也同样将机器学习应用到音乐和其他领域中。我们看到协同过滤工具是如何将盲目的音乐行业变得了解用户的、让热爱音乐的人的生活变得更好,同时诞生了几家独角兽。

在这样的背景下,我们提出了这样一个想法:了解人们品味的工具将改变网络时尚。如果你了解某人的品味,就可以提供相关内容和有意义的信息让他们高兴。

所以我们决定打造一款了解人们品味的工具,我们首先关注的是打造正确的数据库,然后开发两款产品:移动客户端和数据平台。

第一步:打造一款可以发布需求的APP

从过去创建移动产品的经验来看,即使在塞班系统时代,我们就发现让人们使用一款应用程序很容易,但留存很难。所以我们专注于小型迭代,以尽可能快地学习。

我们最初推出的Chicisimo的早期版本具有一个关键功能,我们在另一个国家将该软件改了名字,当时甚至无法上传照片。但它可以用真实的数据进行迭代,并获得大量有意义的输入。最终,我们发布了正式版的Chicisimo。我们花了很长时间思考留存用户的真正关键是什么,以及我们需要怎样的算法匹配内容和用户。其中关键的地方有三点:

  1. 利用用户行为确定留存手段(在这里我们是用的是Mixpanel)。我们不仅对用户的行为进行管理,而且还对他们接收到的价值进行管理。对于像Chicisimo这样的APP来说,很难将其概念化。我们认为,将人们接收到的具体可测的价值进行衡量,并对这些事件进行群体分析,然后对收到的价值进行迭代,而不仅仅是对用户的操作进行迭代。我们还定义并删除了反杠杆(anti-levers)(分散主值的噪音),并获得了不同时间段所有相关标准:第一次会话、第一天、第一周等。这些特定标准帮助我们产品进行迭代。

  2. 一旦确定了留存手段,我们就会重新考虑用户第一次使用软件的过程。这段过程是指,新注册用户在软件中找到其价值的最短时间。我们对这段时间有着明确的标准:如果用户在第一次会话的七分钟内没有产生动作,他们就不会再使用这款产品。所以我们需要对他们的体验进行改进。我们还对不同类型的用户进行了测试,观察他们对留存手段有何反应。

  3. 定义我们如何学习。上面提到的数据方法是关键,但在打造一款用户喜爱的产品时,只有数据还远远不够。在我们的案例中,首先我们认为穿什么衣服真的是一个非常重要的问题,我们专注于理解这一问题,同时还要理解我们的方法如何帮助了用户,或者为什么没有帮助用户。这也是我们尊重用户的一种方式。

在我看来,这些关键点是打造这款APP时最让人惊讶的方面。事实上,我们通常会获得从未有过的知识库,帮助我们极大地改进产品。了解这些后,我们一直关注两个方面:如何将用户与问题连接起来,以及如何将用户与产品连接起来。这两种关系中存在着无数细微的事情,我们试图通过了解它们来打造Chicisimo。所以问题来了,我们如何才能更快地学习?

我曾与一位同事聊天,她告诉我:“这不是有关数据,而是关于人”。事实上,从第一天开始我们通过与女性交谈,了解他们的问题以及解决方法,从中学到了很多。我们使用多种沟通方法:面对面交谈、查看女性用户发来的邮件,或者对特定问题寻求反馈。然后互相交流心得体会,同时还寻求外界意见:与其他产品用户交谈。我们还体验其他有趣的应用程序、重新阅读有助于我们思考的文章。这个过程让我们学习,然后开发产品和技术。

直到有一天我们引起了App Store团队的注意,还被选为当日的明星软件,在全世界进行推广。去年12月31日,Chicisimo还入选了App Store团队的精选。

得益于这次曝光,Chicisimo的新访问用户达到957437人,访问次数高达130万次。应用从展示到安装的转化率为0.5%(通常展示>产品页面>安装);ASO转化率为3%,推荐率为45%。

第二步:建立数据平台,了解用户的时尚需求

这款APP旨在了解用户品味,以便提供更好的穿搭创意。在正确的时间提供正确的建议绝对会让人眼前一亮,虽然这个工具制作起来相当困难。

Chicisimo的内容100%由用户生成,这就带来了一些挑战:系统需要将不同类型的内容自动分类,建立正确的激励机制,并理解如何匹配内容和需求。

很快我们就看到产生了大量数据,惊喜之余我们发现,这其实是一场噩梦,因为混乱的数据根本不酷。之后我们决定用部分数据形成一些结构,同时停止创造我们所谓的社交时尚图表(Social Fashion Graph)。该图表是一个表示需求、服装与用户之间关系的结构,这个概念帮助我们构建了数据平台。数据平台创造了高质量数据集,能够将学习与训练相连接,让app随着每个新品味的出现而改进。

我们将服装看成播放列表:一身搭配是可以一起买到的组合。使用协同过滤,这里捕捉到的关系可以让我们在app的不同区域提供建议。

数据中仍然存在许多噪声,最困难的事情之一就是理解用户如何以不同的方式表达同样的时尚需求,这使得内容和需求的匹配更加困难。如何捕捉这种多样性,如何在它们之间建立联系?我们创造了一个收集概念的系统,并以不同的方式捕捉表达相同需求的等值,最终建立了世界上所有的服装需求清单,我们称之为本体(ontology)。这真正清理了数据集,并帮助我们了解了我们所拥有的数据。这种理解有助于更好地产品决策。

现在我们明白,一套服装、一项需求或者一位用户的身上附加有大量可理解的数据。构建数据给了我们控制权,处理非系统的数据为我们提供了知识和灵活性。

最终我们得到了如今的系统,它可以学习一套穿搭的意义,还会回应某种需求,并且了解某位用户的品味。

我们面前的工作量十分巨大,但是一切都在控制之中。我们目前开拓的新领域之一是在社交时尚图表中添加第四个元素:可购买的商品。这个系统能够自动连接到穿搭中的单品,帮助顾客决定是否购买。这非常令人激动。

第三步:算法

回想我们为音乐和其他产品构建推荐系统时,这些非常容易。首先,如果用户喜欢了系统推荐的歌曲,系统很容易就捕捉到。然后,还很容易就捕捉到每个人听这首歌的顺序,因此就能把握其中的相关性。有了这些数据,我们可以做很多事。

但是,我们很快就发现时尚存在着它自己的挑战。并没有一种简单的方法能将服装搭配和单品相匹配;另外,该行业没有捕捉到人们描述衣服或搭配的方式,所以许多经营者与购物者之间信息不匹配;最后,机器很难明确某种穿衣风格并将其归类。

现在,深度学习带来的新工具可以添加到其它机制中,并解决原来的难题。获得了正确的数据集,我们就能专注于服装推荐系统,并通过算法而不是花时间收集和清理数据来为用户提供价值。用户的个人化风格可以像元数据一样可行,并且是透明的。由于Chicisimo已经大受好评,我们可以将这些算法的早期结果隐藏起来,利用反馈不断改进。

谷歌、亚马逊和阿里巴巴为什么都进军服装业?

服装搭配是美国价值1230亿美元服装市场的重要元素。数据也是许多从业者将技术应用于穿搭的原因:服装搭配是一种日常习惯,并且是吸引和留存消费者并捕捉数据的重要手段。亚马逊、谷歌、Zalando等公司都推出了Shop the Look服务。

谷歌最近推出了一项名为Style Ideas的新功能,展示了一件产品能在现实中怎么穿。同月,亚马逊推出的Alexa Echo Look能帮你挑选衣服,而阿里巴巴的人工智能搭配师帮助该公司在双十一期间创造了销售记录。

未来十年

一些人认为时尚数据与2003年的音乐数据地位相同,即将发挥重要作用。好消息是,我们每天都需要思考穿什么,买新衣服的需求也不会消失。

所以十年后我们会发展成什么样?人们对穿衣的品味数据会打造独特的在线购物体验吗?机器学习将如何改变电子商务?让我们拭目以待!

原文地址:hackernoon.com/how-we-grew-from-0-to-4-million-women-on-our-fashion-app-with-a-vertical-machine-learning-approach-f8b7fc0a89d7


今天看啥 - 高品质阅读平台
本文地址:http://www.jintiankansha.me/t/iZArFZo3bR
Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/7712
 
561 次点击