用户画像之概述

Source

目录

0. 相关文章链接

1. 产生背景

2. 用户标签

2.1. 什么是用户标签

2.2. 用户标签的作用

2.3. 用户标签制作流程

2.4. 用户标签的五大常见问题

2.4.1. 问题一:没有目标,盲目干活 

2.4.2. 问题二:不区分时间状态

2.4.3. 问题三:行为动机乱归因

2.4.4. 问题四:多目标混合不清

2.4.5. 问题五:结果缺少检验

3. 应用场景

3.1. 精准营销

3.2. 数据化运营

3.3. 推荐系统

3.4. 广告投放

3.5. 产品布局

3.6. 行业报告

3.7. 场景间的共性

4. 用户标注

4.1. 本体论

4.2. 打标签

5. 总结


0. 相关文章链接

用户画像文章汇总

1. 产生背景

        早期的用户画像起源于交互设计之父Alan Cooper提出的”Personas are a concreterepresentation of target users.”。认为 用户画像(Personal)是角色是目标用户的具体表示,又被称 为用户角色,是基于大量目标用户群的真实信息构建的用户标签(User Tags)体系,是对产品或服务的目标人群做出 的特征刻画 。 通过收集用户的人口统计信息、偏好信息及行为信息等,构建出用户画像,可以让产品经 理更好地了解用户,设计出合适的产品原型, 因此,用户画像是用户需求与产品设计的联系的桥梁。

  • 阶段一:早期的用户数据来源渠道少,数据量级小,用户画像的研究主要基于统计分析层面,通过用户调研 来构建用户画像标签。
  • 阶段二:加利福尼亚大学的Syskill和Webert就是通过显式地收集网站用户对页面的满意度,然后通过统计分析逐步学习构建出用户兴趣模型。
  • 阶段三:后来,随着互联网及信息采集技术的发展,CUM 大学开发的Web Watcher以及后来的Personal Web Watcher,可以通过数据采集器,记录互联网上用 户产生的各种浏览行为及用户的兴趣偏好,实现对用户兴趣模型的构建,并随着数据的不断累积扩大而 更新系统模型,用户画像标签也更加丰富。

UserPersonal
    基于用户基本信息(比如电商来说,用户注册时填写的信息)构建标签

UserProfile
    基于用户业务数据(用户产品产生的数据)构建标签

        在大数据时代下,人们产生、获取、处理和存储的数据量呈指数级增长,过去基于统计模型的决策 无法满足人们的个性化要求。逐步演变为 基于数据驱动的决策 ,即如何 使用算法模型 实现用户画像中的 用户行为预测,已经成为产品经理及运营工作人员的关注重点。用户画像的含义也处于动态变化中,是 一个动态完善的过程,这种 基于数据建模的用户画像模型被称之为User Profile 。

目前的用户画像研究主要集中在三个方向上:用户属性、用户偏好和用户行为三个主要方面:

1)、用户属性
    用户基本信息构建标签,比如某个商城会员用户注册时填写基本信息构建标签
2)、用户偏好
    业务数据(订单数据,浏览数据、购物车数据。。)
    喜欢买什么,看什么,玩什么,。。。    比如针对某个商城来说,主要喜欢买什么
3)、用户行为
    浏览数据

  • 其一、用户属性的研究侧重于显式地搜集用户特征信息,主要体现在社会化标注系统领域,通过社会化标注系统搜集比较全面的用户信息,用于多方位的了解用户。
  • 其二、用户偏好研究侧重于制定兴趣度度量方法,评估用户的兴趣度,提高个性化推荐质量;
  • 其三、用户行为的研究侧重于用户行为趋势的预测,如用户流失行为的 预测中,有利于提前发现问题,找出对应策略,防止客户流失;在用户的欠费预测问题中,有利于发现 电力客户欠费特征,为电力公司提供决策支持。

        不同研究领域的用户画像研究方法也会有所差异,常用 的有决策树、逻辑回归、支持向量机及神经网络等模型。

1、第一种Personal被称为用户角色,主要由产品及用户研究人员使用,适用于产品初期的定位与用户调研;
2、第二种User Profile,主要由数据分析人员使用,适用于数据及产品运营的中后期。

2. 用户标签

虽然名字简单,但它确是 用户画像、精准营销、个性推荐、智能投放 等等各种系统的砖石。

2.1. 什么是用户标签

        用来描述商品的,就是商品标签;用来描述业务的,就是业务标签;用来描述用户的,就是用户标签了。常说“小太阳家庭”、“中产阶层”、“爱好时尚”等都是用户标签。有意思的是,我们总是说:生活中不要给轻易给人贴标签。可为什么还要大张旗鼓做用户标签呢?

2.2. 用户标签的作用

        因为面对一个人,出于尊重他人、不带偏见的考虑,我们说不能乱贴标签。但企业经营面对数以千万的用户,就不能一个个去理解,时间和成本都烧不起。如果不加区分,把所有顾客一视同仁,就只能这么地毯式轰炸,如下图所示:

如果有用户标签,就能快速、方便地细分用户群体,锁定更有需求的人,实现更精准的营销/服务。

        不打标签,每次都基于原始数据分析,运营会很纠结的:到底是选买过3次的还是4次的才加活动呢?消费分段选3000,3200,还是3300呢?理论上,每次都这么纠结也是可行的。但是这样做效率太低,并且能思考的维度太少,很有可能累秃了头也没啥进展。

        因此可以基于过往分析成果,预先打上标签,能极大提升效率,实现更复杂、更精准的分析。并且,还能把最后效果记录进标签库,积累分析经验。如 果标签打的对,那我们按标签做的事就能起到效果,标签本身质量也被确认;如果标签打错了,那按标签做的事就会没有效果,后续就能修订标签,打新标签。

        做用户分层和分群,做精准营销,所有结果也可以以标签形式保存。在后续多次验证,从而沉淀管用、区分度高的标签,提升用户画像的准确度与有用性。

        想要达成这种好的区分效果,当然只靠“男女”这种简单的标签是不够的,于是就有了制作标签的过程(俗称:打标)。具体怎么做?一起来看个简单通俗的例子。

2.3. 用户标签制作流程

以通俗易懂男朋友见未来岳母为例,如下对话:

        你看,问的全是用户标签,人家丝毫不在乎你有多痴情,你有多努力。甭整那虚了吧唧的玩意,Show me the 房产证!十八姑娘一枝花,追的人多了去了,就是要大量过滤那些馋身子的小垃圾……

        然而如果只知道回答是“有房”,是不是就能区分好青年了呢?——当然不可以。因为单一维度的标签,信息量很有限。就像单纯说“有房”,那到底是上海的房子还是盐城的房子,是60平小两房还是120平大三房,是全款的还是欠了一屁股债的,通通不知道。因此,丈母娘才会问一大堆信息,逐步规整判断:到底这个小伙靠不靠谱。

这就是制作用户标签的直观步骤:

 依据上图的流程,归纳总共7个步,具体如下:

        做用户标签可以很简单,但想做有效的标签,就会很复杂。它是一个从单维度到多维度,从简单到复杂,不断迭代验证的过程。在这个过程中,经常出现问题。

2.4. 用户标签的五大常见问题

在实际项目中构建用户标签时,如下5个问题至关重要,需要多多考虑。


2.4.1. 问题一:没有目标,盲目干活 

        很多人被“比如性别:男女就是个标签”这句话误导,以为只要做了分类,就算是标签了。至于分出来的类别之间有什么差异,有多大差异,压根没检验过。甚至,你问他为啥这么打标签,他说不知道。领导让打,咱就打,管他呢。
        实际上,即使是同一个原始数据,在不同目标下,打标方式会完全不同。拿用户年龄举例,可能有好几种分类贴标签的方式:

2.4.2. 问题二:不区分时间状态

        比如打一个“高价值用户”标签,这里“高价值”指的是历史消费水平高,还是未来消费的多?很多人傻傻不分,就统计下历史消费金额,然后消费多的就是价值高。但是谁保证用户过去买的多,未来一定买的多??完全不一定。

        注意:如果我们要打的标签是个未来情况,比如未来消费多,意味着我们要做一个预测:用户未来会消费多少。这里就得基于测试或者建模预测才能得到结论,不能简单基于历史数据统计。

2.4.3. 问题三:行为动机乱归因

        比如用户买了产品A,于是就打个“A产品喜爱者”标签。然而用户真的喜欢A产品吗?
们只知道用户买了A的行为,并不能直接推导出动机。
如果想推倒动机,需要基于一段时间
数据分析,并且综合多个维度判断。

        在推导动机的时候要特别谨慎,因为错误的、随意的归因会误导业务行动。明明用户喜欢的是打折,结果缺误判为产品粉丝,最后很有可能狂推一堆产品却没有响应。

2.4.4. 问题四:多目标混合不清

        比如评高价值用户,把活跃度和付费金额,付费金额和毛利几个指标混合在一起,美其名曰“综合评价”。结果搞出来一毛不花天天白嫖的用户也是高价值用户。要是都这么折腾公司就得破产了。

        这类问题,主要是做数据的同学嫌一个维度一个维度切分不体现数据能力,非得整个模型,算个权重才显牛逼。降维可以做,但牢记整个原则:不同类目标不混合。特别是涉及钱的目标。到底公司赚没赚钱,是个很严肃的事。搞混了,是要喝西北风的。

2.4.5. 问题五:结果缺少检验

        打用户标签是希望区分用户,那么最后区分效果,在目标上的差异越大越好,如果差异不大,那打标意义就不大,可以取消标签,或者再做优化。

        遗憾的是,很多公司都是为了打标签而打标签。至于打了标签干什么,用在哪里,效果如何,从来没考虑过。其实,想做出好的业务效果,远没大家想的复杂,关键在于做好:打标-验证-积累-二次打标的过程,持续的进行迭代。

3. 应用场景

        用户画像应用领域较为广泛,适合于各个产品周期,从新用户的引流到潜在用户的挖掘、从老用户 的培养到流失用户的回流等。通过挖掘用户兴趣、偏好、人口统计特征,可以 直接作用于提升营销精准 度、推荐匹配度,最终提升产品服务和企业利润。还包括广告投放、产品布局和行业报告等。

3.1. 精准营销

        常见的营销方式包括APP信息推送、短信营销和邮件营销等。随着运营方式从粗放式到精细化,用 户画像技术能更深入和直观的了解用户,而越了解用户就越能够做出正确的决策,通过产品或服务的潜 在用户进行分析,将用户划分成更细的粒度,针对特定群体进行营销,辅以短信、推送、邮件、活动等 手段,趋以关怀、挽回、激励等策略。既能减少全量推送造成的资源浪费,又能达到较好的营销转化效果。

思考如下两个问题:
1)、大家所有人都收到这个邮件和这个短信了吗?
2)、那为什么这个短信和邮件发给了某一些人, 而另一些人没有收到呢?

        短信和邮件的发送也是有成本的, 所以对于一些企业来讲, 不可能会在每一次营销中对所有人发送短信和邮件, 在不同的活动中, 可能会选取不同特征的一类用户, 对其进行短信或者邮件的营销, 那么这里就需要对用户进行分群。

3.2. 数据化运营

        如果大家是一个公司的运营经理, 现在需要对不够活跃的地区举办一些活动, 刺激用户的参与, 那么应该需要这样的一张图:

        如果大家是产品经理, 现在需要对整个产品的风格进行改版, 那我们应该需要一张图, 来看到我们的产品在哪个年龄段最受欢迎, 要致敬这个年龄段的用户。类似的场景还有很多, 通过数据来说话, 来找到运营的策略, 正是一种非常有必要的事情, 也是发展趋势。

3.3. 推荐系统

        用户画像常用在电商、社交和新闻等应用的个性化推荐系统中。互联网时代下的信息是过载的,用 户量级巨大且用户之间千差万别。如果根据用户的行为习惯,购物或阅读记录来打造基于内容推荐系 统,实现的千人千面个性化推荐可以加深应用的用户粘性。 在电商行业中,推荐系统的价值在于挖掘用 户潜在购买需求,缩短用户到商品的距离,提升用户的购物体验。

        说到推荐系统, 其实现在各种公司都在做, 我们判断未来的所有应用应该都是个性化的, 都是千人千面的, 例如如果在京东上购买了手机壳, 那么京东应该会推荐给我们其它样式的手机壳, 如果买了书,应该推荐给我们更多同类型的书, 就例如如下:

但是问题来了:什么是推荐, 如果针对不同的人, 展示的结果会不同?

其实推荐就是系统通过数据, 找到用户和用户所感兴趣的物品之间的关系, 更抽象和更准确的说, 就是找到用户和商品之间可能的连接. 可以表示为类似如下样子。

可以通过大量的数据样本, 从而使用算法找到User和Product之间的关系, 简单来讲, 这就是推荐系统的实现方式. 那么, 有一个问题:表示一个用户的这些特征如何生成呢, 如何找到一个用户的向量表示呢?

3.4. 广告投放

        广告的本质是传播,是为了某种特定的需要通过一定形式的媒体,公开而广泛地向公众传递信息的 宣传手段。著名广告大师约翰•沃纳梅克提出“我知道我的广告费有一半浪费了,但遗憾的是,我不知道 是哪一半被浪费了”。通过用户画像的技术,从最早的广而告之逐渐转变为精准的定向投放,对用户数 据进行标签化,还原用户的信息全貌。广告主可以通过标签筛选要触达的用户,进而实现针对特定用户 群体进行广告投放,减少不必要的广告费用。

3.5. 产品布局

        一个产品设计之初,有一定的目标用户定位。随着产品的发展,想要得到更广泛的应用,还需结合 用户的特性来做出相应的调整和改变。用户画像技术可以恰到好处地理解用户使用产品的心理动机和行 为习惯,助力产品设计的持续的完善,提升服务质量。

3.6. 行业报告

        通过对用户画像技术可以了解行业动态,常见的有市场分析、品牌受众人群、不同地域品类消费差 异等。这些行业报告可以指导平台更好的运营、把握大方向,也能为相关的中小企业、店铺、媒体提供 细分领域的深入洞察。

3.7. 场景间的共性

前面提到了几个场景和几个问题,现在回顾一下这些场景和问题:

1、精准营销:需要对用户进行分群, 找到某个特质的用户
2、数据化运营:需要生成用户的图标, 所以同样也需要对用户进行分群和统计
3、推荐系统:需要找到用户和商品之间的连接, 所以需要对用户进行向量化表示

如果能有一个系统,把用户特征标注出来,如下:

那么,对于上面的三个需求,,就可以以如下方式解决:
1、精准营销, 按照地域或者性别筛选客群
2、数据化运营, 按照消费能力筛选客群
3、推荐系统, 得到每一个用户的标签化表示

那什么是用户画像呢? 用户画像其实就是对用户使用标签来进行标注,例如:

U_1001:(男, 北京, 宅男, 高消费能力)

用户画像标签表: - 存储到HBase表中
                tbl_profile (表名称)
标签分为两类:(列簇ColumnFamily)
                用户标签:user
                商品标签:item
表的RowKey:
                用户ID:userId
标签值:(列值)
                实际存储标签值:tagValue
                标签字段:tagName
标签信息表:
                tagId,         tagName,                 tagDesc
                384                 男                 用户的性别为男性
                385                 女                 用户的性别为女性
                ............

4. 用户标注

        前面说了几个场景, 这些场景想要实现,都借助于对用户的理解, 直白点说,就标注出来每个用户的特征,, 但是如何标注呢?

4.1. 本体论

        在开始之前, 先介绍一下本体论,在介绍本体论之前看如下图,羊这种可爱的动物大家一定是见过的。

        问大家的问题是,什么是羊?我觉得大家可能给出的比较标准的答案也许是一种有 四条腿、四只蹄、白色覆毛、两只短耳朵、小眼睛、性格温顺 的动物。

        现在把刚才这个结论拆开:四条腿, 四只蹄, 白色覆毛, 长耳朵, 小眼睛, 性格温顺, 动物,这些词并不是羊, 只是羊的符号, 我们说羊有四条腿, 有白色覆毛, 是一种动物, 那这些形容词, 甚至羊和动物这样的名词, 都是真实存在的这个本体的一种符号化表示, 而本体指的就是一个真实的存在, 这种理论, 就是哲学中说的【本体论】, 是亚里士多德的形而上学的基本分支。

        那么和用户画像有什么关系呢,大家仔细想一想, 其实本质上:用户画像就是对用户的符号化表示, 也就是说, 其实 标注用户就是把用户当做本体来进行标注 。

        而本体论也逐渐的发展为描述知识的一个学科,如果大家以后要研究知识工程和知识图谱的话, 本体论是绕不过去的。

4.2. 打标签

采用本体论的思路,给用户打上标签,并存储标签,如下的表示方式: 

1) 用户标签可以存储到HBase表中,使用HBase的列式存储,方便打标签时数据写入,如下所示:

2) 同时,可以将用户标签存储至Elasticsearch索引中,方便需要时进行检索,如下所示:

3) 给用户打标签后,可以获取数据在网页页面展示,构建用户画像系统,示意图如下:

5. 总结

神策用户画像系统

什么是用户画像?如何构建与应用用户画像?

用户画像简介

58用户画像实践