友盟+李丹枫：数据是互联网下半场里产品人的突围之道

来源：极客公园时间：2017-01-13 17:31:19 作者：友盟+

　　我们在一年期间，我们做了一些数据产品，和做这些数据产品的一些经验。

　　我自己实际上并不是一个做产品出身的，我是一个数据科学家，在美国做了十几年的数据科学的工作，前两年回到国内。

　　回到国内以后有幸参与了一些数据产品的想法的产生，开发，包括上线以后的效果的评估。所以我今天就从一个数据科学家的角度，跟大家讲一讲，在现在人工智能、大数据风口浪尖上，一个产品人应该注意的几点，希望对大家有所帮助。

　　人口红利消失之后，该如何留住用户？

　　第一，我们肯定要看一下大趋势，今年大家听到比较多的词，是人口红利逐渐消失，下面这个图估计大家看了很多，但是我还是要强调一下，我们可以看到中国互联网的用户在 2007 年，大概只有两亿左右。十年以后到 2016 年以后，我们已经迅速增长到 7 亿多，但是我们看这个红线，增长率基本上是直线下降的。

　　也就是说我们以后再用野蛮的方式获取客户的方式，可能就会遇到很大的瓶颈即便是对一些非常新兴的领域，其实竞争也是非常激烈的，现在比如说网络直播、共享单车，这些都是非常新兴的领域，大家也看到了许多的大公司，创业者、投资人也迅速加入战场，把我们本来一个蓝海，迅速的变成一个红海。

　　所以在这种情况下，我们作为一个产品人，我们必须考虑我这个产品怎么样才能够留住我的用户，怎样才能让我的用户发挥最大的价值。

　　一个产品人，我需要仔细看我这个产品的数据，我去判断什么样的用户是我的核心用户。对于这些核心用户，第一我们从哪才能获得这些核心用户，第二这些核心用户怎样才能把他服务得更好。

　　这些如果你只是看一些数据拍着脑袋想肯定是不行的，我们必须要借助一些数据分析，比如说我要看我的用户的用户画像是什么样的，我的核心用户和我非核心用户的画像有什么不同，我的核心用户他们经常都会在哪些地方出现，这些核心用户主要应用的是什么功能，这些都是一个产品人需要从一个数据科学家的角度来仔细的研究这个产品，这就是说，我们在下半场的时候要精耕细作，而不是野蛮生长。

　　其实在今年因为友盟+本身有很大的开发者的客户群体，我们今年也开始接触一些企业，包括一些大的传统企业，他们走进互联网，我们在接触这些企业的过程中，发现企业本身对数据的认识也有了一些变化，其实这个变化不是中国独有的，我记得当时在 2008 年在美国的时候，当时 Hadoop 刚刚起来，我们去跟很多企业谈，企业说我要上大数据，作用的大数据是什么，你给我建一个 Hadoop cluster?，我把数据都扔上去，我所有的数据。我要看什么指标，都可以去 Hadoop 里面把它找出来，先来看，至于说他们想什么，他们也不清楚。

　　中国的企业现在也在经历这样的过程，我跟一些企业谈，他们其实已经慢慢的把数据堆积在 Hadoop cluster?里到渐渐的我要从数据里面得到一些什么，这个数据我花这么多钱搭一个 Hadoop cluster?，我有什么办法让我花的钱物有所值。

　　第一步，数据收集。现在数据收集已经从原来的简单的数据收集，变成了比较精细的数据收集，拿网站统计和移动统计来说，原来的网站统计基本上是基于 PV 和 UV 的，什么人来了这个界面，这个界面被看了多少次，这个文章被点了多少次，移动统计的是说，我有多少用户，我每天多少日活，每月多少月活这些简单的数据。

　　现在的统计产品，渐渐从这些简单的统计走到基于事件的统计，对你产品里面每个细节都可以做到精细的统计，比如说做漏斗分析、留存，这样的话能够给运营很精确的指导。

　　所以从数据收集已经走到了统计报表的步骤。

　　第二步，人工智能。人工智能应用到产品当中，我们可以把它叫做预测分析、预测服务，预测服务和统计报表最大的不同，从我个人的观点，一是说统计报表基本上是往后看、往历史看，历史上发生了什么，我通过统计报表，我有一个很好的总结，我可以通过历史的现象总结出几条规律，这个规律指导我以后的运营工作。

　　预测服务是往未来看，我根据过去的这些数据，我用我自己的知识再加上机器学习的能力，我让机器帮助我判断未来能够发生什么，其实这个事情，我们在日常中已经接触的很多了，比如说现在大家看到的广告，广告很多都是程序化购买，程序化购买实际是机器去判断什么人会对这个广告感兴趣，包括今年双十一阿里的天猫手淘，实际上每个人看见的页面都是不一样的，我们叫千人千面，千人千面就是一个推荐的产品，就是让机器帮助我们做预测，什么人会对什么样的商品有兴趣。

　　还有一点不同，统计报表和预测服务，统计报表是面上的东西，我只能从一个统计级别大面上看，预测服务很多时候是个体级别的，我可以精确到一个个体，我为这个个体提供他所需要的服务，这个在现在我所谓的互联网下半场变得极为重要，因为我们现在的需求，每个人都会有不同的需求，如果我感到你这个产品真的给我做了一个贴心的服务，我可能会变成你这个产品的忠实的用户，为什么说下半场数据和数据产品变得越来越重要了。

　　两张重要 PPT?

　　我今天的演讲 PPT 不多，如果大家要带回去两张，我觉得下面两张是比较重要的。

　　第一张，我会说一下作为一个产品人在做数据产品的时候需要注意的几个问题。

　　第一，目标。我要解决什么样的问题，为什么我要把这个提出来，因为在大数据和人工智能的场景下，很多时候你的客户是不知道他们要什么的，其实你可能也不是很清楚，这就需要大家在一起去想，我有这个能力，我有这个数据，我能够提供什么样的服务，这是过去我做用户需求调研是完全不同的，但是我觉得这点，对于数据创新和大数据、人工智能走到下一步是非常有用的，需要我们数据科学家、产品人，每个人发挥自己的想象力，我们能够推出真正能够解决客户的问题，这些问题可能现在客户都不知道，所以说第一步我们要想清楚我们要解决什么问题。

　　第二，我们有什么数据或者说你能获得什么数据。这实际到我下面的小字，为什么是我做，因为有时候说这个数据源不错，我可以用这个数据源来做一个产品，但是如果你这个数据源不被你控制，人家说拿走就拿走，你这个产品你做完了以后，人家把数据源抽走了，你这个产品就没法往下走了。

　　所以我们一定要考虑，我们有什么样的数据，我们用我们自有的数据，这些自有的数据有什么独特性，我们通过这个独特性推出一个新的产品，或者说我们有一些什么样特殊的能力，这些特殊的能力能够把我们和其他人区分开来，我们通过这个能力跟数据方合作推出新的产品，所以对数据的考虑非常重要。

　　第三，我做出一个数据产品，尤其是预测型的数据产品，我怎么去评估。即便对数据科学家来说，实际上我们会面试很多数据科学家，我有时候问他们问题，他们其实也是回答不出来的，因为对于一个产品的评估，它有很多方面，对一个数据模型，什么样的模型是好，什么样的模型是坏，它有很多方面。

　　我下面会举两个例子，我们今年的两个例子，会对评估做进一步的阐述。当然我下一个 PPT，也会对评估做进一步的阐述，因为我觉得这个评估是对一个预测性产品成功非常重要的一点。

　　第四个是需求，你的市场准备好了吗？

　　联系到第一个我们的目标，往往这些产品是我们想出来的，我们创造出来的，我们觉得我们可以用这个产品给客户解决一个问题。那么客户他是不是需要你来为他解决这个问题。我把这个需求放在这一步里，是因为在数据产品里，我们需要做出一个我们叫 puurkasaet 的产品来。这个产品可能比较简单，但是包括我核心的因素，我再用这个产品去找一些愿意跟我们合作的客户去测试。在测试过程中，客户发现你这个的确能给我解决问题。我们这个产品是一个成功的产品。但是如果客户发现你这个有可能太超前了，我可能现在并不需要，或者你这个并没有触达我的痛点，我现在并不需要。对于产品来说这可能是一个失败的尝试，但是对我们创新来说，我觉得这也是一个成功的创新，因为我如果有 10 个想法，有 1、2 个想法能变成真正的产品，我觉得这已经是非常高的成功率的。因为要做一个好的数据产品，真正解决用户的痛点的数据产品并不是那么容易的。

　　我刚才谈到评估，这里有一个图，这个图我做了两个模型，一个模型 A、一个模型 B，我不解释这个图具体的含义，你可以看到 A 的曲线是在 B 上面的，那就说明从这个测试级来说，这个 A 的表现比 B 好。

　　但是又有两张图，这两张图说明什么，因为我一个数据的模型，实际上有很多参数，这个图是说 A 和 B 的两个模型，参数权重的分布。所谓权重的分布，比如说对于 A 模型，你发现参数 A 非常重要。这个参数 A 可能会对 A 模型的表现它可能贡献额有 30%。B 看起来权重分布基本上比较均匀，如果我把这个模型给你，如果在一个生产环境中，我问你，你是选 A 还是选 B？

　　这个也是要区分的，什么时候选 A，什么时候选 B。如果我做一个数据模型，这个数据模型是给第三方客户使用的，那我强烈建议你选 B。虽然 A 表现好，但是它特别依赖于 A 的参数，如果跟 A 参数相关的信息，如果有变化的话，你 A 的模型会变化很大，这样你会失去控制。

　　所以你对客户是没法交代的，你天天灭火就行了，如果这个模型是在你严格监控的生产环境中，我觉得选 A 也未尝不可，因为如果有问题出现，你可以及时处理。尽管 A 和 B 看起来表现区别不大，但是如果你有上亿的客户，这一点区别能给你造成很大的不同。

　　所以大家在评估模型的话，一个是这个模型的表现，另外是这个模型的稳定性。作为产品人，我觉得这一点是非常重要的，因为数据科学家往往可能跟你说，你上 A 吧，它的表现好。但是你作为产品，你希望你的产品稳定性，你要选 B。这两张图，也是我多年工作经验积累下来，如果你记录要点的话，这两张图你可以带走。

　　今年做了两件事：行为风控和预测付费用户

　　下面讲我们今年做的两个事情。

　　第一是行为风控。

　　因为大家知道今天互联网金融特别火，几千个 P2P 公司。作为信贷公司，最重要的是你风控的能力。我们为什么想到风控这件事情？因为风控最重要的是数据，而我们是中国拥有行为数据量最大的一个公司。

　　我们就在想，我们的行为数据在风控中是不是会有用？我们的目标就是我们要做一个基于用户移动互联网行为的风控辅助平台。而这其中有两个关键词，一个是移动互联网行为，另外一个是辅助。

　　为什么说移动互联网行为，因为我们不是银行，我们不是借贷机构，我们也不是信用卡公司，我并不知道这个用户这些方面的数据，但是我们可以从他们那拿来数据做模型，但是如果他们把数据拿走，不给我，我这个模型就没有用了。

　　为什么说要辅助呢？毕竟我们的行为数据跟风控和信用不是一个强相关的，是一个弱相关的。我希望我的产品是一个辅助的作用，而不是你完全用我的产品做最后的决策。

　　我们的数据是什么呢？就是友盟+用户在移动互联网上的数据。

　　这个体量是什么呢？第一，我们的覆盖率非常高，我们全球采的数据，日活独立的设备是 14 亿，在中国你基本上可以认为百分之百覆盖了。

　　另外行为数据它是可以反映一个用户真实的行为的，因为在金融的数据上他可以作假，但是在行为数据上，他很难作假，他也不会有这个意识来作假。

　　评估是 KS 值，就是一个模型区分好和坏最大的能力，这个 KS 值越大越好，业界这个 KS 值一般来说到 0.4 左右就可以用了。用我们这个模型，我们已经可以达到 0.3 几了，这还是很出乎我们的预料的。

　　正因为有这样的结果，我们跟一些客户去谈，客户对这个模型的接受度还是很高的，我们现在有很多的合作伙伴，包括蚂蚁金服，跟我们做这件事情。

　　从这个产品的想法的产生，数据根据评估到需求，走了一个完整的链路，这算是一个比较成功的数据产品。

　　第二件事情，我们去预测游戏付费用户，为什么要这么做？

　　因为游戏里付费用户比例非常少，大概是小于 5%，很多都是 1%、2%，如果我一个游戏的运营者，我知道现在没有付费的用户，他容易转化成付费用户，我把我营销的经历都花在这上面。我们为什么来做这件事情呢？

　　我们有这么多数据，对于一个游戏来说，你一个新用户，在我们这里是一个老用户，我可以知道这个用户他跨 APP 的行为，我可以知道他在其它游戏里的行为，我可以知道他在新闻娱乐 APP 里的行为，这些行为可以帮助你更好的判断这个用户。

　　比如说我有一部分是付费用户，核心用户。我拿来这些核心用户，我找哪些用户和这些核心用户最相近，从多个纬度，就是这个用户跨 APP 的行为来找。我可以帮助游戏开发者和运营商更好的判断这些用户容易转化为付费用户。如果我能把你 1% 的付费用户变成 1.5%，那你的销售额增长了 50%，这个听起来是一个很好的想法。

　　评估是影响到一定用户的比例下，我检测到这些潜在付费用户的能力，比如说我影响到你 50% 的用户下，如果能检测到你 90% 的付费用户。这样的话，你做营销方案的时候，你可以针对这 50% 的人去做，剩下 50% 的钱，你可以省下来，这个理论上来说，是很有用的产品。但是我们拿这个产品真正跟客户谈的时候，发现对于我们来说，对于友盟+来说，我们大部分游戏用户，他们是中小游戏用户。他们其实对自己的运营控制力不强。他们开发完之后，把这个交给发行和运营的商家他们去做。

　　但是对于他们来说，他们有很多游戏，所以他们的运营是比较粗旷的。这个产品，现在市场并没有特别重视。

　　我最后再强调一下，对于一个数据产品经理比较重要的几点。

　　第一，你要明确你的目标。

　　第二，你要明确你的数据。

　　第三，要认清你怎么评估，这是你后面优化的依据。

　　最后你要看你的想法有没有真正的需求。

　　我今天的演讲就到这里，谢谢大家。

☞点击进入友盟+ 在数据观的企业栏目>>>