编者按:本文经微信公众号计算广告(ID:Comp_Ad)授权 SocialBeta 转载,作者北冥乘海生。
关于「数据从哪里来」这个问题,是广告行业里伪科学、骗子和不明真相者聚集的重灾区。今天咱们就来聊聊这个话题。
倒退几年的广告技术公司,比今天要好干得多:只需要给客户抛出个「精准营销」的概念,再配合以美妙的案例故事与娴熟的作弊手段,就可以轻松获得预算。不过近年来,民智渐开,被各类靠谱与不靠谱的广告公司轮番忽悠后的甲方市场部也明白了,没有高质量的数据来源,所谓精准营销不过是个幌子。所谓「皇上不急太监急」,急也没用啊!
没有办法,在大数据教甚嚣尘上的今天,大家只好纷纷讲起了数据的概念,特别是抓住了「DMP(数据管理平台)」这根救命稻草。于是乎,今天客户与 DSP 之间的对话往往呈现出下面的走势:
客户:你们的广告技术有什么特点?
广告公司:我们是 DSP,做的是精准营销!
客户:那么你们 DSP 的数据从哪里来呢?
广告公司:我们有自己的 DMP 啊!
客户:原来这样。(原来哪样啊?)
像这样把客户由一个不理解的概念带入另一个不理解的概念,从而让脸皮薄的客户假装明白,是一个效果很不错的战术。不过我们不能假装明白,到底什么是 DMP 呢?其实这里面有几类看起来相似,商业逻辑却有很大区别的产品。
1.数据管理平台(Data Management Platform, DMP)
狭义的数据管理平台,主要是接受数据拥有者(可能是广告主、也可能不是)的委托,按照其需求进行数据加工,并将加工结果用于指导运营优化、广告投放等任务。其商业模式上做的关键,是「来料按需加工」,当然收取加工费用是正常的。不过既然是来料加工,就不能把「料」(数据)视为DMP的自有资产,也不能将这些数据加工结果用于指导其他客户的商业活动。否则,很容易变成在竞争对手之间倒卖用户的「双面间谍」。
其实这样的DMP,与传统的网站分析(Web Analytics)工具有很强的关系。不过,它可以集成第三方数据采买、对接站外广告投放渠道等功能,而这些是传统的WA所不具备的。
2.数据交易平台(Data Exchange, DX)
这一类数据产品,是从数据拥有者那里广泛收集用户数据,按照自己的逻辑和需求加工数据,并进行数据的直接或间接变现。那么数据拥有者为什么要给你数据呢?当然你要将变现所得与数据拥有者进行分成。其商业模式上做的关键,是「原材料精加工售卖」,当然原材料是要花钱买的。读者们请注意,虽然都是加工数据,真是技术环节上区别很小,但这种产品从商业模式上上完全不同:DMP 是从数据拥有者那里拿钱,而 DX 是给数据拥有者分钱,这里的差别,诸位需要细心体会一下。
数据交易往往要依附于广告的实时竞价过程完成,并且应该以 ADX 为中心来组织,这方面的细节这里就不展开了。
3.受众定向系统(Audience Targeting)
大多数 DSP 热衷于讨论的 DSP,其实不过是一个受众定向系统,它根据本公司所能接触到的各种数据,得到用户标签或画像,用于优化自己的广告系统效果。由于这样的系统并没有对外的直接买卖交易,我们认为完全没有必要将其称为「DMP 产品」。当然,每个 DSP 都在竭力声称自己拥有 DMP 产品的目的,其实你懂的。
产品搞清楚了,更尖锐的问题就来了,巧妇难为无米之炊,真正有价值的数据从哪里来呢?笔者见到的最可怕的情景,是产品经理自己把自己都骗了:以为用起了 Hadoop 和 Spark,建立了数据处理流程,制定了用户标签体系,DMP 就算是完成了,也就理所应当可以提升广告效果了。其实车造得再漂亮,没有油也是跑步起来的。就依附于第三方 DSP 的受众定向系统而言,我们把常见的数据来源和价值简单分析一下。
卖身换数据
从疗效来看,卖身换数据是最靠谱的获取数据模式。在中国,真正成规模、高价值的数据,大部分都被 BAT 这些一线巨头,以及小米、360、京东等平台互联网企业所占有,另外像搜狗、科大讯飞、TalkingData 这样的服务或能力提供商,也有比较有价值的数据来源。第三方广告技术公司通过卖身或下嫁于这些公司,一次性获得稳定的数据来源,是一种可行的选择。当然,卖身付出的代价与经历的艰辛,恐怕也是谁卖谁知道了。
实际市场中,有些并没有卖身的 DSP,也会声称自己拥有了 BAT 某家的数据。如果没有资本上的合作关系,这样的宣传十有八九是谎言。
运营商数据
理论上讲,运营商可以从信道上监听到各网站和 app 的用户访问行为,似乎是力压 BAT,具有了上帝视角的数据能力。于是,「拥有运营商数据」,成了第三方广告技术公司最爱讲的数据故事。可是,实际情况远没有这么乐观:首先,随着 https 的普遍采用(百度淘宝都改了,其他巨头也快了),运营商管道上有很多高价值的数据(搜索、购物)已经拿不到了,这无疑已经废去了多半条命;其次,移动用户行为多发生在 app 内,而 app 与服务器的通信很多本来就不是 http 的形式,而是某种私有的通讯接口,这又废去了小半条命;另外,最致命的一点,中国的运营商是地方割据的经营制度,总部并不能将各省的用户行为数据集中起来,如果有人说他拿到了某运营商的全国数据,就现状而言,可以肯定百分之百是谎言。
那么运营商的数据就没有用的了?不然。其实运营商有一项独有数据源,在移动时代具有非常高的数据价值,那就是用户的位置数据。其他的 Hero app 与 SDK 也可以具有类似的能力,但是数据覆盖率与运营商有数量级的差别。与线上行为数据可以总结用户兴趣类似,如果将位置数据与 POI 信息结合,完全可以将用户的线下行为也映射成用户兴趣。这方面将来的挖掘空间巨大,不知道运营商能不能用起来。
DSP 监听数据
另外一个 DSP 经常讲的数据故事,是通过 ADX 的询价请求收集用户访问网站的行为,在此基础上加工用户画像和标签。逻辑上讲这样的原理无懈可击,不过实践之中确并不靠谱。为什么不靠谱呢?主要是从 ADX 当中得到的有价值的用户行为数据,实在是太少了。读者可以想一想,搜索、电商还是垂直行业网站这些高价值的数据源,有多少会将广告流量送入 ADX 进行变现呢?实际上是少的可怜。
即使算上 PMP、PDB 等的广告交易流量,恐怕 DSP 能监听到的也往往是视频网站、门户和垂直网站首页这样的行为。如果打算根据用户喜欢看芈月传还是都教授,一天到访了几次汽车之家首页来判断他喜欢什么样的车,您觉得那能靠谱么?
当然,这样的数据收集与受众定向过程,DSP 还是必须要建立起来的。不过,对其数据效果,抱着「有枣没枣打三杆子」的态度可能比较务实,也不会有太多的失望。至于在客户面前和市场宣传中大谈这种数据来源的巨大作用,则未免是夸大其辞的。
广告主数据
广告主数据,也就是我们术语上讲的第一方数据。虽然大规模数据来源不好找,但是对于代表需求方利益的 DSP 来说,拿到并利用好广告主的数据,是比较现实可行的方案。
第一方数据主要有两类:一是广告主自己的网站与应用访问数据,精细地加工好这些数据,既可以做到 retageting 上很好的效果,又可以用于指导 lookalike 的人群拓展,这一点已经为大家所熟知。不过,这往往只适用于电商、OTA、在线教育等这类在线服务类客户;对于汽车、快消等非在线服务的客户,靠访问数据来指导广告投放意义并不大。对于这类客户,应该充分重视它们多年积累起来的 CRM 数据。CRM 数据的作用和价值与访问数据很相似,不过用于采用的是手机号码、email 等用户标识,需要一套与 cookie 映射完全不同的方案才能用于广告投放。对这一需求的直接支持,各大 ADX 做得并不好。
购买第三方数据
从第三方以购买的方式获得数据,无疑是将来合理的数据获取方式之一——虽然它目前在中国还不是很成熟。实际上,一些拥有可观数据来源的数据服务商,已经在探索这方面的可能性。特别是在移动环境下,DSP 从用户覆盖量很大的应用或 SDK 那里通过购买的方式得到应用安装列表和其他信息,对于广告投放的指导意义很大。(别忘了,DSP 由于是在后台决策,对终端情况所知甚少。)
对于自己拥有大规模流量的平台来说,出售数据的意义不大。反而是那些有数据但无多少自有流量的产品,进行数据加工和变现的动力较强。我们也希望这样的数据拥有者更多地将数据以作价的形式输入广告市场,让有技术能力但无数据来源的 DSP 能专注于加工和利用好数据,达到双赢的市场效果。不过,数据交易本身的问题甚多,还需要逐步解决。
小结一下,DSP 及其他广告技术公司的精准投放能力,与数据能力的关系甚大。不过,数据能力的强弱并非取决于是否开发了 DMP 系统,而是取决于有多少高质量成规模的数据来源。对于广告技术公司,或卖身大平台,或立足第一方,或采买数据源,总要找到务实的立足点才好。