当前位置:网络视听大会 > 新闻中心 > 行业聚焦

肖建兵:建立客观科学符合市场需要的网络视听播放量数据体系

2017-12-05 来源:流媒体网

      【流媒体网】消息:11月30日,以“新使命、新视界、新动能”为主题的第五届中国网络视听大会在四川成都召开,CSM副总经理肖建兵出席了此次大会以“更科学、更客观的网络视听播放量统计”为主题的视听数据高峰论坛并发表演讲。

  以下为肖建兵演讲全文:

  很荣幸有机会和大家一起分享,关于网络视听数据我们的一些想法和主张。

  应该说,今年以来网络视听数据方面的新闻比较多,而引发了行业的关注,像《择天记》、《三生三世》。我们作为数据公司,更关心的是点击量这个指标是否能够科学反映网络视听数据节目的收视效率,能否客观反映作为网络视听节目在观众当中的的影响力。

  举一个例子,无论是在电视和网络上的一个热播剧《那年花开》,证据正片长45分钟,非会员有贴片广告,非会员产生数据行为的时候贴片广告播放完成,会员是直接点击直接进入正片。但是进入之后就产生了点击率,进入之后,那用户离开的时间点就很不确定了,有的看一分钟就离开了,有的广告还没有看完就离开了。

  那么用户实际收看时长是多少?看一分钟,看二十分钟,看四十分钟,它对受众影响力是完全不一样的。

  另外花絮和预告片的收视行为是否可以纳入节目整体收视统计当中,这也是比较大的问题,我们知道从广告经营角度来说花絮和预告片是套在正片里面一起走的,但是针对节目花絮就是花絮,正片就是正片。所以我们认为点击量不包含观众收视时长,它无法全面反映节目视频播出效果。

  假如说对于贴片广告来说,第一位的贴片广告可能会进入反映,但是首位之后第二、三位的其他广告位是没有办法准确的反映的。对于电视光中的收视效果更没有办法反映。

  我们拿五个人,在不同类型的收看时间,正确的描述说这五个人对《那年花开》收视行为,这个视频实际收视率为47.1%,这意味着平均45分钟当中,每一分钟有2.4个人在收看,我想这个数据仅仅是说这么多网民点击了多少次,这个是无法涵盖的。

  所以我们觉得能客观反映网络视听节目收看效果的指标能够形成行业共识,我们列举了四个指标,我们觉得这四个指标能够客观反映真实节目的收视效果,共同点这四个指标都包含节目收视时长。这既代表了影响力,也代表了收视效果。

  也归纳了目前网络视听节目相关数据现状,从节目内容开始,比如到通过爱奇艺、腾讯、优酷、芒果TV这些网站进行的传送到达终端,然后经过宽带和运营商,包括移动运营商到了终端,然后用户通过不同终端进行收看。这个过程当中产生了一系列的数据,网络视听平台产生的数据可以通过各种接口进行提供,运营商后台也会产生相关数据,在终端这一侧监测方可以通过各种植码和爬虫技术可以获得相关数据,在用户方第三方数据公司通过抽样调查也能得到用户的收视数据。这些数据有它们各自的特点。

  我们把这些数据做了一个分类,左边是消费类,右边是专业类(图示)。什么叫消费级和专业级呢?我们可以定位为消费级数据以公关为用途,数据欠缺完整性、客观性、公正性,不具有专业参考价值。专业级应该说是具备完整性、客观性、公正性,可以用于整个市场和行业评估。

  这几类数据我们就放了进去,运营商数据因为它常常会由于加密方式缺乏完整性,处于中间位置。我们经常提到的爬虫类数据,我们认为它是非常严重的偏消费类,是属于各种公关用途的。专业级包括监测方基于网络视听接口的数据,和监测方SDK的数据,包括抽样数据,我们认为是偏专业级的。这里面最全的是网络视听平台后台数据,但是放在中间偏专业位置,是因为它缺乏审计。

  这些数据我们总结它有各自的优势和劣势。比如运营商数据无法到人,大部分情况下涉及到保密的问题,是一个非公开的数据,要运用到个体是不可能的,因为涉及到个人隐私。同时,加密情况下又且法完整性。网络平台数据是一个全量数据,很好,但是无法到人,同时单一的网络视频平台有很多,又缺乏代表性,接口数据受平台限制很大。抽样数据很好很完善,它有个人信息,但是由于抽样数据对于个性化网络媒体长尾数据分析实际上是有欠缺性的,同时关键的是收集成本比较高。SDK的数据无法到人,也是受平台的限制比较大。爬虫类数据缺少完整性,无代表性,还有网页当中没有显示的就没有办法采集。

  从需求侧来看,对于整个行业需求来看,行业对于网络视频需求分两个方面,一个是广告效果评估,一个节目效果评估。我们先以节目效果评估节目收视效果评估,来自于制作机构,网络视听平台,监管部门和媒体融合部门,对于节目收视评估数据都有方方面面的诉求。他们在各家网络平台的收视效果,还要把这些数据与电视收视数据进行评价。网络平台数据,虽然每个网络平台都拥有存量数据,收看时长,点击率,但是要看它们愿不愿意毫无保留、客观的分享。同时各家网络平台后面数据标准也不一致,所以尽管现在有数据,而且数据都很全,但是从目前来看利用起来还是很困难,很复杂。行业主管部门也需要各个平台的传播数据作为宣传管理服务,但是所面临的情况是媒体融合导致了节目视频传播模式越来越复杂,想获取各个途径的完整的数据越来越困难。这张图显示的是节目通过电视,所以在这种情况下想获得完整收视效果评估数据难度越来越大。

  面临同样困难的,还是刚才何台讲的媒体融合,媒体融合在整个传统媒体当中在如火如荼的发展,但是面临的一大困境就在于没有真实可信的数据对媒体融合产生效果做评估,这不是各家不愿意做,而是事实就是这样,我们给不了这样的数据,一方面媒体融合都是以新闻、短视频为主,很多都是二十秒、三十秒、一分钟,新闻对于短视频来说一分钟都算长的了,各方用各种监测手段监测不出来,那就需要用其他数据,其他数据当中传统模式越来越复杂,导致数据收取牵涉的利益格局越来越复杂,这就是我们这方面所面临的困境。

  所以我们认为建立客观科学的符合市场需求的网络收视收拾数据的体系,要建立这样一个体系有助于行业各方能够客观了解内容传播的影响力和收视效果,这对于行业发展至关重要。对此,我们有四个方面的建议或者主张。

  第一,以科学的方法建立客观科学的网络视听收视数据体系。只有方法是科学的,最终的数据才是科学的,这当中要有监督全量的数据或者科学的抽样,我们认为这两个数据,要用科学的方法。

  第二,规范网络视听收视效果的数据指标和数据目录。要采取包含时长的数据指标客观反映节目收视效果。

  第三,积极发挥第三方的作用,实现各方行业利益实际利益格局之下,通往理想之路从来不会平坦,但是要充分发挥行业协会和专业数据公司作为第三方角色的作用。

  第四,推进网络数据体系建设过程当中,要积极处理跨电视大屏和网络视频的数据统一。

  那什么才是科学的方法呢?基本原则就是所获得的数据必须要有完整的收视时点和收视时长,我觉得这是基本原则,缺乏这两个原则,仅仅是说爬来的不行,他从什么时点开始收看,收看了多长时间。基于这样的原则,我们认为有两种方法,第一种科学的方法就是实施一个视频内容的内容加码,它能完整的获得各种数据应该说是科学的方法之一,中国网络平台投入平台比较多,实际上还有各家统一标准的问题。科学方法之二就是要建立一个科学抽样的大样本调查体系,这也是能够获得科学建立数据体系的另外一种方法。

  为什么要强调科学的抽样?你要想代表全国网民,应该是怎样的一个抽样?比如说我们要把整个全国的地区分十六层,然后在里面再进行多阶段的抽样,然后反过来在数据统一当中再来。为什么强调这个,也是因为对于网络个性化的收看,有很多长尾的个性化的收看,你要不靠收视量,用大样本来凑,凑成一个大样本想要代表一个整体,我们没有办法说它是科学的。

  所以这两种方法,一个叫全量数据,第二个是科学抽样,为什么只有这两种方法才能真实反映数据全貌呢?我们做了一个数据图,这是一个真实的全量,真实的全量我们是不可知的。我们知道的是理想状态下的自我报数,我们能看到各个视频网站几个大平台都在报数,我们相信报数有真实的,我们也相信这个报数是经过了“美白”效果的,有自我修饰的作用。第三个是有抽样的大样组数据,景观不能精确的反映这个人的全貌,但是能客观反映这个人的基本全貌。第四个就是无抽样的大样组数据,它就有可能导致局部的缺失,有抽样和没有抽样差别就大了,7亿多网民我们如何才能构建一个全国的大样本群体代表7亿网民呢?我觉得这是一门课题。第五个就是爬虫数据,它能反映吗?通过我们的实践来看,是不能反映的,它有严重的扭曲的。

  所以,我们在所谓的科学方法当中,我们要强调全量,有监督的全量,和有科学抽样的大样组的数据,所以这也是我们建立科学网络视听收拾数据体系的两个方法。

  第二点倡导规范网络视听收视效果的数据指标。刚才我们讲点击率只能反映贴片当中的第一位置的广告,要求第一位置最好还不是轮播的。但是要反映整个网络视听节目收拾效果,节目影响力,观众还需要更客观、真实、全面的指标,这些指标的原则就是要以收视时长为核心,要建立以收视时长为核心的网络视听指标体系。同时要规范实际使用的边界和场景,在这当中我们列举了四个指标,这四个指标我们认为很重要,为什么呢?现实当中我们看到媒体和公众对几百亿,或者对各种网络视听数据的误解都是来自于自我美化、修饰数据当中的不规范数据指标,采用不规范数据指标所造成的,实际上都是误解,真的还是只有几百亿,但是使用的指标还不是很客观,容易引起整个行业的误解。

  科学的指标我们还提倡受众化,因为都是以观众、个人为核心,不是以机器为核心,不是以终端为核心,即使是有监督的全量的数据,拿到之后依然要通过更科学的方式把一个终端数据变成个人数据,我们觉得这个是很重要的。所以应该说行业需要反映网络视听用户实际成本的沉淀数据,而不是设备化和终端级的数据,一定要变成个人化的受众化的数据。

  第三个主张要积极发挥第三方的作用。网络视频传播路径比较多,传播利益格局也比较复杂,我们一个朋友从传统媒体进入到视频网站,去之前给我们讲咱们的电视,人家的都是实时能够得到结果的,点击多少次都能知道。但是他去了之后很失望,因为他根本拿不到他实际节目的点击数字,为什么呢?就是因为格局很复杂,的确是,我们也理解,在方方面面的格局很复杂,想获得一个真实的数据还是挺困难的。所以在这个过程当中,我们要发挥第三方的作用,行业主观协会的作用和其他专业数据公司的作用,能够协调好各方面利益,为行业提供更正、客观、准确的数据支持,因为最终获益的大家。我们认为抛弃无标准的自我报数,拒绝消费娱乐化数据规范自我报数与数据共享标准。

  什么叫实施有管理的自我报数?现在整个行业面临一大难点,就在于以新闻短视频的融合传播,虽然没有可靠数据来做评估,而且又很分散,大家又是为了整个主体宣传过程当中大家都来实施。在现阶段市场利益主体又没有大的市场利益,在这个过程当中为了宣传导向的发展要有数据评估,那怎么办?可以由行业协会来协调。统一剪辑标准,甚至统一新闻短视频的播放源,通过有管理的报数的方式,来实现新闻短视频融合传播媒体数据的收集和采集。长视频也是如此。

  在长视频这块,今年引起了媒体关注,所以我们建议主管部门和行业协会能够以节目收视为导向,整合电视与网络长视频数据发布标准,规范并加以指导。尤其是目前的热播剧和综艺节目是全民关注的热点,它反映了整个社会的名义和社会价值观,不规范使用往往会造成负面影响,这对于整个行业发展其实是不利的。

  第四个主张就是在推进整个数据的建设过程当中,要积极推进跨电视大屏和网络视频的数据统一,无论是广告跨屏数据还是收视节目跨屏数据在行业发展当中都是同等重要的,在这个过程当中使用同源数据方式是理想,同源数据更能准确反映一个人对同一部电视网络收视行为。在座很多专家都是为实现这个指标努力了很多年,应该说非常困难。由于受外界客观条件限制,业界还没有一套有效的跨屏数据的标准。所以,我们主张无论是对剧和综艺节目等长视频,要建立跨TV和网络的收视数据体系,最后得到跨屏总收视率的数据。

  广告同样如此,从现在产业格局来看,对于电视广告和网络广告两个行业分别都有自己的监测体系和效果评估体系,但是市场上缺少跨电视和网络的数据体系,原因是什么?原因是各家都不理各家,原来电视和网络广告都是各自发展各自的,是整个广告增量的时代。但是这两年到了存量时代,广告主越来越关注我在存量时代当中如何完成电视和网络广告两边最优化的配比,所以这个过程当中两边数据公司要加强合作,摆脱过去各自独立,互补往来的情况。从国际发展经验来看,跨屏统合的数据,跨屏广告效率的数据会使广告投放效果变得更优,所有和Facebook进行跨屏的投放案例当中,电视跨到这边的,Facebook贡献是多少,电视贡献是多少。实际上国际这方面的经验证明,在这种情况下对广告主的利益是一种保证,也能更加促进电视广告和网络广告能达到最优化。所以这方面,无论是CSM和CTR未来也会逐渐推动电视和网络两边广告监测和效果评估公司,我们一起来合作,一起来推动,建立一套有效的跨平台广告数据的体系,然后推动整个行业的发展。

  最后,我也代表徐总表达CSM和CTR在视频受众化道路上会秉持开放、合作的态度,期待与大家的合作,无论是行业还是其他数据公司能够结伴同行,为能够建设客观、科学符合市场需要的网络视听数据体系贡献自己的一份力量。

  谢谢大家!

责任编辑:张君华
报名购票 大会公众号 手机官网 返回页首