这次疫情期间,产生了很多的“文学作品”,姑且叫“文学作品”,泛指一切跟疫情有关的文字创作,比如博客、微博、日志等,很多是通过自媒体发布的,正面的、负面的都有。但这些不是本文要讨论的重点。
阅读这些“文学作品”,我们会发现:越是阅读的数量越多,越是感觉难以把握事实。一方面关注着主流媒体的报道,一方面却又特别留意小圈子的“转发”。每个人都在从一大堆泛滥的信息中去寻找真实有用的信息。阅读量大的文章未必是最有价值文章,影响力大的媒体(包括自媒体)发布的内容未必都经得住时间的检验,不少的内容很快出现“反转”。所以,得让子弹先飞一会儿。
其实,在媒体上特别是自媒体、新媒体上所发生的一切,从大数据的角度来说,一点也不奇怪。实际上,数据(内容)的产生本身带有局限性、片面性,因为这跟数据获取的方式、渠道有关,而且,跟数据传播者的意图有关,跟数据分析者想要表达的观点有关。数据未必就反映了事实的全部。所以,其实,对读者来说,要想获得“疫情文学”背后的真实,需要我们自己具备一定的“数据洞察”的能力。
数据洞察,是指从数据当中通过挖掘、建模、分析等,形成对业务开展具有实际指导意义的预测或判断,以利于做出决策。数据洞察的要义,在于要推动做出正确的决策,而不仅仅是停留在分析层面。
基于数据洞察的文学创作,有一个典型案例,就是《纸牌屋》。Netflix首先收集观众搜索的内容、评价和反馈,结合该剧的收视率等数据,进行选角和剧情设定,从而迎合观众的期望。
其一,Netflix会采集观众每日的观影数据,如时长、在选择影片上花费的时间、回看和停止时间,通过这些数据形成观众喜好。其二,建模预测观众未来最希望欣赏的电影,按观众的喜好设定角色和剧情。其三,观众只要登录Netflix网站,其每一次点击、播放、暂停甚至看了几分钟就关闭视频,都会被作为数据进入后台分析。Netflix之所以采用一次性播放13集《纸牌屋》,就是因为从数据中分析出,不少观众不喜欢在固定时间一集集地等着看,而是在有时间的时候一次看完……Netflix原本是一家会员订阅制的流媒体播放平台,《纸牌屋》给Netflix开创了全新的盈利模式。
最简单的例子,一些网络连载小说,在创作的时候,作者会根据读者的评价或期望来写作。再比如,如果你浏览了某购物网站的某款商品,接下来你就可能在很多网页中看到类似商品的推介广告,因为你的采购意图已经被数据“洞察”过了。所以,我们在看一些社会新闻的时候,如果在新闻内容后面,看到有正反两方面的评论还算正常,如果只看到一边倒的评论甚至明显超出常识和底线的评论,其实是“水军”在意图引领“风向”。在数据时代,人的从众心理更容易被数据“带坏”。
所以,有些时候,你看到的正是想让你看到的,或者说正是你想看到的,这背后实际上是“数据洞察”的结果。不过,中间的数据分析的过程,你没法看到。
俗话说,群众的眼睛是雪亮的,其实在数据时代,眼睛“看见”的未必就是事实,洞察数据背后的事实或者意图,远比“看见”更重要。
发表于:
2020-03-31 22:53 阅读(673)
评论(0) 收藏 好文推荐
本博客所有内容,若无特殊声明,皆为博主原创作品,未经博主授权,任何人不得复制、转载、摘编等任何方式进行使用和传播。
作者该类其他博文:
网站相关博文: