南京艺术学院李向民教授应邀出席首届“大数据—大文化高峰论坛”并作主题演讲
若要评选今年最热门的词语,“大数据”应该能够名列其中。当下,各行各业都在热议大数据,有人甚至把2013年称作“大数据元年”。无论是否承认大数据时代的到来,信息技术对文化创作、生产、传播与消费的影响已经产生,信息技术下的新文化形态和业态逐渐形成,大数据背景下的文化发展潮流正在涌动。在此背景下,举办有关大数据与大文化的高峰论坛就显得及时且必要。

10月25日,首届大数据——大文化高峰论坛在上海市宝山区举行,受到业界多方关注。此次论坛由中国文化传媒集团国家文化产业发展促进中心、国家文化产业示范基地上海宝山科技园联合主办,上海宝山科技控股有限公司、中传华彩(北京)国家文化发展有限公司共同承办。与会的多位专家和数十家文化企业代表就“什么是大数据”“大数据与大文化之间的关系如何”“文化产业应该以什么样的发展路径去应对大数据时代的到来”等问题展开了热烈的讨论。
南京艺术学院文化产业学院院长李向民教授应邀出席,并从大数据在微观层面对文化产业的影响角度作了主题演讲。
以下为演讲实录:
>>>>>>
这次主要还是来学习的,上午听到现在还是学了很多东西,大家都是从不同的领域研究大数据的问题,那天成泉跟我说要搞这样一个论坛,我很愿意来听听大家对这个问题到底有什么看法。其实从去年开始很多从事文化产业研究和具体工作的人都很敏感,打个不恰当的比方,就像原始人看到了一个螃蟹,不知道这个东西能不能吃,或者会不会咬人,或者别人会不会拿这个来咬我,大家都很警惕这个大数据新生事物,经过这段时间我们也看到了很多案例、很多信息在提供出来,这些问题上我们不断地重新思考对于大数据问题的一些原有的初步的感知,同时来分析一些内在的道理。
刚才洪波教授提到了美国NetFlex的《纸牌屋》,《纸牌屋》的成功昭示了大数据文化产业的新变革,而且会产生一系列的变化,各种各样的观点都涌了出来,但是回头分析《纸牌屋》这个例子,你会发现NetFlex并不是真正的操盘方,而是CAA这样的公司在操作这个事情,当然,NetFlex是主要的投资方,控制了整个项目的运作,这是不错的,但是回过头来讲,它是不是存在着某种资本在里面?就是大数据刚刚开始有个苗头,资本及时进来发现一个非常好的机会的时候会不会借着这个事情造势,形成一个新的机会?这个可以从艾美奖颁奖当中看出,得奖的时候《纸牌屋》的呼声是非常高的,但是最终只拿了一个最佳导演奖,其它的奖项一个都没有拿到。对于大数据指导下的《纸牌屋》到底是个什么情况,这是现在业界正在探讨的一个话题。中国国内上海也有一家比较有名的做影视数据分析的公司,最近被华策收购了,收购之前做了很多影视剧,而且一直也是讲在海量的数据分析基础之上做出这样的判断,包括什么样的题材、什么样的演员、什么时间投放都经过了非常精密的计算以后很理性地指导了艺术创作。最终理性地看它放出来的成功作品,其实很少有目前在业内影响力特别大的作品,也没有特别优秀的作品出来,这是一个问题,对于大数据从微观层面上对于文化产业的影响,就是我们到底怎么看,这是一个值得思考的问题。
另外就是从今年国庆节前后从美国发生的一些事情,首先是在9月底,当时Facebook开始跟美国四大电视网络合作进行数据交换,今后对收视率等等调查方面可能不仅仅是靠以前的调查公司,运用了Facebook这样的社交网络数据对它进行修正和调整。另外就是过了国庆节以后10月初的时候美国《华尔街日报》报道了Twitter上市的招股说明书,当中就有一笔收入,来自于第三方使用授权,这块收入大概是四千七百五十万美元,占到Twitter整个营业收入的百分之十五,其实Twitter公司在拿这个数据做交易的时候已经产生了明显的效益。很有意思的是,这些东西最终也许并不直接反映在某一个具体的微观项目上面,而是反映在资本上面,包括刚才讲的NetFlex公司也是这样,它的《纸牌屋》点击率是不错,但它的收入来自于股票上面,导致NetFlex公司获得了巨大的利益。
我们也在考虑怎么看待这个大数据对文化的影响,因为今天在座的很多专家嘉宾都有很多是从宏观或者综观层面研究大数据的问题,我想从微观的角度来看一看文化产业当中怎么应用这些数据,并且可能会出现一种什么样的情况,这是我最近思考的一个点。我们拿数据指导、影响文艺创作,或者研究文艺作品,其实事情并不是现在才有的,过去我们用的是少量的样本或者数据,现在是海量数据,这是一个本质上的不同,但是具体的研究方法我觉得还是一致的。我们知道,语言学里面专门有一门数理语言学。还有一门计算风格学,就是通过不同的作者在文艺作品当中句子的长短或者使用词汇的长短以及某些词出现的频率高低来判断这个作品,因为每个作者都有自己说话和表达的习惯,所以在上个世纪出现了数理语言学,包括当时最典型的研究是前苏联的《静静的顿河》,小说出来以后遭到法国的一个杂志质疑,认为这不是肖洛霍夫的作品,很有可能是另外一个不知名哥萨克作家克里夫的作品,为了研究这个作品到底是不是他的,苏联学者捷泽就做了一个非常有意思的分析,就从《静静的顿河》当中抽出了两千个句子,然后从肖洛霍夫以及克里夫的作品当中再取五百个句子,总共三千个句子进行研究分析,通过这样的研究得出结论,最后《静静的顿河》是肖洛霍夫做的,也有很多的人拿这样的方法来研究《红楼梦》是不是同一个人做的,但非常有意思的是,从1954年以来当时的瑞典汉学家高本汉开始用这种方法来研究《红楼梦》,最后用的数据量越来越大,到了1981年的时候美国威斯康星大学讲师开始用计算机的方法来进行数据处理,非常有意思的现象是,有一批人研究过以后说这是曹雪芹从头到尾的作品,还有的人认为后四十回当中有一部分是他的,有一部分不是他的,都是用所谓的计算风格学研究。我们可以从中发现什么问题呢?当然,它和大数据是不一样,用了很多选取的样本数据,就是从选取样本和抽样的角度带有很多个人主观的色彩在里面,但是最后得出结论完全不一样。这说明大数据某种意义上只能作为一个工具,不能代替人类自己的分析,如果是把所有的事情全部交给大数据本身处理很可能就会陷入一个非常大的困境,因为他的思想是你赋予他的,你怎么用数据,就有得出怎样的结论?
我们再举一个例子,现在做影视作品,有人说我们应用大数据方法研究,当时NetFlex就是这么干的,每年从他的全美两千七百名用户占到世界另外三千六百名用户,对于这些用户每天三千万次动作,四百万次评级和三百万次搜索,通过大量数据分析大家对这个影视剧的评价到底是怎么样的,看看什么时候大家去上厕所了,回过头来指导这个作品创作。看起来这件事是对的,但是从实践的角度讲又是错误的。为什么它是错误的呢?
我们知道经济学里面有个理论叫做蛛网理论,就是今年的猪肉产量是由去年的猪肉价格决定的,生猪从饲养到出栏有一定时期,这就导致生产量和价格之间永远对不上,一会儿价格低一会儿价格高。放到文艺作品当中也是这样,现在我们看到很多的项目,包括大的电影和电视剧,很多好莱坞的电影都要好几年,包括现在一个电视节目,一个电视栏目的生产从创意到制作一般也要两年以上,在这种情况下如果拿今年的数据哪怕再详实再丰富,到了明年后年出来之后口味全变了,你说你怪数据?数据很准确,但是最终就把你引到了另外一个地方。所以我们在应用这些数据指导生产的时候存在着很多文艺作品创作和生产当中的不确定性,不是那种普通的工业生产或者物质生产当中可以用数学公式直接计算出的结果,这个问题就导致我们用这些所谓的数据,并不可靠。比如现在某个演员特别红,就像李幼斌在演《亮剑》以后特别红,后来又出了《闯关东》,可以说是如日中天,演员当中要找他演戏是非常困难的,但是后面仅仅过了几年以后他的风向就变了,因为大家的口味和要求,包括电视台的要求也变了。
这样一种情况就导致我们回过头来思考另外一个问题,就是大数据对我们文艺作品的生产或者文艺产品的生产的影响反映在什么地方。现在我个人感觉更多是反映在营销这个部门,这个营销部门可能是比较能够用上大数据的。刚才有位演讲嘉宾提到在院线发行,通过一部片子分析它的观众群体主要需求,然后选择用什么片子推到院线上去,这是可以做的,包括我们可以根据观众要求对我们的作品进行修改完善,以前这种办法其实一直在做,现在电视台要买一部片子,往往先有一个购片方去买,比如中央电视台就有一个群众测评阶段,会请一批模拟它的主流观众结构的小组去看片子,每人一张表格,然后不停地进行打勾,然后再汇总成一个数额,如果评分达到一个什么水平这部片子就能买,如果达不到一定水平购片方说好也不能买,因为电视台也不是最终的客户,它放的片子主要是放给广告商看的,所以加上了广告商的测评,广告商觉得你的片子不错,我愿意投钱就来买这个片子。这种方法的使用看起来也是小量的数据,但是回过头来讲,这个办法也许是可以用得上的,所以来得及改。还有就是网络游戏当中的测试,从刚开始的内测到公测,公测的结果就是解决在试运行当中的一些Bug,使它可以更好地向外推广,这是具有非常重要的意义。有人开玩笑说通过研究一个母鸡的体质就可以研究出鸡蛋的口味,因为这些东西有很多非线性关系以外的结果会出现,有人也做过这样的事情,目前是什么东西都要,比如今年6月份上的电影《富春山居图》,可以说研究市场的时候做了很多分析,把目前大家喜欢的元素都放进去了,什么明星大制作特效全放进去了,最后的结果呢?恶评如潮,市场也不好。所以从这个意义上讲,大数据对文化领域的影响肯定是非常巨大的,如果我们能够很好地运用这些数据,对于文化企业的发展有非常大的作用,但是如果往前跨前一步就会变成一个谬误。(文化产业学院)
更多有关"数据,研究,作品,这是,文化产业"的文章请点击进入南京艺术学院新闻中心查看

