第245页
惊鸿负责的总经理名叫辛半梅,也是卓颜他们一类的人。
卓颜拍拍她左肩:“辛苦了。”
谷秋:“那我去了。”
说完这话,她看到卓颜点头以后,就跟来时一样,绕着这边的工作人员,回去找自己的小组了。
——
束青:“我不再把目光聚焦到她穿越的时间上,忽略了间隔、周期等等,只以粉丝为主,用数值诠释阮渔在两次穿越间得到的阶段粉丝情感,嗯,我将这个数值命名为粉丝正向情感值。”
在网络上抓取阮渔的大数据,简单又不简单。
柠檬鱼们为了阮渔会去做数据,带上相关话题和她的名字,一般的网友抒发自己即时的情绪时也会直接标注阮渔的大名,这样也好抓。
最烦的是现在粉圈混乱,缩写漫天飞,还有各种符号、昵称指代等等,造成了极大一部分的数据流失。
——我真的好喜欢阮渔啊啊啊!
——鱼鱼崽真可爱!
——#青云品牌全线代言人邀你关爱化疗孩童#心疼孩子们,默默地捐了一点点钱。
——烦死那个谁了真特么傻逼。
——某品牌代言人不错啊,试用了一下洗发水居然还真的有用。
前面的三条可以捕捉到,归类给阮渔。但后面的两个就不行了,爬虫不能识别这是说阮渔的。
粉圈在信息茧房方面太厉害了,三百人就能营造出烈火烹油之景,黑天白日地做数据,明面上看着跟三万人一样热闹,实际上背后只有这么三百。
有人调侃,说内娱有三千粉丝,艺人就可以横行霸道叱咤风云了。特别是选秀,来来回回秀粉也就那三百个,每一届每一年都被割韭菜,数到最后原来都是同一批韭菜。
粉丝的数据,真正路人的数据,是完全不一样的。
三百人给出的假象,又怎么能比得过五十万人的随手一点呢?
束青要是按照前面假象来做分析,那就真的扯犊子了。
她要的,唯一有用的,恰恰是无法辨认的“五十万”。
为了搜集到这些,束青可谓是绞尽脑汁,这也是为什么她会去拜托卓颜——半年的时间里,卓颜团队一直在线下做着对阮渔的问卷调查。
让卓颜去做的话会方便很多,她紧跟着阮渔,综艺、站台、直播、宣传、品牌合作等等,她说要收集关于阮渔的舆论信息,一般来讲,合作方都会很配合。
青云惊鸿这类自己人,就更别说了,那简直是豁出家底来配合她,要什么有什么,甚至可以改他们品牌自己的活动流程。
除此之外,卓颜还安排了人时不时地扫街,问路人对当前流量、明星、娱乐圈的看法,里面会混入阮渔,又或者问题里什么都没有,让路人自己发挥。
这半年来,卓颜将简单整理后的文字、音频、影像资料等定期传给束青,她团队里还专门有人带队负责此事。
好在幸不辱命,一切忙碌都有了结果。
束青:“阮渔的粉丝量一直在增加,我将她海内外所有的账号粉丝数字作了处理,剔除了重复、机器等,最后得到了这样的折线图。”
至于如何剔除,就是一个很麻烦的过程了。她还让雀寻去申请了沧兰洲官方政府的居民数据库支持,对于海外的也有着另一种算法。
虚假的上千万粉丝量中,活粉不少,但肯定达不到这几千万的繁花如锦,顶多占个一小半而已。
现在各大app对于民众的隐私侵权到令人发指的地步,束青去调取了官方数据,也跟几个合作的软件公司做了联合,得到了她想要的。
束青:“这些是抓取到的对阮渔的网络评论,当然,在这个过程里,过滤掉了通稿这类。”
卓颜团队的通稿、合作方的大批量宣传、水军等等真的不少,但好在这些都有迹可循,采用的措辞、行文习惯全都比较固定,特别是水军,最明显不过了。
另外,比较烦的还有虚假流量。
“做数据”、“打call”,这些明面上的流量数据开始反过来裹挟相关者,然后劣币驱逐良币,不愿意同流合污者被甩在后面,内卷以后,现如今的假数据膨胀率简直惊人。
束青:“卓颜那边跟人一起清理了一批虚假流量,那一段时间,数据方便的反馈就弱化了许多。”
她刚好也趁机与前后的时间段进行对比,使得自己这份报告里的内容更加真实。
从阮渔出道到第一次穿越,这个阶段里对阮渔的一些关注度是不太够的,束青丢失了不少数据,就算找技术人员去爬网络资料,困难度也挺高的。
她要求得太细碎了,互联网也太大了,数据量过于庞大,不啻于大海寻针。
最关键的是,时间已经过去了,想探索阮渔那时在线下的知名度、风向等,已经无法做到了。
所以束青还需要对这些作新的处理。
她当年毕业时候为了做数据处理,愁了三个多月,死活得不到自己想要的,最后好不容易毕了业,闭着眼跟自己说就这样了凑合过吧还能不要毕业证书咋的?
虽然那个时候她同学都笑骂学神装逼,不给他们这些学渣活下去的勇气,束青的毕业论文写得极为漂亮。
但她不满意。
就像是这一次,束青用了半年多的时间,来论证一个自己突如其来的灵感假设。
--