财联社|新消费日报讯,10月31日,李佳琦所在的美腕网络科技有限公司发表声明称,“李佳琦背后团队被抓”、“胖球为李佳琦做数据”等传闻为不实消息。
声明中进一步解释到,公司从未对直播间数据展开过任何形式的干扰,也不参与任何业内数据榜单的编造和制作,从未展开过任何涉及数据造假的行为。美腕还表示,从未对外授权任何三方机构数据权限,市场上相关销售数据等均非公司提供,也不是事实数据。
此前几天,薇娅团队针对网上关于薇娅税务问题的谣言进行了否认,其经纪人在朋友圈表示愤怒。记者查询后发现,传言遭到“封杀”的薇娅,其在官方媒体的采访内容大都没有遭到删除。
在直播间之外,今年的双十一似乎更加“热闹”,而这些争论主要来源于此前广为流传的上百亿交易额截图。
数据事件发酵始末
10月20日,双十一开启预售,淘宝直播间人气旺盛,其中两大头部主播薇娅、李佳琦获得空前的关注。第二天,有网友将某第三方数据平台统计的销售数据发上微博,引发网友围观。
截图显示,李佳琦累计直播12小时26分,交易额达106.53亿元;薇娅累计直播14小时28分,交易额达82.52亿元。其中,双方直播间累计观看人数都突破了2亿次。
根据第三方平台提供的数据,有文章计算出李佳琦和薇娅将分别从中获益15亿元及11.65亿元,并分析了不同合作模式下的税款缴纳情况,回顾了此前遭受过处罚的某网红主播逃税问题。
随之而来的还有,新闻报道称9月中旬,警方抓获了利用“爬虫”技术窃取后台数据,并倒卖获利的胖球数据团队成员,引起电商直播界的普遍关注。
据悉,胖球数据抓取重点为淘宝直播平台,能详细地列出直播销售额、观看人次、商品简介、退货率等信息,定时更新每月淘宝主播销量排行榜,李佳琦和薇娅长期稳居一二名。网传胖球数据是李佳琦背后的数据团队。
目前,随着声明发出,相关信息被澄清、辟谣,但事件涉及多项热点问题迅速引起广大网友的关注。事件的源头第三方数据平台也因这一系列事件走进公众视野。
胖球:二手交易or数据爬虫?
据胖球数据官方公众号信息,其运营方为北京七彩焕腾科技有限公司。天眼查显示,该公司成立于2017年7月。2018年,公司曾两次凭借“积分式闲置交易平台”业务获得来自多家机构累计数千万人民币的投资。
公开信息显示,胖球从宝妈人群切入,通过虚拟币开展置换交易业务,小程序一度曾达到日订单量4000单,月增速100%的成绩。胖球创始人为王笑漪,曾任职阿里巴巴产品经理5年;联合创始人杨帆,曾在阿里算法相关岗位任职10年。核心团队对电商十分熟悉。
闲置交易业务在融资之后始终不温不火。据其公众号显示,2019年9月,胖球数据正式以淘宝直播数据服务方身份亮相,能够提供付费查询数据、对接主播与商家等服务。数据收费标准在299元至3199元不等,2019年底数据用户很快突破万人。
胖球数据公众号称,他们专注“直播电商数据”近4年,获得了业内最大且最快的融资,在业内取得了一定知名度。以此推算,依据团队的技术和阿里出身,胖球的数据抓取业务甚至早于其二手交易业务。
根据报道,今年8月警方发现购物网站内直播间流量异常,推断出有人正在使用爬虫软件窃取相关数据,9月便将整个犯罪团伙抓获。
熟悉爬虫的技术人员向新消费日报表示,爬虫并不难学,自己抓取一些公开数据影响不大,但如果用来获利则有风险。此外,淘宝等平台有防爬技术,获取数据会难一些,但现在不少平台普遍开放了官方API数据接口,而获得这些数据往往需要付费。
萤火虫数据相关人员表示,淘宝一直不允许做这些业务,从来没有给过他们接口,或许在部分关系较好的“嫡系”数据平台会提供接口。目前,他们已做出业务调整,不会再上线相关业务。
最新工商信息显示,北京七彩焕腾科技有限公司已被标注为经营异常,原因是“通过登记的住所或者经营场所无法联系”。
卖数据,收会费
从胖球数据不难看出,第三方数据平台获取数据主要有两个途径,其一是从官方API入口付费获取,其二是利用“爬虫外挂”强行从页面获取信息。第三方获得数据后,进行可视化和分类处理,并以此对外收费。
目前,较为常见的第三方数据平台有知瓜数据、红人点集、蝉妈妈、飞瓜、小葫芦、萤火虫等。
新消费日报逐一调查后发现,当天的直播数据往往免费,历史数据和对比分析数据收费普遍较高,且根据淘宝、抖音、快手等平台有不同的收费标准。其中,较为便宜的平台为68元/月,包年数据普遍在数千元以上,最贵甚至可卖到6888元/年。
有媒体报道显示,此类数据平台的数据也不一定准确。以10月20日预售数据为例,红人点集统计李佳琦销售额为115.39亿元,但知瓜数据却显示为38.5亿元。
胖球数据事件发酵后,关于数据来源问题,多个平台回应称,自己与直播平台有合作,采用平台数据接口。有个别平台明确表示,没有使用爬虫,而大多数平台仅强调自身业务合法。
但在某数据平台的招聘页面上,却显示公司正在招聘爬虫系统设计与开发人员。该岗位主要负责数据爬取、清洗、解析和入库,研究应对主流网站及APP的反爬机制,并针对所需数据寻找接口。
相关技术人员介绍,爬虫不仅可以用来获取网页数据,还能模拟数据提交,而这是常见的网络刷单、刷数据的手段之一。恶意刷数据会让网站失去平衡,网页方也能追踪到这些异常数据。
北京京师律师事务所宋竟一表示,爬虫作为技术或工具,很难说合法或非法,关键看如何使用。收集个人信息应当遵循个人信息保护法,遵循正当必要合法原则,经过被收集者同意,也要避免造成网站超负荷无法运行。
报道称,从2019年推出付费业务以来,胖球数据两年利润40万元,并不算暴利。如果采用官方数据接口,支付使用费以后,获利空间或许还会被进一步压缩,简直是“费力不讨好”。
“不少店家和主播使用第三方数据平台,可以帮主播统计直播的数据,方便结束后分析相关数据,有利于后续对销售策略等做优化。”但在法律层面,宋竟一表示,平台利用爬虫获取数据,从民事角度看,可能涉及侵犯商业秘密、不正当竞争、侵犯个人隐私权;从刑事角度,可能涉及非法获取计算机信息系统数据、罪破坏计算机信息系统罪等,最终可能面临被起诉或刑事处罚。
目前,优大人、知瓜数据、萤火虫等已完全删除并关闭直播数据相关业务,其他平台仅关闭了淘宝数据入口,但抖音、快手、小红书等直播数据依旧可以付费查询。