从电子商务发展周期来说,数据为王的时代已初露端倪,这种时代不是单指几个有实力的互联网巨头去做SaaS或分布式服务器,而是越来越多的行业客户认识到碎片化数据的潜在价值。当年以IBM为代表的跨国巨头把云计算基础服务概念带入时,国内电子商务企业尤其是B2B类平台还在挤兑信息撮合机制的红利,而现在从政府、企业、市场都在高喊大数据,但真正理解其本质、懂得大数据产品设计精髓的实务性应用并不多。 数据为王,服务为本,云计算、O2O、物联网、金融支付、资信认证等各服务环节其实都是大数据的采集架构组成,近期各电商大佬的众多动作也能看出其构建数据闭环的真正用意。 大数据,其本质核心并非是数据量“大”才称为大数据,从产品技术角度略微提一些关于大数据的概念。如果把众多的信息碎片比喻为撒哈拉大沙漠,每一粒沙子所携带的数据内容可能仅是一个数字、名称、点击、时间、性别等单一内容,看似平淡无奇,但通过正确的分析算法可以将所需的沙子自由组合,变成比黄金还要宝贵的数据资源,所以大数据的核心是数据处理分析能力,其数据容量、分析加工、数据真实性、数据特性是Big Data的关键要素,即经常被提及的4V:Volume(数据量)、Velocity(分析速度)、Variety(特性)、Veracity(真实性)。 以往众多电商平台及网站的数据库架构是基于关系模型建立的关系型数据库,如MySQL、Oracle、Microsoft Access等,但关系型数据库就远不能满足大数据的处理需求了。Apache(阿帕奇)基金会开发了一款名为Hadoop的分布式基础架构,Google以此为基础提出了Map-reduce系统可进行大规模的数据并行计算,至此奠定了以Hadoop为主流的分布式计算系统在全球的快速应用,专注于批处理。但值得一提的是,像SNS社交这样高数据动态的平台,对数据处理速度有着更高要求,为此Nathan Marz推出了Storm系统,在Twitter内部被称为BackType,并被广泛应用。产品技术概念点到即止,只是想说明大数据在技术层面配合着不断开发出的应用插件,已基本满足不同需求的数据分布式处理。互联网平台尤其是B2B电商平台的大数据应用,关键还是在于自身产品的定位及未来发展的走向。给你一把利刃,你只是舞刀弄枪没半点招式,最终成为不了武林大侠,所以做大数据,思维与方法是核心。 明确大数据的核心概念后,如何布局大数据,尤其是B2B电商平台的数据获取、数据分析、数据应用的开展就是实际操作问题了。B2B电商平台目前发展为三代,第一代以信息撮合机制为主,通过互联网特性有效的汇聚买卖双方信息。第二代以在线交易为主,信息展现模式、在线交易工具、配套服务产品的发展使得各平台都在想方设法解决在线交易问题。第三代即资源集聚为主,所谓资源集聚正是突出两个核心要素:数据穿针引线,服务本质所需。大数据给予平台服务提供了信息支持,而服务落地也有利于有效数据不断被采集,形成数据循环,即“雪球效应”。可以说大数据不是电商平台的某一个产品组成或业务领域,大数据是整个电商未来发展的基础资源与优势体现。 从数据采集来源上讲,传统互联网思维模式是极力将用户搬到线上,通过线上行为获取用户的相关信息及操作轨迹。过去因为技术、方法、行业特性所限,互联网通过线上所吸纳的海量数据的确给电商企业带来了短期的处理空间,而直接从线下模式获取数据来源的成本及模式尚不成熟。但要知道,市场最大的数据源永远都是在线下,电子商务的本质是通过电子化手段来服务传统商务流程,帮助其降低成本提升效率,所以如能直接建立起线下数据的采集接口渠道,而不再仅仅依靠纯线上数据作为来源是一个关键环节。同时,线上线下数据采集汇聚到数据中心,产生的分析型数据将会反哺线上,带来更精准的使用价值。互联网电商平台的产品展现仍旧是电子化特性,但数据来源的落地化将是巨大促进。 B2B类的大数据化第一步就是数据采集渠道的创新,慧聪网的线下基地和展会形式,为什么会设置免展位费而以实际成交额收取佣金,本质也是希望能监测到线下发生的相关数据。京东的“亚洲一号”就比较犀利,直接插入物流领域,而最关注的“菜鸟网络”先不谈其各方资源整合的难点,以马云的个人影响应该不成问题,其本质也是阿里在补强线下数据的采集渠道。过去都把O2O局限在生活服务领域的电子商务化,B2B电子商务的Online to Offline也已经开展,某种意义上说,线上是电子化服务的输出,而线下将是资源集聚的主要来源,同时线下数据资源经过处理回到线上,也不失电子商务企业的经营本质。 对于电商平台来说,可能不是每一个企业都有技术实力及资本去搞大数据,甚至有些企业的数据量只是几个TB,远没有达到PB级别(1PB=1024TB 1TB=1024GB)。这些都无妨,目前B2B类电子商务平台都向着细分化的方向发展,综合类平台开始专注单品,垂直类平台开始专注深度,如不能实现分布式计算,用传统的关系型数据库也可以诞生很多基础的数据化产品,所谓分布式只是一种计算方法,不代表没有它就做不了数据分析。你需要做到的是首先要有自己的DBA与BI分析师,从点滴积累做起,培养用户使用习惯及数据量,做到某一个环节的深度电子化服务也是非常不错的,如一达通、我的钢铁网。 大数据化的重点在于采集挖掘与分析处理,有能力挖出金块,就不会担心是做成金戒指还是金项链,产品应用是水到渠成的事情,数据化大家都会认为那是一个趋势,如何去实现就需要深耕细作,需找到适合自己平台的模式了,但如还没有具备数据化的理念与思维,危矣。
|