.com. All Rights Rerved.
against all odds20 / 新经济导刊 / New Economy Weekly 12/2012
12/2012 New Economy Weekly / 新经济导刊 /where the wild things are>host unreachable
21
P20 【主 文】神奇的大数据
P28 【案例一】
阿里巴巴:让数据做主 P31 【案例二】
秒针系统:为别人掘金
P34 【洞 见】解放地理信息P37 【对 话】
构建大数据产业环境
COVER
STORY
封面文章
.com. All Rights Rerved.
“11·11”购物狂欢节当天,天猫
和淘宝共吸引了2.13亿独立
用户访问,其中第一分钟就有1000万独立用户加入抢购,当天订单数达到1亿笔,通过支付宝完成的总销售额达到191亿元,是去年的3倍多,创造了中国电商行业日销售的一个新记录,并超过2011年美国“网购星期一”12.5亿美元(约合人民币78亿元)的单日最高销售额。
这是一组魔咒般的数据,它让网商和消费者为之震惊,让其他电商平台和线下零售艳羡不已,也让身在其中的阿里人倍感意外。ama2014
xiaoxin
“这么大的能量,我们都没有想到,但我有一个预感就是,所有人对我说的预测都是错的。当天看完第一个小时的成交后,我跟我的同事说应该能达到160亿,高层瞪了我一眼,你觉得靠谱吗?我说可以的。最终比我的预测还要高。”光棍节当天,一直在数据监测直播室的大数据研究专家、淘宝网商业智能部资深总监车品觉告诉本刊记者。
如此庞大的访问量和交易量对电商平台和网银系统也是一次巨大的考验,尽管阿里巴巴在技术上和管理上进行了充分准备,并且破天荒地打破了“百花齐放”的主流企业文化,有效发挥了天猫、淘宝和支付宝的协同性,总体保持顺畅,但还是有一家
银行的网银系统抵挡不住潮水般交易数据的攻势,而败下阵来。
数据可以分析历史,也可以观测未来。“双11留给我们一组宝贵的数据。”车品觉说,“它告诉我们许多不经常来的用户都在同一时间涌过来了,这些用户群至少在未来一年内应该去触发他(她)们。以前不活跃的用户在当天活跃了,这些用户看了什么产品?买了什么产品?还对哪些产品感兴趣?通过这些丰富的数据,可以发现用户的偏向。”
何为大
光棍节已让我们领教了电商大数据的潜力和火爆,接下来再带你看一下更加壮观的场景:
一秒钟内,互联网产生的数据量,比20年前整个互联网储存的数据还多;一分钟内,微博、Twitter上新发布的数据量超过10万,社交网站Facebook的浏览量超过600万;两分钟内,全球上传的照片数量超过19世纪照片数量总和;一天内,百度要处理几十PB数据;一个月内,Google处理的数据量超过400PB;2011年,全球被创建和复制的数据总量远远超过人类有史以来所有印刷材料的数据总量……
当你把想要去的目的地输入手机地图或互联网地图,或者开着车对着“语音助手”说:“我要在附近找一家素食餐厅”,短短一两秒就能让你得到满意的答案。其背后向您提供服务所涉及到的导航
文/
有道翻译官方下载本刊记者 牛禄青
< All Rights Rerved.
22 / 新经济导刊 / New Economy Weekly 12/2012
notify12/2012 New Economy Weekly / 新经济导刊 /
23
定位、资料检索、存取计算、数据交换等一系列动作是何等地复杂。
这就是“大数据”,一个不知不觉被数据包裹和渗透的时代。每个人都是数据的创造者和传播者,每个人也是数据的接收者和分享者。手机、平板电脑、桌面电脑、数字电视、智能电视、数字眼镜、传感器、卫星定位系统等终端设备,如雨后春笋,遍布各个角落,海量数据就这样源源不断地喷薄而出……
中国工程院院士李国杰用4个“V”来描述大数据的特征:体量浩大(Volume)、类型复杂(Variety)、生成迅速(Velocity)、价值巨大但利用密度低(Value)。
互联网和移动互联网上产生的数据,如文本、
视频、图片、动漫、地理位置等,大多是非结构信息,据预测,到2012年末非结构化数据将达到整个数据量的75%以上。
涂子沛在《大数据》一书中认为,“大数据”之“大”,不仅仅在于“容量之大”,更大的意义在于,通过对海量数据的交换、整合和分析,发现新的知识,创造新的价值,带来“大知识”、“大科技”、“大利润”和“大发展”。
“如果每天有一两百个G 以上的数据,就可以算是一个大数据公司了。”秒针系统创始人、首席技术官吴明辉表示,面对海量数据,传统的数据库软件Oracle 等,已无法进行处理。目前新的数据库结构又不像传统的数据库软件那么灵活。“传统的Oracle 好比自行车,大街小巷都可以骑,但它很慢;新的数据库结构相当于高铁,它只能沿着轨道走,但它很快,承载的量也很大。”
尽管美国的大数据应用已如水银泻地,无孔不入,但美国GE 公司的人这样抱怨,“我们的数据仅整理清楚都需要3年,3年后再玩数据已经落伍了,更别说挖掘价值了。越老的企业,玩数据的难
度越大。”
车品觉认为,用数据之前,需要先会“养数据”,但是把数据收集起来,不代表你在养,只有知道如何养大它,那才叫养。假如今天下午一点多给你两样东西:面包和五块钱,由于你吃过饭了,可能五
块钱对你的吸引力更大。这个例子告诉我们人的决定会受到当时环境的影响。所以,收集数据的时候,如果不把环境数据收集过来,这个数据过几年后就没有价值了,而且很难研究。十几年后,再看“11·11”的191亿元的数据,如果不了解促销五折的背景,人们会说,不可能,那天可能有异常。japane young wife
而且,车品觉表示,数据会断裂的,即过去是这个意思,未来可能不是这个意思;过去可以这样用,未来不一定能这样用。如果不用数据,只是养它,两年之后就会断裂,这些数据就是一潭死水。
有多神
2012
年美国总统大选虽然尘埃落定,但与历届
一秒钟内,互联
phd是什么网产生的数据量,比20年前整个互联网储存的数据还多。
.com. All Rights Rerved.
选举不同。此次大选伊始,美国总统的竞选团队就纷纷利用数据分析方法来寻找和锁定潜在的己方选民,并使用最前沿的数字化策略定位拉拢那些中间派选民。整个过程,大数据应用的威力可谓发挥得淋漓尽致。最终,奥巴马团队技高一筹,赢得连任。
用数据赚钱的企业。早在1969
“秘籍”。最经典的案例莫过于“啤酒
购买啤酒来犒赏自己”
沃尔玛的“啤酒+
品的销售双赢。
重要因素是全场5
了他(她)会损失多少。
好运的人分为两类,
店,
顾客平均购买商品的金额,客单价=客数)不一定高,
经常逛这个网店,而且对网店的收入贡献是稳定的。淘宝还对小而美开发了
一个“美指数”,这个指数可以屏蔽
或过滤掉网店的作弊数据。
一组数据能让人们做一个更好的决定的时候,这组数据可以称之为聪明的数据连接。美国玩大数据的人都到“OODA”,即观察Obrve,定位
Decision,行动Act。这是美国的一
然后对数据进行定位,
20%的稳
80%的未知数据。例如知
.com. All Rights Rerved.
24 / 新经济导刊 / New Economy Weekly 12/2012