January 21, 2014

Dell服务器和Linux kernel bug造成的CPU性能下降问题

好久没做这种类似技术顾问的工作了。今天处理了一个挺奇怪的问题,我也是第一次碰到这种事情。最后总算比较周折的找到了原因,这个bug比较新,估计碰上问题的人应该不会少,所以我就顺手记在这里一份。

问题是出现在一个朋友的服务器上,这是一台E5-2430的Dell服务器,他给我的描述是"有一台机器非常慢,但负载很低。"按照以往经验,这种问题是出现在程序锁或者IO Block上,一般是某些重要资源的争用导致的。但检查之后这些都没问题。

这种现象我从来没碰上过,直觉上感受就是cpu本身速度很慢,于是,用计算圆周率的办法来测试cpu性能:

time echo "scale=5000; 4*a(1)" | bc -l -q

过了4,5分钟都没算出来结果。基本可以定位问题在CPU上。

查syslog,发现大量的 CPU0: Package power limit notification 这种通知,怀疑是和电源管理有关。

顺着这个终于找到了问题。这是一个目前只出现在Dell服务器上的LInux内核bug,大致是内核在CPU功耗和温度控制上有bug,(确切的说应该是Dell的BIOS造成的,但最终表现出来是内核的bug)没法拿到正确的值,由此导致CPU持续被降频。

最早的报告应该来自Redhat,并且在1个多月之前redhat修复了它

如果是Redhat的服务器,打补丁即可,如果不是Redhat,这里有几种其他解决方案

这件事让我明白了为什么一些做运维的人非要坚持用Redhat,我一直认为Redhat在各方面都落后了。但出现这种问题的时候还是这种商业公司响应比较及时。


多谢 @googollee@yarshure@holly@qianhw 的建议和讨论。

October 19, 2013

隐私,信息以及信息安全

这几天网上流传一份号称某个经济酒店开房记录的数据,其原始格式是sql server的backup文件。Leaskh转换了一个csv版本,分享到了网盘上,但遭到了很多人的痛骂。我开始比较惊讶为什么有人会这么激动,后来明白了,就像医生认为生死是自然规律,而普通人则觉得要避讳。人们对于自己越不了解的事情,越喜欢表现出来天然正义的样子。

隐私确实是一个值得讨论的话题,它和每个人密切相关,可惜在信息化如此彻底的时代,多数人除了直觉之外,对此一无所知,甚至连基本的准备都没有。现实世界和科技脱节如此之大的状况并不常见,这让这个话题显得更加有意义。在这篇blog里面我想分享一下我对这个问题的看法,我所知道的现实状况,以及可行的解决方案。

一 信息化改变了什么

在信息化之前,数据的泄漏和传播比今天难的多。传统的纸质文档很难被复制和传播,对比一下早年的"手抄本",很容易就能理解,在信息可以被数字化之前,就算要刻意传播一份信息,也需要巨大的成本和时间, 那时候生产信息和传播的权利基本是被垄断的。

到了现在,一份存储在联网设备中的数据,可以瞬间被复制到世界各处。这从根本改变了传播的方式,也使得保密变得无比困难。这种低成本、速度极快的传播特性,造成了"不可撤回"的特性,即一份数据,一旦流传进公共领域,则无法被撤回或销毁,(这个观点我在几年前写Google的blog中也提到过)进入公共领域之后的数据,就相当于永远存在在互联网上了。

这样就很容易明白,用任何现实世界的东西来比喻信息传播,都是不恰当的类比。现实世界的物体,无法被复制,我拿走你的东西你就没有了。信息可以被无限复制,被复制者并不会失去原有的信息,甚至很多时候被复制者并不知道自己的信息已经被复制过了。

在这种状况下,应该默认凡是以数字化形式存在的数据,都早晚会进入公共领域,即泄密。唯一的区别只在于泄密的时间早晚。所以,正确的心态是默认凡是被数字化的数据都已经是公开的。这样你就可以提前做好准备,当泄密真的出现的时候,可以不那么慌乱。

从非公共领域到公共领域这个界限一旦突破,后面的事情就是不可阻挡的了。所以指责某一个传播者是毫无意义的,这就和政府要立法追究传播超过500次的微博一样荒唐。禁止别人传播一份从公共领域获得的数据,这本质上就是信息管制。这种行为和政府以行政命令要求删贴是一样的,两者的区别只在于是否使用公权力完成,以及如何定义"不良信息"而已。注意,这里所说数据特指已经进入公共领域的,如果是从非公共领域传播到公共领域,那是应该被谴责的,这种行为不仅不道德,而且违法。

好玩的是,反对传播这些数据的人,他们的反对本身也在加速这份数据的传播,并不只是传播全部数据才叫传播,传播关于有这份数据存在的消息同样是传播方式。由于他们的反对,更多人关注了这个事件,并且找到了下载方式。如果真想避免传播,那么看到这种情况最好在心里骂一下,而不要写出来。

二 隐私的进化以及本质

人们对隐私的容忍一直随着时代和开放程度的推移而进化,20年前,刚刚有互联网的时候,照片就算隐私。如果有人把你的照片放到BBS上,人们竟然看到了你真实形象,你会觉得隐私被严重侵犯了。而到了2006年,flickr给照片加了一个People in Photos功能,用户可以方便的在一张照片中标记出现的人的名字。被标记的人往往并不觉得被侵犯了隐私。

现在,照片对于大多数人已经不是那么难以容忍的隐私了。有了Facebook之后,贴照片简直是理所应当的,有了Instagram之后,你随时可能被别人拍下来,贴到一个任何人都可以看到的地方。可见关于隐私的定义是一直在变化的。

到底什么才是最重要的隐私呢?我认为是关联到一个物理的人的办法。比如我获取了一堆网站访问数据,如果我只知道创建这些数据的ip地址,这不算得到了他人的隐私,而一旦我知道了当时使用这个ip的物理的人,用这种办法把访问数据和这个人连接起来,这时候这些数据就变得非常敏感了,这时候这些数据和链接关系就成为了隐私。

我非常能理解人们对于身份证号泄漏的担心,但号码本身其实并没有任何意义,真正的危害在于现实社会有很多资源是关联在身份证号上的。这也就是为什么人们不再担心照片这种隐私,而担心身份证号,因为后者关联了更多的重要信息。

在恐惧身份证号被泄漏的同时,很少有人会考虑一下,为什么我们需要把这么多信息关联到一个号码上。比如说,为什么办一个手机卡需要身份证?为什么住个酒店也需要?为什么买张火车票也需要?为什么去网吧上网也需要?为什么买把菜刀也需要?

使用带有照片的官方身份证明时,主要目的是证明物理的人到底是谁。比如用来登机和安检的时候,这时候需要确认身份是正常的,但为什么上个网,住个店也需要呢?这两种只是普通的商业活动,付钱就可以完成交易,为什么关心人的真实身份呢?在商业活动中,多数情况下都可以使用间接的验证方式,比如利用事先约定的预订号,或者电话号码,或者信用卡号码完成,但现实中,至少在中国,往往必须非身份证不可。这到底是为什么?

答案是政府对身份信息的极度渴求。这不仅仅是中国的问题,而是个世界性的普遍问题。

如果不是这种渴求,那么能把信息链接到物理的人的机会就会少的多。如果住酒店不需要提供身份证号,只需要验证一下订房所用的信用卡或者订单号,那么也就不会有这次的泄漏事件。

三 更危险的数据

现实中被收集的数据远远多于基本的身份信息,比这更危险的数据多的是。我一直觉得如同定时炸弹一样的信息包括:

  1. 电子商务网站的购物历史记录
  2. google的搜索历史
  3. 网站的浏览记录
  4. 手机的基站漫游历史数据
  5. 铺天盖地的摄像头记录
这些数据可不是这次泄漏的身份证号、住址这种静态信息,而是关系到人的行为记录。得到这些数据,经过一些计算,往往能挖掘出来你自己都不知道的东西。相比之下,这次泄漏的东西简直算不上隐私,一点都不值得担心。

我相信这些信息除了有关部门掌握之外,至少还有一部分同样在某些地下渠道流传,某一天他们就会突然曝光在所有人面前。每个人都应该认真想想这一天到来的时候怎么办。

最可怕的事情是你在不同地方的数据被汇总到一起,并且用于计算。这将计算出整个人的生活轨迹,到这种状况才是毫无隐私可言。现在连买个预付费手机卡都需要身份证,将来出现这种情况我也毫不惊奇。

donttrackus这个网站非常形象的解释了在现在的网络条件下,网络广告商是如何定位一个人的。对这类数据的收集时刻都在发生,这些数据可比身份证号码重要多了,关心的人反而不多。

四 对策和希望

很诡异的,这次对leaskh骂的最狠的那些人,恰好是最不注重隐私保护的那个群体,他们不仅仅是不注重,而且在这方面缺乏基本知识。因为只要对这种状况略有所知,也不会认为身份证号和地址是多大的事,他们举出的那些仇家利用这些信息报复之类的例子更是可笑,如果真想知道一个人的身份证信息和电话,一般花几十块钱就能轻松买到。

前面说过,事情的根本在于身份信息的滥用和过分的存储,在这种情况下,信息必然会泄漏。我们当然希望没有任何信息被泄漏,但在现实中,这是无法保证的。所以指责传播已经泄漏信息的人是没有意义的,更算不得解决方案,除非有办法让全世界所有人都不这样做,这也同样不可能,就算有严格的法律,仍然会有人愿意冒险,何况现在根本没有像样的法律规范这种行为。所以,更好的办法是理解,并且接受这个事实。听起来很残酷,但这就跟北京的空气状况一样,已经是无法更改的现实了。

为了避免我前面所说的最可怕的状况出现,有一些对策可用。其中最根本的解决问题方式我们没法直接做到,只能间接推动的,另外一部分是自己就可以做到的。列在这里:

  1. 目前基于单个号码的身份验证体系不适合信息社会,应该尽早改用公私密钥方式。这不是我们能决定的,就算是美国也没能到这一步,只能尽量呼吁。
  2. 商业机构应该尽量避免直接关联身份证号码,至少做到验证了人的身份之后不存储或尽量短时间存储。这也不是我们能改变的,只能尽量呼吁。
  3. 充分理解社会规则,并灵活应用。比如有人认为 不登记身份证就没办法住酒店,其实用户口本也可以。买火车票机票,护照、港澳通行证都可以用。当然这些也属于相对敏感的信息,但关联不同证件的能力目前应该还只有少数人能做到。灵活组合这些证件的应用模式,能在数据大规模泄漏时有效降低危害。
  4. 准备不同手机号码应用于不同场景,使用voip工具做到这一点成本更低,也更方便。
  5. 仔细阅读 http://donttrack.us/ 理解网络广告是如何收集你的隐私和定位你的。并且按照里面的建议处理你的浏览器。
  6. 扔垃圾的时候把快递单和信封上的信息用刀刮掉。
  7. 面对无处不在的摄像头,和识别率已经极高的面部识别系统,学会cvdazzle化妆方法
如果你真的关心这个领域发生的事情,仔细去思考应该能想到更多要注意的事情。不过我想多数人只是骂骂人发泄一下而已。

五 泄漏的信息与权利平衡

我支持传播已经泄漏的信息。因为信息的价值在于独享,秘密只有被少数人知道才成为秘密。一旦人人皆知,就不再是秘密,也不再有价值。所以加速传播被泄漏的信息,反而会降低对当事人的伤害,并且有益于整个社会群体。

对于个人来说,每个人都需要尽早知道自己的信息是否已经泄漏,并作出对应的解决方案。如果你不知道自己信息已经泄漏,而其他人知道,那么危害就很大,比如可以用来敲诈,也可以用来对你的亲属行骗。用更方便查看的格式,更快的传播,有利于人们确认自己的信息泄漏状态。

当所有数据人手一份的时候,每个人之间会形成权利平衡,即,你可以查阅我的信息,我也可以查阅你的。这比只有单方面拥有权利更加可靠,也可以降低危害。

这当然不是最好的办法,但这是现实条件下瑕疵最少的办法。

毫无保留的传播这些信息的人是友好的,因为他们本可以保持私有,用来获利。比如去做个查询信息是否泄漏的网站,这还能通过流量赚到广告费。(这次已经出现了好多个这种网站了)。直接毫无保留的放出全部数据的意义在于避免了进一步诈骗发生的可能性,这就是信息平等之后的好处。

举个例子说明吧。如果获得这次泄漏的身份信息的人,不直接提供全文下载,而是做一个网站,让你输入你的身份证号和电话查询是否泄漏,这就能成为一个新的骗局,大量本来不在泄漏范围内的人会主动提供自己的身份信息用来查询,最终被记录下来,造成新的泄漏。

甚至在没有发生真正的信息泄漏之前,都可以利用这种方式获得敏感信息。比如故意传播出某类信息被泄漏的消息,然后提供一个查询网站,把所有来查询的人的数据都记录下来。所以,在拿到你自己可以查询的全部数据之前,不要相信任何传说或者任何人。

除此之外,全部数据的流传也对于追查事情的起源有帮助。不同的人根据自己的知识,可以通过数据格式、范围、特征等等猜测泄漏的方式,这些碎片的线索组合在一起,就有可能拼凑出泄漏的方式和起源,以及系统的漏洞等。如果没有大规模的全部数据的泄漏,相信没有厂商会承认泄漏的原因是自己的平台吧。

很难相信特定的人或者组织可以完成以上这些工作,把全部数据放出来,通过群体的智慧来保护群体更可靠。这次泄漏的数据由最早风传的开房记录,到最后可以被确认是酒店内wifi认证的信息,正好可以说明这一点。

更有意思的是,正是因为这份数据被传播开,人们才有机会证明其中的数据是真实的。这又形成了另外一个驳论,即:对于二次传播者,如果不传播它,就无法证明其中真实数据的比例,也无法知道传播的是否是带有隐私性质的数据。

六 总结

信息安全和隐私是这个时代不可避免的威胁。解决这个威胁,不是靠情绪化的谩骂和煽动,而是需要确实可行的解决方案。涉及现实世界、政府、立法等诸多层面,这个问题的完美解决如此的复杂,并且需要漫长的时间。更有效的个人保护方式是先调整好心态,清楚的知道什么状况下信息有可能被泄漏。

当你每一次提供个人信息的时候,都应该先考虑这些信息泄漏之后会对你造成什么危害,并且想好处理办法。如果会造成不可避免的危害,而且你又想不出办法避免提供这些信息,那么这件事最好干脆不要做。

就和前一段突然冒出一些平时对版权毫不关心的人开始关心抄袭和临摹一样,这次也同样冒出来很多对隐私和信息安全毫不关心的人指责一个只不过转换了一下数据格式的程序员侵犯了他们的隐私。这是多么荒唐的事,对照我前面提出的解决方案,如果大部分事情都没做到,那么在信息时代你实际上是在裸奔的。

如果一个人不敢指责过分收集信息的政府,不去指责存储这些本来不需要长期存储信息的商家,又没法找到真正盗取这些信息的人,只去指责一个转换了一下数据格式,以利于人们查询和研究的程序员,这种行为显得懦弱又无知。在我看来,这就像一个裸奔的人,拼命保护着身上仅有的一条的领带,并且认为自己衣着整齐。

ps: 两年前密码泄漏的时候,我也写过一篇主题相近的blog: 《密码泄漏和黑天鹅事件》,其中也提到了"与其说是安全问题,不如说是出乎多数人的意料造成的恐慌"。

ps1: 想起来 @mathena 提起了比美国更严格的,加拿大的 Personal Information Protection and Electronic Documents Act 把链接补充在这里,有兴趣可以看看。

我读过之后,认为这份文档主要规范了信息采集的行为,交互规范,和保护规范。试图采集个人信息的机构需要依法进行,并且依法保护采集到的数据安全,如果泄漏要承担责任。但根据这份法规,就算这事情发生在加拿大,二次传播行为也没法被认为违法,因为采集,泄漏,交换的都不是他,他只是得到了泄漏的结果,重新再发布而已。 我很同意这份法规的主旨,即,任何机构不应该过分收集个人信息,如果非要收集,必须依照一个可行的规范进行和加以保护。虽然这并没能从根本解决问题,但至少让采集数据的行为变得更少和更慎重,也算解决了一部分基础问题,是有意义的。

我不得不再重复一次,改变认证体系/减少收集的数据/减少存储量和时间,这才是解决这问题的办法,加拿大的法案做到了后两件事。而去攻击那些传播已经泄漏的信息的人,对事情没有任何帮助,立法惩罚传播已经泄漏信息的人,同样没有任何帮助。

June 30, 2013

《神秘的程序员》漫画四周年

到这个月,《神秘的程序员》漫画已经诞生了四年。我和西乔互相谦让了一番之后,写一篇纪念文章的任务最终还是落在了我的身上。

2009年6月,我们还生活在北京,在那个月的月初,我们结了婚。婚礼之后,有一天我们发生了一段很好玩的对话,这段对话又囧又好玩,在我们哈哈大笑时,我突然想到是不是能改变成漫画,毕竟,程序员是一个有点特别的职业,这些人既傲慢又谦虚,既开放又封闭,对于和他们合作的其他行业,他们都显得神秘而难以理解,而他们自己的大量经验、教训和知识很难分享给别人,尽管这些往往是对的,但和他们合作的人以及管理层通常对此无动于衷。关于程序员、项目管理和工程的书汗牛充栋,但漫画几乎没有,甚至在英文世界这也几乎是空白。我们都意识到了这是一件值得尝试的事情,但在那个时候,西乔几乎没正式画过漫画,大概也从来没想到过竟然可以把一部漫画连载了四年之久。这部漫画和我们的两只猫咪(推特和翻墙)一样,是我们这四年生活中少有的一直陪伴我们的生命。

那天的对话,最后成了这部漫画的第一期,贴在了西乔的blog上,那一天是6月14日,距离我们的婚礼过去了10天。今天回头看来,那一期无论是人物对白还是形象都如此的粗糙和不成熟。转天她兴趣大发,又画出了第二期,同样贴在blog上。在同一个月,Google被封,于是有了第三期。这个时候,我们只有一个小的非凡数位板,为了画的更爽点,我们从当时的邻居口袋家借了一个影拓3来用。当时我们也没太认真思考这部漫画的未来,只是尽量把周围有意思或值得一提的故事表现出来。多谢我们的朋友,时任CSDN副总裁的韩磊,他把这部漫画转给了《程序员》杂志,让这部漫画得以成为杂志的一个栏目。成了固定的栏目之后,创作周期就不再像过去那样随心所欲,这种压力和动力倒是保证了漫画一直存在到了今天。

随着这部漫画的读者范围扩大,我们也一直尝试让它传达更多的意义,内容也就不仅局限在单纯好玩的故事。我们开始用它来表现项目管理,常见的陷阱,公司困境,以及一些感情生活。我们希望更多和程序员打交道的非程序员也愿意看这部漫画,并且希望通过漫画帮助程序员传达他们想说的。对于有几年实际项目经验的人,如果从头看一遍这部漫画,你会发现几乎所有的事情都在你身边发生过。这绝不偶然,漫画所用的题材多数都是取材于真实案例,就算是少数来自计算机工程经典书籍的,也是我们自己目睹或经历过的故事。我从高三时开始帮别人做项目,一直到现在始终都在和项目与技术团队打交道,西乔从大学时代开始帮别人做外包,至今也经历了很多大项目。不夸张的说,除了那些简单好笑的,大部分漫画的背后都是真实的血泪和金钱。

西乔是一个有毅力又喜欢创新的人,她一直试图尝试更多的表现形式,把这四年的漫画放在一起,你会看到很多不同的分格和排版方式,甚至还有一期尝试过利用众包获得内容,最后做成了强手棋的样子,这些都让漫画变得更有趣味,这些创新一直到最近仍然在发生,比如,最近她画过两期科幻故事,如果你认真看,会看到Spock和Kirk船长出现在漫画中的屏幕上。这样的彩蛋小趣味有很多,比如,在谈论一段充满补丁的代码时,我们节选了网上著名的恶搞Windows泄漏代码,在谈论早就改修改的代码时,做为BSD粉和GNU黑,我干脆直接从linux kernel里面找了一段丢给西乔做背景用,你还能看到当年风靡一时的LEGO MindStorm机器人,当年我们的朋友Tinyfool就买过一个,一度沉迷其中,还会看到西乔画的我曾经疯狂的挖Bitcoin......还有很多很多,我相信一定有一些读者看到这些时会心一笑,就像读到了那句著名的"所有的进程都是平等的,但有一些比其他更加平等。"

这部漫画本身也采用了工程的方法创作,所谓工程的方法,就是放大团队的优势,隐藏团队的弱势,分阶段进行。西乔采用了一种粗糙的画法,并使之成为了一种符合程序员和黑客文化的简单风格,就漫画本身来说,画法粗糙是弱势,但在黑客的文化背景下,这个弱项反而变成了优势。和软件工程一样,任何一个团队资源都是有限的,你不可能获得一个在各方面都完美的团队,如果你真的获得了,那么管理本身通常又不能匹配这样的明星团队从而变成弱势。如何利用有限的资源完成目标就成了工程管理的艺术,而当这个资源有限的团队长大之后,这些就成了公司的基因。接受资源的限制和世界的不完美,才能让项目持续和成长,这是我们在漫画中通过各种故事告诉大家的,也是这部漫画今天能够存在和发展的基础。

当然,我们也有很多遗憾,最遗憾的莫过于一直没能开始新媒体和跨媒体的尝试。在这么多年的时间里面,这部漫画始终就停留在了blog上的画稿和杂志上的印刷品,我们几次想尝试新媒体,但都因为时间和精力关系没能实现。除了漫画,我们希望把创作的背景故事重新写出来,放进app和网站中,而整理这些旧事又是一个巨大的工程,一直难以开始。无论如何,这会是我们下面一年努力的事情,希望能尽快让这部漫画在更多的载体上和大家见面。

所有的荣誉应该归功于西乔,虽然主意是我出的,但一直坚持画了四年之久的是她,这是了不起的毅力,我看着她在每一个截稿日之前的痛苦和彻夜难眠(主要是拖延症造成的),这些让这部漫画对我们来说尤其真实,所以之前我说了,对于我们来说,这部漫画是一个生命。 最后,感谢一直帮助和支持这部漫画的朋友们,感谢韩磊,刘江,李骏(Soulhacker),余晟(Yurii),冯大辉(Fenng),高春辉,李亮(Holly/Opensky2)...感谢你们提供的建议和帮助,最要感谢的还是漫画的读者们,是你们让这部漫画有了存在下去的意义。


2013年6月30日凌晨于上海

March 19, 2013

Google的社会化梦想与Reader

朋友跟我说,你那些打算写的blog要是再拖着不写,拖过7月1号Google Reader关闭了我们就看不到你blog了。这个笑话讲的很好,所以我决定最近多写点,我们就从Google Reader开始吧。

一 搜索与社会化

Google Reader的前产品经理在Quora回答了关于Reader关闭的问题 ,导致Google Reader被关闭的主要原因是Google Plus。这并不是一个出乎意料的答案,从Google把Reader的分享功能强制转到Google Plus之后,很多人都知道,这一天早晚会来。

Google Plus是一个让我非常不喜欢的产品,但讨论这个产品,必须要从搜索和社会化的关系说起。几年前,SNS尚未覆盖到足够多的人口,那时候搜索引擎是获取信息的重要方式。这个很好理解,人们碰到一个问题,会去Google搜索答案。比如现在这件事,如果几年之前,人们会去Google搜索"为什么Google Reader被关闭了"。但现在,SNS已经覆盖了足够多的人口,事情发生了变化,现在你应该不会再去搜索这个问题了,而是会去你常用的SNS上,把这条问题贴出去,然后你就会收到很多答案,有一句话的回答,比如"因为Google Plus","因为RSS不重要了",也会有人给你一些链接,这些链接带着你访问到更长的文章,比如Google blog的官方声明,或者是我这样的blog。

于是,人们发现了,越来越多的东西,在SNS上向好友提问,会比直接去搜索更好,得到的答案质量也更高。这是为什么?原因很简单,因为SNS的关系确定了关注范围,你和你的好友往往关注在相似的领域,这样等于他们帮助你扩大了视野,过去你需要读遍所有的相关信息,现在不需要了,你没有读过的信息很可能藏在你的好友脑子中,你只需要问就可以了,好友往往能帮你获得更准确的答案。

Google伴随我们走过了互联网信息匮乏的年代,进入了这个信息过度繁荣的年代。现在信息不是太少,而是过多。从过多的信息中找到所需的变得比以往更加困难。在几年前,利用PageRank就可以获得最有价值信息,但今天这招已经不那么灵了,一方面实时性信息更加重要,另外一方面因为需求的多样性(或者称之为长尾),任何一个搜索结果,对于某一个特定的人,都应该有完全不同的排序。而SNS的模式天生就可以解决这些问题。

传统的搜索不会完全消失,但基于SNS的搜索或者叫做知识共享,必然会夺走传统搜索的市场份额。对于Google,这意味着一些本来能赚到的钱会被Facebook和Twitter这样的SNS赚走,甚至这意味着搜索引擎这个商业模式增长期的结束。 从另外一个角度考虑,社会关系可以提供更精准的数据,从而大大提高广告匹配程度,进而提高命中率,带来更多的收入。可见搜索引擎和社会化早已密不可分。

Google对社会化的尝试很早就开始了,按照时间顺序来回溯,我们可以看到整个过程。



  • 2008.11 SearchWiki 通过这个功能,用户可以对搜索结果进行重新排序,这个功能只影响登录过的帐号,并不算完全的社会化搜索,但这是一个很好的开始。


  • 2009.10 Google Social Search 这次是真正的社会化搜索,搜索结果中整合了 twitter 和 FriendFeed的好友关系,后来加上了Google Reader的好友Share结果。如果你跟我一样是twitter和Reader的重度用户,在这个时段会觉得搜索无比好用,我搜索的结果往往是朋友分享过的内容,甚至我在寻找一些技术问题的时候,会在搜索之后去找到分享过我需要内容的朋友直接发邮件讨论。


  • 2011.3 Google +1 从技术上,这是一个伟大的产品,你的好友在搜索结果里面点击了+1按钮,将来你搜索的时候就会看到,这会让每个人的搜索结果都受到好友关系的影响,从而完全不同又更加精准,这个功能需要有巨大的数据量和计算量支持,而且几乎实时,在技术上这是令人惊叹的成就(后来我们知道了,那时候Google已经部署了Spanner了,我猜想正是有了Spanner,Google才有能力支撑这个产品。将来我们有机会单独谈Spanner这个伟大的系统)。可惜在产品上,这不是个好主意。Google的原则之一是"让用户尽快离开Google",也就是说,用户获得搜索结果之后,就离开Google,转向了目标网站,这是Google价值观的体现,也是其成功的要素之一。但这个原则和+1这个产品发生了冲突,没有多少人会在点击搜索结果离开Google之后再回来点一次+1,这个产品的应用场景出了问题。


  • 2011.6 Google Plus这个Facebook的克隆终于上线了。 虽然Google自己号称Google Plus有各种各样的独创设计,但无一能改变它就是一个Facebook的克隆这个本质。


  • 2011.11 Google Reader被去掉了分享按钮,换成了分享到Google Plus

按照时间线回顾这段历史,你会看到,最大的转折点是2010~2011年,随着Larry Page重新担任CEO,从微软来的Vic Gundotra被提升为负责社交产品的SVP,Google整个变得不对劲了。所谓不对劲,就是从创新走向了山寨,而且失去了应有的品味。做为开发过搜索引擎的人,我非常能理解社会化对搜索引擎的重要意义,但竞争不应该是通过Google Plus这样的山寨产品进行的。

到目前为止,社会化搜索方面,最像样的变化确实发生在Facebook,而不是Google。Facebook的Graph Search是一个令人惊叹的创新产品。只不过在基础技术方面,Facebook比Google还有很大差距,前面提到过Google Spanner,我想Facebook目前还没有同级别的基础设施,所以Graph Search仍然还在测试状态,速度慢,还没办法让所有用户都用到。

二 Google Reader的金矿

前面说到,2011年之前的Social化测试中,Google Reader的分享和好友关系都提供了重要的数据。Google Reader确实始终没能成为一个大众产品,但因为其用户偏向专业和严肃,所以其数据质量相当高。这些数据是一个巨大的金矿。

RSS这个概念过于复杂,难以被普通人理解,不过RSS也不应该直接面对普通用户,它是一个基础协议,应该被包装成合适的产品使用。在我看来,Follow这个动作就是对RSS最好的包装之一,而早期Facebook的Feed同样可以看作是对RSS订阅的包装。

本来Google reader加入了好友和分享之后,已经在往正确的方向行进,并且已经有了坚定的数据基础,但Google Plus毁了这一切。随着Google Reader的分享被去掉,Google Reader的整个社区立刻消亡,人们并没有像Google预料的那样进入Google Plus,而是直接选择了放弃。

到现在来指责Google Reader用户滑坡是不公平的,一个被去掉了最重要的功能,禁止再做社会化尝试,并且还不断的被抽调走人手的产品,能维持至今已经是奇迹了。如果没有Google Plus的影响,让Google Reader顺利发展到今天,或许会成为和Facebook完全不同的一种社交系统,从而再次改变人类的知识结构。如果是2003年,那个刚刚推出Gmail的Google,他们一定会这样做,遗憾的是2011的Google不会再这样做了。换句话说,Google引以为豪的文化已经改变了,这个结论可以从一系列事件看出来,我会在第三部分说到。

虽然没有了社会化功能,但RSS本身的良好设计和Google Reader过硬的产品质量,仍然没有令其丧失生命力,BuzzFeed说,到目前为止,Google Reader驱动的流量仍然远远大于Google Plus,原文中有两幅对比图,非常令人震撼。 著名的独立blogger, JOHN GRUBER证实了在他的blog上,这个数据是正确的

没有了好友和分享功能的Google Reader距离普通人更远了,但却在无意间成为了一种半专业工具。其用户中大量是媒体记者,编辑,Blogger等等传媒相关职业以及一些研究人员。我看过西乔如何创建Designlol的内容,也看过谷奥创始人gokeeper如何为谷奥挑选新闻,他们都是用极快的速度扫过数百个订阅源的标题,从中筛选出可能有意义的内容,然后展开仔细阅读,最终决定是否应该采用,最终形成读者看到的网站。

不知道当年抄袭谷奥的新浪科技郑峻是不是也这样工作 ,我想应该不是,新浪这类大型媒体有自己的内容管理方式。这就是我说的"半专业工具"的意思,Google Reader为大量基于Blogger的小型媒体提供了信息获取和内容管理工具,帮助他们用极低的成本完成工作,而大型媒体往往有自己的媒体工具,反而不需要这种工具。但正是这些半专业的个人媒体,逐渐变成我们每天阅读的主要内容,可以回想一下自己阅读习惯的变迁,是不是已经从阅读门户新闻,逐渐变成了阅读中小型个人媒体。这是blog,WordPress,RSS和Google Redaer的共同贡献。所以就算是你没亲自使用Google Reader,间接的,它也在帮助你获取信息。

Blogger们和研究人员对Google Reader的用法是这样的:他们订阅大量相关的内容源,平时并不会全部读完,但是在需要知道某些事情时,会到Google Reader中搜索,我就是这样写的这篇Blog,这里面列出的数据和链接,多半是通过这种搜索的方式获得。换言之,对于这类用户,Google Reader不仅是新闻源,还是资料库。

这种使用方法就直接把Google Reader变成了个性化搜索引擎,为什么不直接用Google搜索?因为内容太多了,多数内容我只要从平时自己积累下来,订阅过的信息源中搜索就足够了,快而且准确。如果Google Reader的分享功能没被去掉而是继续加强,并且引导用户这样使用,我应该还可以搜索朋友的分享和朋友的订阅,那样的话社会化搜索早就成型了。可是,Google的短视错过了这个机会,在决定了关闭Google Reader之后,整个社区和用户群分崩离析,再也没有这个机会了。

除此之外,Google Reader缓存了大量历史数据,一些blog网站已经不在了,但只要输入RSS源,在Google Reader仍然能看到。这次关闭之后,这些数据很有可能永远消失掉了。三年前年我曾经写过,在Google的帮助下,大部分信息将得以永存,没想到仅仅是三年之后,我们就面临着如此巨大的损失。

2006年,人们认为RSS和Blog圈子的兴起会导致媒体和信息获取方式发生本质的改变,大量资本投入这个领域,出现了无数家创业公司。但不幸的是Google Reader做的太好了,直接导致了这些创业公司们的死亡。到今天Google自己放弃了Reader,这必将造成大量的空缺,暂时没法弥补。虽然未来会有新的公司再重新开始,但那要是很久之后的事了。夸张一点说,Google这个愚蠢的决定在一定历史时期内会造成人类信息获取的空缺,这种空缺不仅仅对于直接用Google Reader那些人,还要包括阅读谷奥之类个人媒体的读者,他们是间接的Google Reader使用者。多么讽刺,这是一件和Google愿景完全相悖的事情。

三 曾经Google精神的远去

几年前,Google是创新者,它创新,开放,但今天,Google越来越习惯严防死守可能的竞争对手,它不再那么开放,它开始模仿潜在竞争对手,用和对方完全一致的方式竞争,然后用自己的巨大体量去试图压死对方,正像曾经的微软做过那样。

有几个我认为非常重要的事件:



  • Google和餐饮点评网站Yelp的纠纷。曾经Google和Yelp是合作伙伴,但当Google收购Yelp未果之后,合作停止,Google开始用爬虫抓Yelp的数据,并且不给来源的显示在Google Maps上。被抗议之后,Google干脆自己做了Google Places来和Yelp竞争。


  • Google担心移动互联网和App会影响搜索流量,于是收购了Android,并且把Androd弄的越来越像iOS,以此来和Apple竞争。最早发布的Android手机非常像当时的Nokia,但现在已经和iPhone非常像了,并且,Google毫不在乎和三星这种无良企业合作对抗Apple。(关于为什么说三星是无良企业,以后我专门写,不仅仅是抄袭Apple这一点事)


  • Google担心社会化搜索会影响流量,所以放弃了自己在社会化搜索方向的任何努力,完全照着Facebook做了Google Plus。


  • Google担心电商网站,比如Amazon,会成为新的流量入口,所以做了Google Shopping,甚至还提供了Google Shopping Express物流服务。

这些事情都太无聊了。Google分裂成了两个,一个是Larry Page领导的无聊没品Google,持之以恒的用和竞争对手一样的方式竞争,正如曾经微软干过的,当然,他们提供的一切都比竞争对手便宜点,Android比iPhone便宜,Google Shopping Express比Amazon Prime便宜。另一个是Segrey Brin的Google X,更像几年前的Google,可惜做出来的产品宣传意义远大于实践,对于不太关心科技(科技不是IT和互联网这一点点范围)进步的人可能会觉得很创新吧。

在Larry Page这边,你会看到曾经Google精神的远去。Google不再希望你找到需要的信息立刻离开Google,而是希望你一切都在Google完成,最好一切都在Google Plus完成。Google不再是Don't be evil,而是be evil。Google不再帮助创业者,而是利用自己的规模优势压制创业公司。Google Places和Android虽然是在照猫画虎,至少还是为用户提供了一些实际好处。Google Plus大概是Google第一个完全为竞争对手而不是用户开发的产品,它对用户几乎没有好处,坏处倒是不少。我想这样的产品未来还会再有,这绝对不是最后一个。

Google不再开放,你在Google Maps只能看到Google Places的结果,不再能看到Yelp的,但相反,人们一直认为封闭的Apple反而越来越开放,Apple Maps搜索结果和Yelp提供的数据,Siri也会使用Yelp的结果,Apple因为自己在互联网服务上的弱势,反而为其他企业提供了更多机会。开放和封闭始终是相对的,在自己的强的部分没有人会开放,在自己弱的部分则必须要开放。Google不会开放自己搜索的算法和逻辑,也不会允许第三方有机会染指搜索结果页面,Apple不会开放授权自己的硬件和操作系统。但Google会开放硬件和操作系统,Apple会开放互联网服务。

开放的变封闭,封闭的变开放,整个商业史上一直重复着这样的变化。事情的有趣有正在于此。做为观察者,我们不应该用贴标签的方式来分析企业,比如把开放贴给Google,把封闭贴给Apple。有人会说,几年前你称赞Google,今天你批评Google。我认为这才是一个独立Blogger应该做的事,事情变化之剧烈往往超过人们的想象,三年前的Google值得称赞,不幸的是三年之后这家公司变得令人失望。如果仅仅因为当时称赞了Google,今天不去批评,那才是荒唐。从Google Reader这事上看来,一个企业变化甚至可以在一年内完成。这是令人沮丧又令人充满希望的事实。

无数的变化正在时刻发生,但至少我们知道,用和竞争对手一样的方式杀不死对方。无论Google怎么努力,Google Plus不可能杀死Facebook,Android不可能杀死Apple,Google Shopping不可能杀死Amazon,甚至Google Places也不可能杀死Yelp。真正会杀死Google的公司,未来一定会存在,虽然暂时我们还不知道它在哪。想想微软多年来对办公软件和操作系统的严防死守,却没料到互联网和移动设备的浪潮几乎彻底颠覆了整个PC产业。

Google在年龄上比Amazon和Apple年轻的多,今年,人们开始说Apple缺乏创新,而Amazon继续以花掉自己能赚来的每一分钱的方式来探索极限。令我意外的是,最年轻的Google反而悄然无声的老了,比微软还要老。

========================

update 2013.3.20: 到目前为止,看到最多关于本文的评论是:这个产品没有收益,Google要保证股东利益最大化等等。这些评论毫无疑问都是错的,这件事和钱无关,至少和表面上直接的产品收益无关。这个行为与收益无关这个事实,从本文列出的Google Reader前产品经理的回答就可以证明了。这件事更重要的是对于产品和搜索未来的看法,我写的也正是对未来的看法。有意思的是,开始我以为我的看法比较特殊,但据知情人士透露,Google内部也同样有这种声音。如果你到现在还坚持认为这就是一个成本和收益的事,那么也太小看了Google。

January 21, 2013

大时代的背影之下

可能很多人会有点意外,我这个一年多没更新的blog,竟然,更新了一篇影评...

======

赶在iMax版的《一代宗师》下线的最后两天,连着去看了两场。想来想去,我决定还是为这部电影写篇文章。

在说这部电影相关的事情之前,有两本书不得不提。一本是《逝去的武林》,另外一本是《城邦暴力团》。看电影的过程中,我不停想起这两本书。于是我看完电影没离场,等到了最后,终于在演职员表的最后几个名字中找到了剧本顾问:张大春。他是《城邦暴利团》的作者。《逝去的武林》的作者是形意拳传人李仲轩,但直到我坐下来准备写这篇文章时,猛然发现李仲轩先生只是口述,而真正整理成书的人是徐皓峰,他是这部电影的编剧之一以及武术顾问。

到这里,我的第一个谜团算解开了。而这样的谜团之后还有很多很多。好书,或者好电影的标准有很多,我认同的标准之一是:一本书或电影应该是一个引子,它打开一扇门,让你看到无尽的天地。

《城邦暴力团》就是这样的一本书,而《一代宗师》也是这样的一部电影。我当年曾经想为《城邦暴力团》写份书评,因为这是我觉得最棒的一本中文小说,最终觉得驾驭不了,作罢。不过我想把曾经给这本书写的一段话挪到这里给电影用:

「它就像一幅用细线编织成的画,初看上去色彩斑斓但似乎并不工整,等仔细定下神来看,发现那斑斓的色彩竟是山峦起伏、河水奔腾,但画面周围似有无数的线头不知所终。最后,当把一切都联系起来之后,你猛的拉了其中一根线头,整幅画消失了,只剩下一条连续的细线。」

当然,电影不是书,两个小时的时间装不下这么多东西,也做不了这么精致,不过,这意思大致是到了。

张大春最喜欢玩的把戏是把历史揉碎,跟现实混在一起重新拼装,最终把一个完全虚构的故事毫无破绽的融入历史之中。《城邦暴力团》所写的民国历史就是如此。《一代宗师》同是写民国,也用了不少这种手法,里面的人物,似真似幻,虚虚实实,这些故事本应起源天津,而电影则把他们放在了东北和广东这一冷一热的两端,这边天寒地冻,那边下着大雨。如果把这些人放在真实世界中连起来,最终能带出整个民国历史,涉及天津、东北、广东、香港,真是大场面。我想王家卫应该是把历史和人物完全厘清了,但这种厘清导致他在现实的历史中越走越远,一下就走了十年。最终,到了今年,终于不得不把电影上映,但到此时,他仍然没办法剪辑出一部让自己满意的电影。

我非常能理解,这就是我正在写这篇文章的心情。在我看来,民国时期是真正的大时代,所谓大时代,就是有各方力量牵扯其中,每个人都有无数的选择,未来变幻莫测,你一个念头,二十年之后就是另外一番天地。在民国之后,中国下一个能称作大时代的时期大概只有改革开放这些年。今天我们也同样面临如此,你的一个选择,二十年之后才能知道命运带你走向何方。

言归正传,我们先说几个人物。

首先说宫羽田。宫羽田这个人是虚构的,我起先推测是孙禄堂,因为孙禄堂合并了形意和八卦两门,不过他并不是生活在东北,而是生活在北京和天津。宫羽田在掰饼一段讲到他的大师兄李存义的事,李存义真实存在,是形意拳宗师之一,他在天津创建了中华武士会。形意拳另一位宗师郭云深,指点过李存义功夫,孙禄堂早年追随过郭云深。所以孙禄堂如果称李存义师兄,也说的通。电影中,宫羽田和叶问说到另外一位姓叶的拳师叫叶云表,拿了饼让李存义掰,最后李存义让他当了会长。顺便说一句,郭云深创造了「半步崩拳」,就是在金楼上楼的时候,叶问用「咏春听桥」所破的那招。李存义有个徒弟,叫做尚云祥,尚云祥也是形意拳大师,同时也是八卦掌大师,更好玩的是他也精通半步崩拳。尚云祥有个徒弟,叫李仲轩,就是前面提到的《逝去的武林》的口述者。历史就是这么有趣。

现实中,叶云表也是形意拳名家,他是中华武士会发起人之一。中华武士会并不是单纯的民间组织,而是同盟会下的团体。中华武士会的名誉会长是直系军阀冯国璋。所以电影中有「拳有南北,国有南北吗?」这句话,那时候的武术不仅仅是武术,那一代的武术家认为武术可以救国。

和宫羽田原型有关的另外一个真实人物是八卦掌名家宫宝田,宫宝田当过光绪皇帝的侍卫,后来去了东北跟随了张作霖担任奉系武术教练。无论是孙禄堂还是宫宝田,最终都没在东北立门派,也应该没去过广东。也许宫羽田是这两个人组合再虚构吧。

「那年,中华武士会成立。从南方来了一个人,话不多说,手中拿着一块饼,让我大师兄李存义掰开。我师哥李存义没有说话,还让他当了武士会的第一任会长。他拼的不是武功,是一句话:拳有南北,国有南北吗? 」----宫羽田

然后说一线天这个同样是虚构的人物。一线天看起来和剧情毫无关系,其实也确实没什么关系。但是,在真实的历史中,一代人都会莫名其妙的发生各种关联。电影中的一线天后面隐藏着一个组织,叫做蓝衣社。蓝衣社的重要人物是戴笠,著名的特务头子。这个组织干的最多的事,就是暗杀。听起来很可怕,但最早成立的目的竟然也是为了反日救国。从本质上说,和中华武士会的以武救国本质是一样的。

蓝衣社本名叫力行社,而力行社的核心成员来自另外一个组织,叫做中华民族复兴社。复兴社的在南京成立,社长是蒋介石。最终,到了1938年,蓝衣社解散,同年这帮人进入了另外一个组织,叫做军统。

电影里面对这段历史暗示很多。一线天第一次出场,是在火车上遇到宫二,一线天手里拿了把剃刀,手上全是血,应该是刚干完一桩暗杀的活。宫二掩护了他,最终从日本人手里逃脱。第二次一线天出场,是要脱离组织,和他对打的对手们个个拿着一样的刀冲了上来,这一切都在暗示背后是一个巨大的暴力组织。

在张大春的《城邦暴力团》中,蓝衣社也是重要角色。

叶问当然是真实存在的,因为其弟子李小龙的原因,叶问比其他人有名的多,所以这部电影里面关于叶问的事情基本都和历史对的上。所以关于叶问,不说人,说说地方。如果你去香港玩,彌敦道这个地方一定是耳熟的,这条路连接了油尖旺地区,可以从尖沙咀一直走到旺角。在这条路上走的时候,如果你注意看路边楼上的招牌,会看到好几处和咏春有关的武馆,你会不会有点好奇,为什么这里会有这么多咏春武馆?答案是叶问正式注册成立的第一个组织叫做「叶问国术总会」,就在尖沙咀的美丽都大厦,而,距离这座大厦几十米远,就是著名的重庆大厦,是王家卫的另一部片子重庆森林的拍摄地。

想来一路上那些咏春武馆都是叶问弟子所开。而彌敦道一直走下去,走到太子,左手边就是大南街,这就是电影中,叶问和宫二最后一次见面的那条挂满了各门派牌匾的街道,好像一个武林。叶问到了香港,就是在大南街上的港九饭店职工总会开始教咏春的。这,是咏春走向世界的起点。

说完了人物,来说说命运。

影片中,宫羽田一直在试图融合门派,他融合了形意和八卦两门,又想南拳北传,北拳南传,最终就是希望武术能走出门派之争。叶问说「其实天下之大,又何止南北。勉强求全,等于固步自封。在你眼中在,这块饼是个武林。对我来讲是一个世界。」

最终,叶问确实做到了,但与其说是叶问做到了,不如说是命运推着叶问做到了。叶问飘泊到了香港,因为生活所迫开始教咏春拳,虽然是咏春,但「我一辈子没挂过招牌,对我而言,武术是大同的,千拳归一路。」,这种包容一切的思想碰到了适合的时机,成就了今天的咏春拳。叶问的徒弟李小龙走的更远,李小龙的截拳道主要来自咏春,但其中融合了各种武术的优点,不仅中国武术,而是世界各国武术,正应了「一个世界」这说法。当然,至今为止对李小龙的武功高低一直有争议,我觉得这反而不重要。我一直认为,截拳道是MMA的初级阶段,到今天的训练水平和MMA的发展,翻回头再去比截拳道的高低已经没有意义了。而李小龙,最终让「功夫」这个词跨越了种族文化和语言,真正遍布世界,这才是最重要的。随着截拳道和「功夫」的流行,咏春拳也遍布世界,大概是练习者最多的中国功夫。

而八极拳,八卦掌,形意拳,这些在历史上曾经比咏春更大的门派,现在练习者反而成了小众,尽管他们的传人同样到了香港,开了武馆。这一切,真的「都是时势使然」。

当然,无论如何毕竟他们都存在着,这是幸运。

李存义还有另外一位弟子薛颠,他也是《逝去的武林》口述者李仲轩的另外一位师傅。李存义过世之后,薛颠接管了天津国术馆(前身为中华武士会),传播形意拳,并且把象形加入了形意拳,也可谓一代宗师。1953年反右运动中,薛颠被当作拳霸枪毙,弟子也散了。他这一门的拳术就这么失传了。

同一时期,天津大侠霍元甲带着徒弟刘振声(陈真原型),到了上海创立精武体育会,和天津中华武士会有千丝万缕的联系。霍元甲创立精武体育会没多久就被日本人毒杀,1910年客死上海,但精武体育会反而一直到现在还在,霍元甲更是被奉为民族英雄。

这就是命运。

如前文所述,大时代下,人的命运和选择太多,如何选择,谁也不知道,但一旦选了,历史的齿轮就开始运转,几十年后才能看到选择的结局。而今天,谁知道是不是个大时代?

回到电影上,一代宗师这部电影确实有若干硬伤,就像一幅缺了若干块的拼图。但就算有了这些硬伤,从剧本,镜头,武打动作,对白,道具细节等等所有方面,都能归为经典,如我前面所说的标准,它打开一扇门,让你看到无尽的天地。当然,我还是期待着四小时甚至八小时的版本,这个长度才能铺陈下那个大时代,也许那时候这幅拼图能拼的完整,会给我们一个完整的故事,一个不习武,对民国历史没什么兴趣,也没看过这两本书的人也能看明白的故事。当然也有可能,导演入戏太深,永远也剪不出这部让他满意的电影。这也是命运。

如果让我选,最适合看这部电影的影院是香港的iSquare。看完电影,从iSquare走出来,眼前就是彌敦道,站在彌敦道上,往尖沙咀方向看,斜对面就是叶问国术总会和重庆大厦,眼前的彌敦道人流滚滚。在叶问躲到香港的1949年,香港和大陆之间并没边界,人们可以随便来往,叶问离开佛山的时候,留给了妻子两句诗,大意是总有一天我会回来。那时候的叶问,大概觉得很快就会回来吧。但一年多之后的1951年,中英同时宣布封锁边界,他回不来了。电影里面最后一部分,可以看到叶问穿着西装站在标尺前照了一张证件照,从此,他就是香港人了,再也没回过佛山。

中华武士会成立于天津三条石,这些一代宗师们练习武术的地方,叫做河北公园,后来改名叫中山公园。这地方距离我家几百米,我从小就这公园爬假山捉迷藏,跑步,后来也练武,打太极,练双节棍,直到22岁大学毕业后我离开天津。历史和现实的连接,有时就是如此之近,这些线索,最终让我写下了这篇跟我常写的IT毫无关系的文章。

December 25, 2011

密码泄漏和黑天鹅事件

从天涯的密码被公布之后,我觉得这事情闹的有点大了,周围很多人恐慌,所以我就勉强写一篇说说我的看法吧...
==========================================

世界上没有什么东西是安全的,除非其毫无价值。所以最近发生的CSDN/7k7k/天涯等等密码库明文泄漏的事情完全在情理之中,甚至我相信还有更多的库还没进入大众视野。很多人可能是第一次遭遇这种事件,心理上承受的打击比较大,大概感觉应该像是被扒光了衣服丢在人堆里。其实这种事情发生的太多了,比如半年之前SONY用户数据库被泄漏,那个包含的信息更多,甚至连家庭地址都有,而且数量也大的多,据估计有7700万玩家数据。相比起来中国网站目前泄漏的这点密码实在不算什么。我相信好玩的还在后面。

在密码方面,我的个人经验是这样的:

1. 多数网站我不信任,所以都使用简单密码。为了增加一点乐趣,我还通常会用一些带有嘲笑意味或侮辱意味的词汇缩写做密码,既然知道肯定会被人看到,那还不如调戏一下看我密码的人。结果没想到这次泄漏出来之后调戏的人有点多。我相信这种共识在程序员群体中普及很广,CSDN泄漏的密码中极大比例是简单密码,并不能说明程序员没什么安全意识,而很可能是他们太有安全意识了,根本不指望网站能保密,反正也不重要,干脆用最简单的,省下来脑子去记重要的。在CSDN密码泄漏的当天,我问一个朋友,xxxx@xxx.com是你的帐号吗?他回答如果密码是12345678就是,否则就不是。他就是这样的心态。

2. 不要给任何网站用一样的密码,除非你确认他们全无价值,以至于被别人登陆了也没什么大不了的。

3. 对于最重要的服务,光靠密码是不行的。密码只是权宜之计,甚至可以说非常脆弱,这也是在各种条件之下权衡出的一个勉强可用的解决方案。除了密码之外还有很多方法(虽然也各有弱点),比如密钥(startssl.com用的就是http密钥),或者硬件token(除了银行,google 2-step也是),这些都能降低被盗几率。基本所有服务都可以找回密码,所以一个足够安全的邮箱才是最重要的。目前只有gmail在各方面都符合我的要求,比如:登陆出错之后图片验证码足够复杂,有登陆日志,找回密码有时间限制,有硬件token等。所以,就选gmail吧,如果你真觉得安全重要,就别在乎偶尔访问困难。之前因为gmail偶尔访问困难而把企业邮箱迁移走的团队,你们实在缺乏远见。

4. 在没有https的网站登录,登陆中发送的密码很容易被窃听。所以登录非https网站,需要清醒理解,如果当前网络环境不安全,这个密码很容易泄漏,即使是在网站本身有严格加密的前提下也是一样。如果在不信任的网络下,就先拨一个私有VPN吧。(delphij据说就算在美国酒店上网都要先拨回自己家里路由器上的VPN,要学习这种折腾精神)

5. 足够重要的服务密码要给予相应的重视。密码难记是正常的,除了努力记,还可以用一些可靠的密码管理器(请先确认使用密码管理器的计算机是足够安全的)帮助存储,比如mac的Keychain Access。不过就算有这些,自己也应该有几个超过10位的数字字母符号混合的密码完全自己记住。记密码通常是靠连续多打几遍,让肌肉反射记住而不是脑子。Mac OS X的Keychain Access可以生成一类叫做memorable的密码,是比较适合记忆的,强度也算过得去。如果不能确认计算机是安全的,那么密码写纸上比用软件记录还安全点。

6. 为了保证计算机足够安全,我个人还有如下习惯(可能有点极端)。 a) 不使用任何第三方输入法,除非开源 b) 在mac上不用root权限运行任何非系统自带程序,除非开源 c) 如果非常用不能确定的程序,专门给它建一个虚拟机 d) 不用任何所谓安全软件,除非开源,这和c所说的其实是一个问题,这类软件权限过高了。e) 手机不越狱也不取得root权限,有多少好处也不。

个人经验介绍完毕,下面来讨论一下密码泄漏事件本身。

密码泄漏事件是典型的黑天鹅事件,这个说法来自一本叫做黑天鹅的书,大意是这类事件在发生前谁都不觉得会怎么样,但在某个时间点一定会出现并造成重大损失的事件。在今天这个时代,因为信息已经传递的足够快,所以黑天鹅事件会更加频繁的出现。这类事件,没什么避免的方法,除了清醒的知道自己在做什么之外,唯一能做的就是增强想象力,尽量多想一些可能性。从这个角度说,这次的密码泄漏事件其实是好事,如果没有这么大规模的密码泄漏,恐怕很多人根本不会想到竟然还有这样一种可能。

所谓清醒知道自己在做什么,就是在填写个人信息(包括但不限于密码)的时候你是否考虑过这些信息会被用于哪里,对方是否有能力保护其安全。前几天居委会跑来要登记个人信息,我要求对方出示这样做的法律依据和保密方法,对方拿不出来,我就客气的请对方走人了,对方居然也很配合的没多说什么。我相信很多情况都是如果你在乎一点,稍微追问一下,结果都会很令人满意。大部分企业是根本没有安全审计流程的。所以千万别太相信他们的保密承诺,就算他们真的想保密,是不是有这个能力也得打个问号。

所谓增强想象力,就是要多考虑一些可能性,比如在这次之前,如果你曾经想到过某个网站用户库在将来可能会被明文放在网上供人浏览,那么你就不会在不同网站用一样的密码。这时候也就不用慌乱一团四处修改密码。(在你慌乱一团修改密码时,如果你所在的网络环境不安全...后果只会更糟糕)

对于黑天鹅事件最好的办法就是增强想象力,多数人是缺乏想象力的。说到这里,我想再提起一下现在已经不那么热的Bitcoin。我对Bitcoin的态度一直是支持的。就算今天看起来不太火,我的态度仍然是支持。有些人嘲笑我这个立场,但到目前为止,Bitcoin体系仍然完备且运转正常,我不知道他们言之凿凿的说我在这个问题上"错了"是来自什么判断。我想这正"缺乏想象力"的具体表现。当确认一个东西没严重漏洞,确实可行之后,就不能轻易忽略它,更不能用以往经验轻易判断为不可能发生。而更应该想想"如果发生了"之后怎么办。再换个角度理解这件事,就算在Bitcoin这件事上我的判断错了,这并不会造成什么损失,对于我个人似乎就是损失了点电费,我毫无困难的可以承受这些损失,而万一将来真的有一天发生了某个极小概率的黑天鹅事件,Bitcoin就有可能成为主流应用。其实上一次Bitcoin突然很热的背后原因是Wiki Leak的捐款渠道被关闭,人们突然意识到需要一种不被限制的金融体系。Wiki Leak这件事本身就是黑天鹅事件。Bitcoin当然未必会成功,但现在断言其一定不成功的人,的确是太缺乏想象力了。今天我们所使用的互联网,也是黑天鹅事件。90年代我第一次用互联网时,其晦涩难用怎么也让人想象不到有生之年能够普及,但仅仅几年,对人们已经是和水电一样必不可少的东西了。

在《黑天鹅》这本书出现之前,没人体系化概括这种现象,但类似的看法倒是一直存在,比如地球同步卫星理论发明人兼科幻小说家AC克拉克有个说法,大意是:如果一个德高望重的科学家说某个事情"不可能"通常他是错的,如果他说"可能"那么通常他是对的。所以应该把"我们不知道"这种态度做为面对事情的常态,尽量多相信一些可能性。

在我看来,这次密码泄漏事件所引起的震动,与其说是安全问题,不如说是出乎多数人的意料造成的恐慌。这些密码库其实早就在各种渠道流传,只是多数人不知道罢了。甚至可以说如果要出事早就出了,根本不会等到现在。目前造成最大影响的是人们意想不到所以恐慌,而不是密码库泄漏本身。甚至在半年前Sony数据库泄漏事件都不会让与此无关的人多想一些"如果..."。目前首要任务甚至不是提高安全知识,而是提高想象力。我的确在很多年前就想到密码可能会明文被放出来,所以我用各种骂人和嘲笑的话组合做密码,用来调戏能看到密码的人,到今天这事情果然发生了。这就是想象力的意义。我想任何人只要之前想象过这种可能性,都会对自己的密码更加认真一点。

PS: 说起Bitcoin,我一直关心这问题本身,从这里面学习到的思考方式和架构知识足以让我值回实验投入了,比如http://www.slideshare.net/dakami/bitcoin-8776098 ,看看是不是很有趣? 作者Dan Kaminsky称的上是顶级安全专家了。这是不要轻易判断"不可能"的好处,跟踪一个看起来实现概率不大,但基础完备的事件,从中能学到很多有用的东西。


update: 看到了 delphij 这篇,顺路推荐 https://blog.delphij.net/2011/12/post-608.html

October 7, 2011

Think different & be yourself 缅怀乔布斯

同时用此文参加imeigu的征文,首先发在imeigu: http://my.imeigu.com/5579705651/20416146

另外,arthur369 也写了 Apple产品的美学特征 ──缅怀乔布斯
---------------------------------------------

关于苹果几乎每天都在有人谈及,分析苹果的文章也四处都是,在这里我想写一些不一样的,这些在我看来更接近苹果精神的。这些精神我认为源自乔布斯,在前面的许多年中也只有他能守护,以他那种被八卦周刊们称做"人品差"(其实我很怀疑这只是因为他对记者和媒体太不友好,大家玩命黑他)的那种独裁、固执的方式守护。在苹果公司网站上缅怀乔布斯的文字中,最后一句是"Steve留下了一家唯有他才能创建的企业",正是如此。

苹果不是奢侈品,这一点经常被误传。当然苹果产品确实不便宜,但考虑其质量,往往是市场上能买到最划算的。苹果并不想做市场上最便宜的产品,价格战是最落后的方式,找到理念相合的用户群,并扩大之,这才是好的竞争方式。这个战略在今天看来非常成功,因为电子产品整体成本下降很多,生产成本也下降很多(感谢中国的世界工厂),而经济比90年代有大幅增长,这让现在的苹果产品看起来更容易接受了。在80年代苹果最糟糕的日子里面,这个策略不成功,x86架构的廉价计算机比精心设计的苹果实在便宜太多了,所以更受欢迎。对比当年,今天看来一台苹果笔记本和其他品牌的价格差距更容易被人们接受,而苹果产品细致美观让人们更接受这点价格差距。

不指望做最便宜的产品,才能做出来好的产品。因为一些努力都有对应的成本,尤其是硬件产品。但对应价格的产品质量必须要足够好。苹果产品关注细节,这些细节可能不会被用户非常直接感受到,但总体上会给人舒服的感觉。人的感官比我们所知道的更精细,一些我们并没有注意到的细节会改变最终感受。这种变态追求细节体现在所有地方,当你放大苹果软件和系统中的图标,通常会能感受到变态的细致。比如Mail程序图标上的邮戳,放大之后可以看到HELLO FROM CUPERTINO CA字样,这是来自苹果总部所在地的问候,放大Java设置的图标,你能看到咖啡杯图标中靠近边缘的气泡,正如我们在现实中的一杯真正的咖啡,放大Document Set图标,会看到那一摞书的书脊上都有书名。就算是在今天,苹果各种理念已经深入人心,在非苹果平台上也很难找到如此精细的产品。而人们平时并不太注意这些精细,只是觉得很舒服。这些成本花费是否有意义?我想答案是确定的,这就是乔布斯挑剔精神的体现。好的产品不应该让人能轻松列出各种好处,而是成为一个整体让人感觉很舒服。对于一个不那么特立独行和偏执的企业,降低成本始终是大事(想想现在的丰田汽车就明白了),能够不再乎成本一心追求产品质量,在这个时代已经是非常不容易。如果不是乔布斯这样偏执而天才的领导人,对于职业经理人来说,恐怕难以下定如此决心,更难获得董事会支持。

苹果产品并不完美,甚至有很多功能缺失。经常会有人对我说,你看苹果没有这个功能,没有那个功能。苹果的理念之一就是如果这个功能不能完美解决,那么就干脆砍掉,如果不能完美升级,那么干脆保持原状。这又是一个和传统观念相悖的做法,一般人们会认为"不完善比没有强",苹果彻底相反,不完善不如干脆没有。这种理念带来的好处是简化了复杂度,复杂度又和时间相关,按照这样的理念,控制功能需求,就可以在固定时间内提供完成度更好的产品。对于现代软件工程和硬件工程,最大的问题是复杂度难以控制,而难以控制的复杂度会导致产品研发周期变长,投入成本不可控,随后在量产过程,售后支持环节都带来更多不可预测的成本支出。做减法简直是必须的,但大家都知道做减法很难。从苹果的历史看来,乔布斯一直擅长做这件事,不仅在产品上,在企业管理上也一样。他回归苹果之后,在很短时间内砍掉大量非核心业务,让公司终于能顺利生存。随后集中精力在iPod,对于一个制造计算机和服务器的公司,专心去做一个MP3播放器,听起来很可笑,当时也有很多人甚至员工认为很可笑。这个MP3也没有什么伟大创新,只是更好用。最终这个产品成功了,随后才有今天的一切。

今天的苹果产品仍然这样,想想iPhone刚刚出世时,人们诟病什么?不能复制粘贴,单任务,不支持"流行的"Flash,不能换电池...,其实到今天还可以随便找出来iPhone一堆缺点。就算这些缺点存在,苹果的产品仍然变得流行,人们喜欢他们,而不太在意这些缺点,因为苹果提供了更重要的东西,大屏幕,多点触摸,传感器,一个真正的浏览器,方便的音乐播放和购买,优美坚固的外形...我们今天回头来看这些诟病,几乎都能揣测出来一些道理,单任务是因为硬件性能不够,无法保证流畅切换任务和并行运行(想想同时代的nokia多任务),不支持Flash是因为太消耗性能,不能换电池是因为增加可换电池仓增加成本和设计难度...能做这样的减法,不仅需要对用户和市场有足够了解,也需要对开发产品团队和供应链有足够了解。否则他怎么能知道什么可以减少,什么可以在未来版本中支持,什么永不妥协,什么必不可少?这些,乔布斯做到了。在功能、成本、时间中的妥协,寻找平衡,这是伟大的艺术。

我更愿意把乔布斯看作艺术家和精神领袖,他不是工程师也不是Geek。苹果从来不用复杂的名词描述产品,苹果的产品系列也很简单。你只需选择笔记本的尺寸,随后就只有高低两种配置,你无需了解手机的CPU,你只需选择存储大一点或小一点。在买苹果产品这件事上,用户只要知道自己想要什么就可以完成,而无需成为专家。在其他领域你可没这么幸运,无论是买计算机,买手机,买汽车买房子装修,在苹果之外的任何产品,你都先要把自己变成专家,然后才能选出来你需要的东西。简单就是美。简单的精神有体现在苹果的各处,无论是使用产品还是使用网站,获得支持还是培训,都很简单。甚至苹果的发布会,开发者会议,演讲者都使用简单的语言。有朋友笑称去参加苹果会议不用怕英语不好,他们用的单词都是初中生也能听懂的。除了少数Geek用户和专业用户,大多数人更愿意使用简单的东西。不仅在硬件上,软件也一样。在苹果系统中,不用考虑硬盘分区,只需按照用途放在对应目录即可,不用创建复杂的层叠目录用来存放文件,只需搜索即可。这种简单同样体现在苹果提供的网站服务上,iTunes Music Store发布于唱片工业和盗版战争最激烈的时代,那时候P2P下载音乐已经非常普及,多数人不太在意音质,他们会下载MP3然后刻成CD放在车上听(中国共享软件的前辈周奕在网上把MP3刻录CD软件卖给美国用户,赚了大钱)。iTunes Music Store提供了简单的界面,购买方式,简单的价格体系和使用规则,一上线就受到欢迎,前18小时卖掉了275,000 首,前5天卖掉1,000,000首,这个成绩证明了只要足够方便简单,用户愿意付钱购买音乐,几年之后他们更是干脆连DRM保护都去掉了(感谢EMI的大胆尝试),最终成就了今天最大的数字影音产品购买市场,这个辉煌延续到了今天的AppStore。在未来iCloud发布之后,你甚至可以把自己下载的MP3通过Match服务,交很少的钱,一次购买版权,这也足够简单吧?我相信多数人愿意花这笔钱。如何让产品变得简单,如何让一般人更容易理解,这是乔布斯擅长的。对比前几天的iPhone 4S发布会Tim Cook的演讲,是否觉得不如以往乔布斯演讲那么通俗易懂?Tim还没能和乔布斯一样驾驭内容,让演讲做沟通一般用户和产品的桥梁,他还需要更多时间。

乔布斯不是技术专家,也不是工程专家,但他有选择好的技术产品的能力。这也是一个卓越公司领导人必备的能力。在离开苹果,创建NeXT那段时期中,他奠定了今天苹果的技术基础。几个重要技术关头,他都选中了最好的产品,比如,操作系统上拥抱UNIX,这样才有之后转向Intel CPU的能力,也有了iOS使用ARM的能力,开发工具使用了Objective-C,当时的潮流是C++,今天在iOS和OS X开发上,我们亲自体验到了采用Objective-C而不是C++的好处,再比如选择在KHTML基础上创建webkit做为浏览器内核,今天移动设备上webkit已经成了浏览器的标准内核,android浏览器也同样基于此。更底层的还有放弃GCC投资LLVM编译器,这样给予开发者更多特性,帮助他们完成质量更高的应用。最重要的系统和开发工具是在距离今天非常遥远90年代初,在乔布斯离开苹果开办NeXT时做出的选择,实在不得不佩服他超越时代的技术判断力与直觉。

如果让我继续写下去,这篇文章还能写非常长。不过我决定就此结束。苹果的精神难以用语言阐述,需要用心体会。我的朋友 @soulhacker在twitter上"我对 Steve Jobs 最感恩之处在于他无可辩驳的证明了:特立独行、理想主义、完美主义、执着创新是可以成功的,并用他自己的三段人生经历教给我们如何与实用主义及商业社会良好的妥协",这是我在这几天见到对苹果精神和乔布斯本人最好的概括。

乔布斯的离去一定会对苹果造成影响,从艺术家乔布斯到供应链专家Tim,领导者角色的变化一定会影响到公司决策。但我相信这不会太坏,乔布斯的精神和气质通过他的产品,文档,技术影响着用户和开发者,对于苹果员工想必更是如此。特别是苹果那些和他一起工作了15年20年以上的核心员工,他们一定能将这些宝贵财富贯彻始终,并使之继续流传。苹果和乔布斯仍然有很多人们不知道的事情,那些想法和决策的产生,如何说服合作伙伴...这些恐怕只有在10月24日发布的乔布斯官方传记中才能得到答案了。

在苹果的世界中,创新远未到终点,苹果在之前很多年投资了很多技术公司,包括这次我们见到的siri,还有传说到未见产品的液体金属 Liquidmetal Technologies ,终有一天,这些技术会足够成熟可用,变成产品到达我们面前,那一刻,我们的生活会再次随之改变,如同苹果宣传资料上最喜欢写的那句"再一次,改变世界"。苹果的疆域扩展也未到终点,我们能看到的领域还有一贯有积累的教育市场,完成了准备工作的企业市场,还有面对客厅的Apple TV。未来还很广阔也足够令人激动,做为开发者或者创业者,我们对乔布斯最好的纪念是记住Be youself,做你喜欢的事,做和其他人不一样的事,改变这个不完美的世界。

June 26, 2011

microblogging和微博信息架构产品差距和影响

前一段时间仔细的把国内的微博产品都研究了一圈。所以我终于可以写这篇文章了。

这个话题说起来很复杂,我从信息架构开始说,后面涉及传播方式,社群,阅读负担和信息过滤,第三方和开放性几个方面。最后会使用我blog这几年的访问数据对新浪微博和twitter传播能力做一个简要分析。

以下除特指某一家的产品,我用国内微博代表国内除饭否之外所有其他微博,因为他们产品都很相似。

一 信息架构

twitter中所有信息是平等的,没有一些信息会比另外一些更加平等。这里没有所谓的评论,你可以选取喜欢的形式用RT的方式加上评论,如果不想被更多人看到,可以直接回复对方,如果只想转发,可以使用Retweet。在twitter的架构中,只有这种层级完全一样的信息。twitter不提供类似于国内"微博"的评论功能,因为一旦有评论,信息就不再平等。

而国内除饭否外,所有的微博都加上了评论。这是一个非常容易做出的抉择,因为总有人会说"没有评论不方便"。加上评论看上去很好,也并不难。不过问题也出现了。

评论让信息不再平等,发出的微博是主要的,其下所有的评论附属其上。一条微博一旦被删除,其下的评论也随之消失,这也充分体现了他们之间的从属关系。如果不特意展开去查看评论,一般情况下评论是不会被更多人看见的。甚至发出评论者的follower(墙内叫粉丝,关注者)都看不到。这样就严重降低了信息的利用效率。在twitter这种信息平等的系统中,我用RT形式发出的评论会被我的follower看到,也会进入公共timeline。这些评论会再次引起讨论或被RT。这些RT同样帮助传播了我所评论的信息。这样的信息传播速度和力度是在其他系统中没法实现的。

为了解决这个问题,国内的微博同样也有了转发功能。转发又分评论和不评论两种,无论哪一种转发,转发过的内容都成为转发者的一条微博,这种微博同样可以被再次转发和评论。于是问题又出现了,这些评论是附属于被转发过的微博,而不是原始的微博,于是这些评论也很难被最原始的作者看到,只能被转发者看到。

在转发的微博上的评论层级就更低了,不仅评论者的follower看不到,连本来应该看到的原始作者也看不到。

更糟糕的还在后面,发表评论的人,也没办法回溯自己发出过的评论。除非他记录下来所有发表过评论的地址 经推友提示,发现这个功能是有的,先点右侧我的评论,然后点上面发出的评论。在twitter的系统中,用户创造的任何信息都是属于用户的,都会出现在用户的Timeline中,这些都是用户的数字资产,不应该被轻易丢弃。而在国内微博的系统中,评论只是二等公民,这些信息一旦发出,和创造者就没什么关系了,创造者很难回溯,这些信息也会随着原微博作者的删除和消失。当然,在这些为了自己的利益可以随便修改用户帐号,删除用户信息甚至禁言的产品中,让用户创造的信息消失从来也不是什么必须考虑的问题。

可见,评论虽然创造了一些方便,但带来的麻烦也不少。不过国内的这些微博的产品定义也有不同,他们并没有想制造一个平等的信息生态,而是制造一种名人发言,普通人收听的信息系统,这比传统的报纸广播电视略有进步,距离twitter这种完全平等,高效快速的信息系统差距仍然很大。

鉴于其产品定位,名人会觉得更加满意,更有万人来朝的快感。而评论被传播的效率很低,也使名人在出丑的时候不那么容易被更多人知道,也算是一种保护机制。

从本质上说,国内的微博都是BBS的变种,甚至可以是新闻评论的变种。对比一下网易新闻的跟贴,除了没有人物姓名,似乎也没多大差距。

国内微博到现在为止没有给评论再加上评论,如果有这个功能,就可以在微博下面盖网易新闻评论的那种楼了,也更方便吵架。从KPI和用户活跃数上看应该会更加好看,所以很可以期望在未来的某一天会有人加上这个功能--按照他们的逻辑,这也能让用户更加方便,不是吗?

很多人号称新浪有评论,所以用户体验比twitter好。我觉得谈产品体验是一个专业的事,不是随便一个谁觉得什么好就是好的,用户体验这个词因为太容易理解,使得评论起来毫无难度,其实多数人对产品体验的评价都流于表面,非常肤浅。增加一个评论功能,这是多简单的事,无论twitter还是饭否,想加上这种功能都毫无难度,为什么他们不做?这背后自然是有道理的。【刚刚发现一个好玩的例子,列在文末的update1中】

注,国内微博可以使用"评论同时作为我的微博发布"方式,下面一节会提到转发+评论方式,但仍然有相当比例的信息单纯成为评论而损失掉。

二 信息传播

twitter的意义在于改变了信息传播的方式。在此之前,人们早有单中心传播方式(广播电视平媒),也有单中心带少量互动的传播方式(广播电视+短信互动),也有多中心群组传播方式(BBS,邮件组),这些传播方式共有的好处是声音可以被放大到极大,缺点是信息传播途径被垄断,普通人乃至名人都没法发出自己真正的声音。

twitter创造了一种完全独立的信息传播方式,无中心,双向,无群组,所有信息都在一个层级上迅速流动。这是一个巨大的放大器,尽管twitter也存在fo数量多少而导致部分名人有中心化的趋势,但总体来说,这还是目前让最平衡的传播方式。

国内微博和BBS类似,是多中心群组传播方式。

在twitter,只要你的信息引起了别人讨论,在讨论的同时就被传播了,传播的同时又可以被引发新的讨论,信息顺着无数条链路快速传播开,边传播边分裂出更多分支,这是一种如同核爆一样的链式传播。

在国内微博,如果所有人都采用转发+评论方式,一条微博发出之后的传播路线和twitter是类似的。但有了非转发的评论,一切都变得不同。假设有1/4的人采用评论,而不是转发的方式发表自己对原微博的看法(事实上远远高于这个比例),那么就有1/4本来可以引发链式传播的机会被彻底消灭。原本这些评论可能会引起更多评论,也可能引发其他特别事件,但是一旦进入国内微博的评论系统,他们就消失了,几乎没机会再进入传播流程。

国内微博这种系统更适合于名人,他们的粉丝数量足够多,以至于他们可以不在意这1/4的传播效率损耗,甚至1/2的传播损耗他们仍然可以无所谓。甚至他们可以干脆不去看评论,客观上降低了他们处理信息的压力。但对于普通人,这种系统是残酷的,结果就会导致普通人发出的信息没人回应,得不到传播。钱明奇在新浪微博呆了半年,他的信息并不是不重要,但传播开了吗?在这种系统里面,草根是无力的,普通人聚集多少人,也没办法让信息真正充分传播,必须要借助官方或者名人的力量才有可能。

这不还是BBS或者广播电台吗?只不过多给普通人一些幻觉,让他们觉得距离名人更近...其实,就算没有微博,名人的声音也能被充分放大,他们的话语权本来就比普通人大的多,而无论有没有微博,普通人仍然得不到传播机会。但在twitter这样的产品中,一切都不同了,普通人也会得到属于他们的传播机会,但这也正是名人不爽的,一方面他们一旦出错,就会被痛击,很难装下去,另外一方面他们仍然愿意垄断信息传播途径,并不愿意和普通人分享。

简单概括twitter,即,一切归于Timeline,这是整个系统中最重要,最基础的部分。无论是信息本身,还是传播方式,最终一切形成了每个人的Timeline,这些Timeline根据fo的关系不同千变万化,形成丰富而多样的生态环境。

三 社群关系

twitter的社群关系是建立在前面所说的,平等的信息架构和极快的链式传播基础上。在这种基础上建立起来的社会关系非常牢靠,信任度也更高。

因为信息架构平等,所以信息更容易被重视。因为传播极快,也就更容易找到欣赏的人。一切都归于Timeline,哪怕是随便对什么事情发表的评论也都很容易被查到,通过Timeline就更容易了解一个人的品味和趋向。

平等的信息也带来平等关系,无论是不是名人,只要在twitter和其他人产生互动,就会促进社群的形成,社群的形成也一样是链式的,人们可以根据很多碎片信息而决定互相fo,进一步交流。最终形成无数虚拟社群。

国内微博,信息被划分了层次,人也就随之划分了层次。评论微博的人很难和发微博的人产生更多互动,也不会有更多人看到这种互动,想了解一个人,只能在他Timeline中看到正经八百的转发和原创,没法追溯他对若干事情的看法。这样就很难建立信任。

这些基础影响的事情很多,几乎下面要说道的所有问题都是被这两个基础因素所影响。确实,什么样的土地,就会结出什么样的果实。一个社区的关系形成和产品是有关的,一些逻辑的权衡最后会决定用户行为,最终改变用户关系。twitter的用户关系并不是因为大部分中文用户不能访问,在当年twitter可以访问时,用户也是这样的关系,社群也是这样的氛围,从未改变过。对于一个SNS产品来说,最终形成牢靠关系才是最重要的,这是对用户最大的方便,其他能不能传图片,能不能发评论,与此相比都太细枝末节。为了完成最重要的目标,甚至必须舍弃一些用户体验才能达到,正所谓行大事者不拘小节。下面一节我会分析为什么web不能传图片是好的行为。

很多人讲,其实并不喜欢微博,也觉得浪费了很多时间,只是因为有用,或者推广和工作需要,不得不用。这也是一个有趣的现象,这种话我听到了太多太多次,以至于我怀疑是不是新浪微博就是一帮推销自己东西的人凑到了一起。每个人都想推销点东西给别人,借助别人力量完成自己的目标。

假设新浪微博是有用的,但twitter是有爱的。twitter是一个温暖真实的社区,大家都是靠着自己的兴趣生存。同样有人在这里完成各种交易,找到工作或合作伙伴,找到朋友,伴侣。一个有爱的社区同样会节约人们更多时间,集中于生活本身。

其实没什么东西是免费的。无论是利用社会媒体推广还是其他方式,都需要花费时间学习,也可能需要花钱。对于我所见的大部分企业,包括声称从微博获得很多好处的企业和个人,如果他们可以精心维护一个blog,写一些有意义的文章(而不是赤裸裸的产品推荐),同样时间会被传播开并获得商业机会。而且blog几乎永存,更容易被检索,微博如流水,24小时之后就都流过去了,blog始终存在,易于查看,一次写作后面很多年都起作用。如果能写出来真的好文章,时间越长,意义越大。

人们总希望去寻找省事的捷径,比如他们认为微博推广是一条捷径,事实上任何事情都没有捷径,捷径都是幻觉。

认为微博营销省钱的,他们忘记了花掉多少时间沉迷于此。时间不能用钱衡量,因为时间就是命。浪费生命省一些钱,值得吗?和评价产品好坏类似,这也是可衡量的KPI和不可衡量的潜在影响对比,人们不太愿意(或者没有足够能力)关注后者。

想获取知识的,如果你没耐心去看书或者开放课程,那么至少应该看一些认真写作的blog。我不认为140个字(或者被国内微博创新的+140字评论)能够给别人真正的意义,我相信我这篇blog有意义,但这不可能用140个字说完,为了让这个事情说清楚,有意义,能存在下去,我需要回到blog完成它,在此之前,我花费了几个月时间思考,研究,体验,最终又花费几个小时写,几个小时改。才能成为你看到的全文,随手发的140个字不可能有这种效果。

SNS的本质还是社会关系,有爱的关系比有用的关系好。

四 阅读负担和信息过滤

微博类产品因为信息刷新太快,所以造成了比以往RSS更严重的阅读压力,让人们阅读负担大大加重。也在其上花费掉更多时间,节约阅读负担问题非常重要。

twitter基础是140个字,其中可以加入链接,如果使用短链接能节约一些空间。但总体的140个字不会变。twtter没有评论,只能RT并评论,这样带来的好处是信息非常规整,一般一条信息高度不会超过100像素,在屏幕上一页内可以显示更多内容,更容易用浏览方式扫过,重复信息,图片等干扰小的多。

对比国内微博,因为有评论和转发的机制,导致一条140字的微博下面还要带一条原始微博,有的两者还都带图片。这样被反复转发之后Timeline会充满同样的内容,每一条还都占用了200像素以上的高度,这对Timeline破坏严重。阅读压力也就更大。

换言之,在单位时间能我能完成阅读的twitter信息数量远远大于国内微博,阅读数量足够多,才能fo更多人,处理(RT或评论)更多信息,和更多人交流,整个系统也因此更加活跃。

对比两张图,左边是twitter官网和两种常用客户端,右边是新浪微博。可以看到右边同样的高度只能容纳很少信息,新浪微博一条信息高度轻松突破200像素,转发如果带上图片能突破500像素。相对于twitter的100像素,新浪微博阅读效率低的太多了。换言之,微博控会比同样程度的twitter控,花费更多时间或获取更少信息,能进行转发或交流的数量也同样有这么大的差距。

对比以下两张图,很明显就可以看出在同样页面高度内,twitter可以比新浪微博多容纳多少信息。

twitter的web页面和主流客户端(点击放大):

新浪微博web页面(点击放大):


twitter严格保证了140个字,不会耍把网址当作一个字符这种小聪明,也不会让你附带一张照片不算字数。在twitter世界里,一切都是有价值的,写了链接放了照片或者视频,就只能少写几个字。这个原则来源于短信,既然人们用140个字的短信可以交流,那么140个字的tweet当然也可以,何况中文140个字已经比英文表现力强多了。

如果要发表你的评论,对方又写的太长,那么你只能人工缩减一下,要么简化你的看法,要么就光写你的看法只附带上对方ID。这些用法不是twitter设计出来的,是用户约定俗成的规则。这种自然形成的规则同样也降低信息过载机会,如果人工缩减内容,相当于人工减少垃圾信息,这是任何算法目前都无法做到的,这里碰巧通过人工完成了。当然缺点也一样存在,比如会导致删改原文,会导致意思被误解...但就算有这些缺点,我也仍然喜欢这种方法,加快信息流动速度的方法都是好方法,降低信息过载机会,就能节约人们处理信息时间,最终又加快信息流动速度。

在产品设计上,twitter一直贯彻这个原则。

twitter的手机客户端,可以很方便上传图片,但web版不可以,这是为什么呢?因为twitter不是照片分享站,大多数情况你的图片对别人意义不大,所以就不要上传干扰别人了,如果非要上传,可以随便上传到照片分享站,贴链接过来。而手机客户端分享照片需求很大,这些照片有实时性,具备分享意义。国内微博都提供了网站直接分享照片功能,结果就是大量无用信息(很多是商业推广)下面贴上一张和正文完全不相关的美女图和搞笑图,以期望获得更多转发。这种东西完全是破坏用户正常阅读,增加用户阅读负担。这本质是国内微博对富媒体滥用,导致富媒体信息更受欢迎,最终形成一个恶性循环,人们只关注带有强烈刺激富媒体的信息,更为简洁有效的文本信息受到的关注度被严重降低,以至于真正有意义的内容也得不到关注。再看前面的新浪微博,截图,看第一条中国企业家所发的内容和图片,他们之间有关系吗?毫无关系。就是这种毫无关系的图片在新浪微博满天飞,白白浪费人们的时间。

用户能在web分享照片看起来确实方便,其实背后对环境破坏有多大,是没法衡量的。不过职业经理人们只关心前者,无法考量的后者他们并不在乎。管这个叫做"功能友好"的人们,何等浅薄。

概括起来,无论是链接占一个字符还是可以附带图片字符不占字,本质上都是让富媒体内容变得和普通信息不平等,记得前面所说的微博和评论不平等吗?富媒体又加重了这种不平等。

我在twitter说出这个关于web为何不应该有照片分享功能的看法时,有人告诉我他问过王兴这个问题(饭否也同样不能在web分享照片),王兴也做了类似回答。

twitter的web版也同样权衡了用户使用方便性,每条信息右上角都有小图标标记信息属性,比如图片,视频,或者有对话线索。点击信息右侧即可展开,图片视频都可以直接看到,如果有对话线索,右侧则会一次展开相关所有tweet,这种基于线索展开的对话,比国内那种一条微博下面讨论意义大的多,既可以形成讨论,又不降低任何一条信息层级。

换言之,twitter的设计不强迫用户必须阅读富媒体内容,除非用户主动展开信息阅读。在信息严重过载的年代,这种设计非常有意义。如果文字内容有趣,我会愿意多看,但如果我不愿意看,也请不要占用我的页面空间浪费我的阅读时间。

五 一些原则和第三方软件

twitter产品形成过程很奇怪。这个产品功能改造来自用户和社群,而不是来自twitter公司。今天人们看到的twitter和几年前我刚刚开始用的时候完全不同。原因是twitter只创造了信息架构和API,之后就不再管了。

阴差阳错也好,运气也好,认为twitter公司能力差也好,人手不够,偷懒也好,他们确实只是设计好信息架构和API,没做更多的事,之后用户登场了。这就是开放平台的好处,用户可以按照自己想要的去完善。不同的人心目中有不同的完美产品,于是各种完全不同的客户端和第三方网站同时被不同的人使用,最终所有信息对聚集回twitter的信息架构中。这也是一个历史上从未出现过的事。在twitter之后,从信息架构和API开始的产品设计逐渐成为一种开发方法,影响深远。

说twitter刻意保持网站的简陋也不太对,不过twitter保持网站只能完成最基本的功能(可能只是偷懒),确实对生态圈完善有帮助。一方面简陋的网站清晰演示了核心功能和信息架构,一方面也确实留给了第三方开发者更多空间。缺点也确实让新人不容易入手。(这几年有不好的趋势,twitter对第三方开发者也逐渐收紧政策,希望以后不要变得更糟)

twitter大概有最丰富的第三方软件,除了官方软件优秀流畅(收购的tweetie团队,tweetie团队首先在移动设备上发明了"下拉更新"操作,现在已经成为触摸屏上刷新信息标准动作),还有s60上的神器gravity,信息过滤最方便的hootsuite,最华丽的tweetbot,简洁快速支持stream API的echofon。所以我一直说,twitter是一种协议,你可以在这个协议之上创造任何你喜欢的东西。国内所有微博都是一种产品,附着了太多商业目的,这两者不在一个层次上。

说到tweetbot,值得特别讲一下他们的故事。这个iPhone软件开发团队只有两个人,他们开始做tweetbot的时候,twitter还没有收购tweetie团队,也就是说没有官方软件。开发进行了半年,收购完成,twitter把过去收费的tweetie变成了免费官方软件。这对于tweetbot这种希望销售软件的团队打击很大。不过他们还是坚持又做了半年,完成了tweetbot。这个软件上了appstore立刻热卖,人们都很喜欢,因为其特点太鲜明了。除了功能全面,最重要的就是华丽,操作感,绘图,声音,无一不经过精心打磨,完美到极致。在官方客户端已经做到足够好的时代,仍然有这样一个收费软件出现,仍然受到用户欢迎,实在是一个奇迹。就算你觉得twitter不怎么样,也强烈推荐感受一下这个软件,绝对值得$1.99这个价格。这也是有爱和有用的区别,twitter产业链上虽然也有商业spam,但活跃了很多真正热爱他,全神贯注只关心做好产品的人,这些人制造了独一无二的产品和体验。

twitter是需要学习的。我完全不同意"好产品不需要学习"这种说法。事实上人类社会大部分有意义的东西都需要学习,不需要学习的除了维持基本生命的动物性就只有一些毫无意义的事。完全不需要学习的有什么?大概只有吃饭和睡觉,或者看肥皂剧发呆。就算是吃饭,如果要吃的好,也同样需要学习。其他可以带来更多意义的东西,无论是计算机本身,或者是各种工作技能,都需要学习和长时间的锻炼。如果不学,连使用计算机和用键盘打字都有难度。

花费一些时间理解这个世界的规则,理解人们的生活方式,找到适合你的客户端,twitter就无比强大。这其实和真实社会更相似,twitter是信息流动更快,更刺激,放大效应更明显的真实社会,这里也有名利场,但也有真实社会的可爱和温暖。就算是你很普通,但只要你的观点有价值,一样会被传播开,一样很多人fo你。国内微博就是名利场,如果你有个吓人的头衔,那么只需去机场书店买一本成功学,每天抄几句,一样会被人捧上天。

twitter基础是公平的,信息可以安全保存,你可以信任他。新浪微博我们不谈敏感信息,涉及他本身的不敏感信息也一样被删,上次谷奥指责新浪抄袭,结果不是被禁言了吗?没有公平信念,就不会有真正好的SNS产品。

如果有可能,我觉得所有人都应该试试twitter,体验一下这样一个前所未有的产品是什么样,感受一下这个人不多但传播能力惊人的社区。如果有困难,可以去试试国内twitter最正宗的继承者饭否。王兴山寨了很多东西,他的可贵之处是同时山寨回来了开放和气度。饭否至今不加评论功能,难能可贵。所以饭否用户和twitter用户具有很多同样的特征,他们同样有爱,也有同样的效率。被关站一年的饭否,归来之后仍然获得了当年忠诚的那批用户,这些用户在饭否活跃度极高(如前所述,也和饭否产品设计简洁有关)。

微博的战争其实刚刚开始,目前的新浪微博只是恰好符合新浪的传媒特征,也和之前的名人博客有联系。这些名人本来就有话语权,让人们感觉新浪微博非常火。其实距离战争结束相差很远。无论是腾讯网易和搜狐,最糟糕的策略就是跟随新浪,不幸的是目前这三家都采用了这个策略。真心希望各家以自己的特点为基础,做出来有特色的东西,真正让micro blogging成为协议。就我的体验看来,无论用户质量,活跃度还是产品,饭否仍然很棒,希望饭否能继续改善产品,早日赶上。

六 附:数据分析

我从2003年开始写blog,目前手里有的访问记录是从05年记录的。中间我写过3篇文章引起了比较大的反应,在我blog上都创造了数万的访问量。利用这些数据,我设计一个简要粗糙的统计模型,用来衡量twitter和新浪微博传播能力的差距。twitter特殊在于常年被封,又有大量不同第三方工具,所以用户来源非常多样,并不是都来自twitter.com,要统计非常难。这也就是这个统计模型存在的意义。因为数据获取困难,所以这个统计模型有大量估算和抽样,未必准确。也欢迎提供数据或者挑毛病。这是一个有趣的话题,也值得研究。

数据来源:我的blog,twitter

数据收集:
A Google百度和谷歌的那些事 发于 2010-01-14
2010.1.14-2010.1.17 3天 59,355 Visits 83,586 Pageviews
1. (direct) / (none) 21,278 35.85%
2. t.sina.com.cn / referral 7,349 12.71%
3. 9.douban.com / referral 6,234 10.78%
4. douban.com / referral 2,604 4.50%
5. twitter.com / referral 1,888 3.26%

B 写给和百度作战的文艺工作者们 发于2011-03-26
2011.3.25-2011.3.28 56,365 Visits 82,489 Pageviews

1. t.sina.com.cn / referral 19,170 34.67%
2. (direct) / (none) 16,885 30.54%
3. douban.com / referral 3,286 5.94%
8. twitter.com / referral 792 1.43%
10. 9.douban.com / referral 723 1.31%

C 新浪微博你让我浑身发冷 发于2011-06-09
2011.6.9-2011.6.11 30,511 Visits 39,779 Pageviews
1. (direct) / (none) 11,993 39.31%
2. weibo.com / referral 4,444 14.57%
3. douban.com / referral 1,746 5.72%
4. t.qq.com / referral 1,576 5.17%
5. fanfou.com / referral 1,547 5.07%
6. twitter.com / referral 1,073 3.52%
10. 9.douban.com / referral 490 1.61%

以上数据均为发表文章当天开始,3天数据,只选重要数据,不包括和本次讨论无关数据(比如搜索引擎来源)。
这三篇文章特点鲜明,除了都在互联网上引起较大流行之外,其和新浪关系正好为:A 中立,B 有利(被盗版的作者们都聚集在新浪微博,是维权主阵地),C 有害(直接指责新浪和微博)
B篇因为被大量名人转发,所以可以理解为享受等同名人待遇。其他2篇为草根待遇。

直接计算新浪微博和twitter带来的流量比分别为:
A 3.89 倍
B 24.2 倍
C 4.14 倍

twitter因为被封,现在剩余中文用户不过5~10万,新浪微博声势正旺,在Q1财报中提到的用户量是1.4亿。twitter取高值10万用户,计算 140000000/100000=1400倍。而事实上就算享受了名人待遇的B,也只有24.2倍。按照这个数字计算,新浪微博以高于twitter用户量1400倍的巨大数字,只多带来了24.2倍访问量,如此计算,新浪微博信息传播能力实际只有twitter的1/57.3,小的吓人。如果用文章A/C的非名人待遇计算,则只有1/359或1/338。非常符合前文分析,新浪微博因为滥用富媒体和评论,导致人们处理信息难度更大,传播能力大大下降。换言之,新浪微博只是稍微丰富一点的单向媒体,顶多算web 1.5,距离twitter真正的web 2.0时代相差很远。

刚才说了,twitter因为常年被封,所以能看出来源为twitter的只是从twitter.com来的流量,只占中文twitter用户中极少部分。不过就只对比这极少部分,结果仍然令人惊讶。为了让数字更加真实,我试图寻找一个统计模型,给twitter计算一个系数,让twitter数字更加真实。这里应该注意到3篇文章的direct访问量很大,事实上作为个人blog,直接访问量应该很小,大部分用户来自订阅搜索和SNS,换言之,用户很少有把我blog放入收藏夹定期访问的习惯。因此我判断目前direct访问中有相当比例是来自无法追踪来源的twitter用户。


于是我又统计了在这3篇文章发表之后1个月内的direct访问量,作为平时数据用于比较,分别是:

2010.2.1-2010.2.28 28天 对应文章A
1. (direct) / (none) 2,939 31.49% 104/天

2011.4.1-2011.4.30 30天 对应文章B
1. (direct) / (none) 5,692 29.92% 189/天

2010.5.1-2010.5.30 30天 对应文章C
1. (direct) / (none) 6,044 38.78% 201/天

用A/B/C三篇文章数据对应这些数据计算,(发文3天直接访问量/3-发文后一个月平均每天访问量)/(发文3天twitter带来流量/3) 这个计算方法是试图找出我blog正常直接访问量和有可能的无法追踪的twitter访问量关系,计算结果为:

A (21278/3-201)/(1888/3)=10.9倍

B (16885/3-189)/(792/3)=20.60倍

C (11993/3-201)/(1073/3)=10.61倍

平均14倍,也就是说,应该把能记录的twitter访问量*14,是更加真实的twitter访问量。其中B的20倍相差过大,干脆忽略不算。那么也有10倍差距。

为了交叉验证,我又选取了另外一组数据,这组数据是通过twitter中观察使用twitter的web页面发推人数获得的,如下:

我的timeline 2/10
我的timeline 1/10
搜索"@hecaitou" 0/10
搜索"我" 3/10
搜索"吃饭" 0/10
搜索"赞" 2/10

按照这个抽样计算,使用twitter web用户只占全部用户13%。也就是说不可追踪用户有7.5倍左右。和之前计算出的10倍比较接近。

如果把A/B/C三篇文章中twitter带来流量都*10,会发现结果和新浪微博已经非常接近。也就是说,新浪以1.4亿用户之巨,和twitter的10万用户传播能力差不多。

仔细观察这些数据还会发现有趣的事,我发现:


  • 豆瓣传播能力惊人,已经和新浪差距不大

  • 饭否重开之后逐渐追了上来

  • 腾讯微博用户量也在快速上升

综合这些数字,我认为可以支持我前文所提出的结论,新浪因为过度使用富媒体,用评论破坏了信息架构,导致人们信息处理能力大大下降,试图利用新浪微博做营销的人占相当比例,充数的僵尸占相当比例,综合这些因素,导致新浪微博只是看起来热闹。实际上传播能力并不强。饭否是twitter精神在国内的传递者,虽然关站一年,错过了微博产品的快速发展时期,但其和twitter一致的信息架构和第三方,也形成了类似的社区气氛,在C文章数据中,已经可以看到饭否和新浪微博差距只有3倍,相信会有机会追上来。

根据这些数字,号称在新浪微博对工作有用,有营销效果,很可能只是自欺欺人。同样的时间如果花在其他平台,效果也差距不会大。这个结论对名人可能有所不同,但对普通人我认为是准确的。所以如果你不是名人,到现在在新浪微博仍然没有几万粉丝,那么这种营销对你毫无意义,你的存在是帮别人营销的,并不是营销自己。

所以综合以上,最终我的结论是:

1 国内微博产品设计导致了信息流动速度不够快(这说不上好或者不好,或者这就是他们追求的)。
2 twitter和饭否是高速信息流动系统。
3 豆瓣,腾讯微博,饭否,都不可小看。
4 twitter和饭否一对杯具,一个被封多年,一个被关站一年,都错过了最佳发展时期,但其产品设计仍然保证了用户忠实,社区氛围好,传播能力极强。
5 微博营销是自欺欺人,这才是庞氏骗局。所谓有效的要么是偶然,要么是特殊名人的特殊时期,要么是不会算数,不会衡量效果。在新浪微博,除了李开复和姚晨那种一线名人,其他名人其实也很可怜,一样没什么人关注。
6 国内微博不是SNS,只是有一点社会化味道的媒体,最多只能算web 1.5
7 这场战争刚开始,距离结束还远着呢。
8 大多数人眼光短浅,认为"产品"好坏只是让他用起来是否舒服。其实让你不舒服的产品可能会有更好的效果,只是你不能理解罢了。
9 推荐阅读: 为什么我永远不会雇佣一个"社交媒体专家"
10 twitter是microblogging这个概念的创始者,也贯彻最为彻底。饭否是twitter精神在中国的继承者。新浪微博做成了140个字的BBS。腾讯是QZone和IM的延伸,网易完全没弄明白自己在干嘛,搜狐不小心做成了tumblr,还不如直接改名叫轻博算了。


注:我写这个blog时,和菜头 @hecaitou 也在twitter发表一些看法,我们很多地方看法类似。这篇blog是我个人独立研究完成,与和菜头的结论,是同时彼此独立研究的结果。不过我也盼望他能写一篇blog,做为经历了两个微博产品的人,他应该有更多有价值看法和数据。


update 1: 后来想起来,如果所谓"让用户舒服就是好的",那么当用户140个字写不下的时候,用户也是不舒服的,为什么不干脆放宽字数限制,让用户随便写?别笑,用户真的有这需求,还有个叫长微博 http://weibobobo.com/k/ 的东西,用来把正篇文章抓成图片贴到微博上。

June 9, 2011

新浪微博你让我浑身发冷

------
本文特别声明,本文和其中使用的图片均可任意转载和使用。感谢传播。
------

新浪做为中国最早的在美上市互联网公司,一直在诚信方面有不错的口碑,美誉度较高。很多事情人们甚至会替他们辩解,在中国开个公司不容易,要多往好处看。所以今天发现这个公司可以无耻到这么彻底的时候,确实让人发冷。

事情的起因很简单,google的新闻站谷奥发现一篇译文被新浪科技抄袭,这里说抄袭是有证据的,因为就连谷奥翻译错了的地方,新浪科技也照单全收一字不差还原错误翻译。这是一个基本的常识,大家都写对了那是正常的,如果错都能错成一样,那显然是有问题。 谷奥列出新浪抄袭证据的原文在此 ,有兴趣可以仔细看。

这事情只是个开头。后面的才精彩。一般来说这种事情行内多了去,大家抄来抄去,被揪住一次也就嬉皮笑脸道个歉,被抄一方也不会在追究,也就过去了。奇怪的是新浪这次用了一个奇怪的方法,把这个事情弄的越来越大。

首先是新浪科技的编辑骂谷奥傻逼(这在后面新浪科技发的官方声明中变成了"新浪科技编辑骂了两个字母进行回应"),然后总编辑陈彤在微博痛骂谷奥,引起大量用户评论数百条,这些评论先被删至剩30条,随后又恢复,转天这条微博也被删。不过这里有截图

转天谷奥创始人到新浪沟通抄袭事件,新浪仍然拒不承认抄袭。至于"错都错的一样"这种铁证,新浪装作没看到。之后的事情更加戏剧。

新浪科技发了一篇新闻,表示自己绝无抄袭。这篇新闻的留言中凡是对新浪不利的言论一律不显示,只有几条夸新浪的留言显示出来。之后干脆关闭了评论。这篇新闻的结尾是:"新浪科技频道重申:感谢社会各界一直以来的大力支持,欢迎大家继续对新浪科技的工作批评、指正。",这虚伪的像个笑话,人家批评你们骂人家,新闻评论都不敢开放,还好意思说欢迎批评。

很快,新浪微博小秘书威胁谷奥官方帐号不要造谣,最终结果是谷奥官方帐号变成了号称先审后发,其实不能发表状态,之前发布的和此事相关的微博均被删除或隐藏。谷奥是加V认证的帐号。

事件简要回顾完毕。

这个事件的谷奥一方,是一个只有2个人的个人网站,另外一方是市值近70亿美元的上市公司。这样的实力对比下,新浪从高管到员工,倾全力打压一个个人网站。原因只不过是谷奥对被新浪抄袭事件要个说法。这种底气的来源大概就是微博的发展,新浪已经可以认为,我打压你,你无法还手。

以往人们在媒体无法表达的事情,可以在自媒体和sns表达,如果新浪垄断了微博,将来只要你和新浪有冲突,或者你的东西被新浪看上认为可以盈利,你在自媒体也就出不了声了。新浪产品线复杂人也多,谁都有可能不留神和他们发生冲突。

之前作家和百度的维权事件,新浪微博是主战场之一,但新浪爱问同样盗版他们的小说。如果作家们质疑一下爱问,恐怕结果也是被封杀。诸如此类的事情,以前有不少,以后会发生的更多。比如一家基于新浪做SNS游戏的公司,新浪自己想抢你的业务,你会没法还手,没法出声。所有在新浪微博培养的关系,粉丝,声誉,都不是你的资源,而是新浪的。只不过是对方看你还不算讨厌,暂时让你存在而已。一旦和新浪有冲突,这些都没了。现在看好新浪,爱微博的人,如果有一天发现自己的利益被新浪所占,又无处申诉,感觉会怎么样?这种事情之前也发生过,恐怕除了当事人,别人都没注意,比如新浪微博曾经强制收回大量特殊微博账号 ,这些叫做微招聘,微公益的帐号,起初都是因为用户对这个平台的热爱而自己注册和维护的,做大之后被强制收回。关于这个事情,可以看微公益帐号创造者所写的事情经过:新浪"微博强拆",拆走的都是用户的心 。这是发生在今年3,4月份的事。

在这个事情之后,所谓的新浪微博开放,做为开发者的我是不会再相信了。新浪科技和谷奥只是义气之争尚且如此,利益之争会如何?一个平台,丧失了中立理性和宽容,不能面对自己的错误,无法改正,乱用资源和强权,一定不会成功。毕竟互联网还是一个存在充分竞争的行业。

如果新浪微博真的垄断了这个行业,未来他的业务线一定会和你发生竞争。微博和以往的SNS不同,是工具也是媒体。一般来说人们碰到不公可以寻求媒体救济,但在新浪这,你没机会。在媒体和舆论上会成一边倒的状态。看这次新浪科技的声明,内容完全不真实,但被攻击的一方只是个人网站,没办法找到一个话语权对等的平台回应。无论你是什么样的名人,都没机会。目前在新浪平台受益的人,都应该好好思考一下如果这样发展下去,你的未来是什么。投资人们,如果你的项目被新浪先看中,如果你们的项目被新浪山寨,做营销的,如果新浪想自己赚营销这笔钱,做自己的营销平台,创业者,你做的产品被腾讯山寨的时候你可以骂,将来被新浪山寨了,你怎么办?...在新浪微博平台上,你们拥有的资产,都在新浪老大哥的垄断之下,剩下的无非就是什么时候杀你这只肥猪而已。最后你最多像已经没法发言的@谷奥现在做的那样,把自己的文章链接写在bio中,新浪真是欺人太甚。

这样的未来,让我浑身发冷。中国之前任何一家互联网公司,无论是百度还是腾讯,都没能把事情做到这么绝,就算是腾讯,也不会因为用户在QQ中交流对腾讯的不满而封掉用户的发言权利。我始终认为,microblog应该是一种协议而不是一种工具。这种工具应该打通几家,而不是被一家拥有。就像邮箱一样,协议和产品需要分开,你可以用新浪邮箱我用gmail他用网易邮箱,我们互相能收到对方的消息,而不能是必须大家都去用一家的邮箱。我觉得如果实在不行,搜狐网易饭否联合吧,打通你们的API,让用户流动起来,别坐等被人各个击破。

为了不让这个一家垄断的未来成真,现在能做的就是力图让几家竞争者平衡,至少应该留下足够强的竞争力量,所以我呼吁停止使用新浪微博,转向腾讯,饭否,网易,搜狐。这个行为看起来有点赌气,可是想到未来,这是为将来的自己留后路。就算你不想那么多,现在开始给自己在其他几家的平台上培养一些资产,留作备份,也是应该的。也就是说,无论你是否停用新浪微博,如果你觉得这个自媒体平台有意义,那就应该立刻把几家全开了,一起用,这样你才能安全,至少将来还有渠道说自己要说的话。

在现实世界我们已经充分体会到了一家独大没有竞争的后果,幸好在虚拟世界,现在你还有机会亲手改变。


====================================

下面这两个badge是我的选择:


我把他们放在blog侧面,就算为多样化的未来出点力。你的选择?

这里还有更多图样可以选,挑个你喜欢的吧。
ps,为了实践我的建议,除了twitter,本人恢复更新网易微博 @virushuo 饭否 @virushuo 我还会开国内其他几家的。每天均花一些时间真人更新,同时无限期停止更新新浪,并求新浪删我帐号。大家墙内见。

May 23, 2011

关于bitcoin若干问题我的看法

最近关于bitcoin突然在中文圈子火了起来,似乎是引爆点到了。半年前我也下载过,但是没弄明白怎么用,说回头看看wiki,放在一边就给忘了。现在想来悔不当初,当时如果下手估计也能弄到几百个吧...

这个项目非常有趣,或者说非常酷,而且前所未有。我对bitcoin的态度是强烈支持,并且希望它成功。我愿意接受bitcoin付款购买我的软件什么的。云风的文章是目前对bitcoin原理说的最清楚的,不过四处还有不少疑问,我把常见疑问汇总起来,按照我的理解做个回答,算补疑。本人计算机还行,数学一般,经济学不懂,所以也有可能有错,大家可以继续拍砖。

1 信用从哪保证

人们最常考虑信用问题,比如说,现在货币是政府担保,bitcoin谁来担保?在有纸币之前,人们只是在自然界寻找那些"不容易获得"的资源做为等价物,比如贝壳。后来才使用贵金属。再后来纸币和贵金属挂钩,最后脱钩,最后这几步就是最近几十年的事。

现在大家以为纸币是有信用担保的,某种意义上说没错,各国央行提供了这种担保。但另一个角度看来,这种信用担保完全靠不住。现在的通货膨胀和紧缩,经济好或者不好,都和央行如何发行货币相关,或者更确切的说,和美联储有关。谁来担保他们不去乱发货币?

人们对纸币的贬值表示担心,会买入大量的贵金属以期望"保值",说明人们也并不信任目前的货币体系。换到bitcoin这,机器和算法保证了bitcoin无法被任意超发,如果要更改算法,就要p2p网络上的大部分节点都换成新的算法,否则就毫无意义,换言之,bitcoin的信用是靠使用bitcoin的人本身来保证的。从这个意义上说,bitcoin比央行信用的靠得住。

你永远也不知道各国央行背后干了什么,即将干什么,但是你能明确的看到bitcoin的代码,知道算法和一切细节。哪个更有信用?

2 bitcoin是否能和经济总量匹配,不匹配是否能造成通胀

bitcoin的货币单位BTC,按照目前的算法,最多可产生2100万个(可能需要100年...),这和目前的世界经济总量确实不匹配。但是我认为把BTC和经济总量对比并无意义,目前的经济总量是用纸币(比如美元)衡量的,这种衡量方法本来就不是真正的"经济总量",或者说经济总量这个词对于bitcoin体系来说毫无意义。

其实应该把这个问题换一下,就是BTC是否够用。这个问题也不用担心。目前BTC显示的是小数点后2位,其实内部存储了小数点后8位。也就是2100万*10^8,这个数字已经大的吓人了。这背后的意思是说,BTC可以看作无限可分的,如果存量稀少,人们就会采用更小的单位,比如0.00001BTC能买到一瓶可乐,如果存量过多,人们会采用更大的单位,比如10BTC能买一瓶可乐。

其实黄金也可以这么用,只不过黄金并不是真正的无限可分,不好携带也不好转移,事实上没办法真的这样使用。

因为没有滥发货币的央行,所以也就没有快速恶性的通胀了。BTC的产生速度稳定,人们就可以在较长时间内使用一种合理的单位来给商品和服务定价,这种价格是相对稳定的。

3 bitcoin是否容易损失或者被盗?

这个问题在 https://en.bitcoin.it/wiki/Securing_your_wallet 中有详细说明

概括一下,其实你只需要保证自己的wallet.dat文件存在,你的钱就不会损失。因为bitcoin系统中,你拥有的货币数量是根据交易单计算出来的,而交易单存在在整个p2p网络中。就算你的计算机坏了,只要你保存了wallet.dat,就能够重新取得交易单,你的钱也就并不会少。

至于被盗,如果你的wallet.dat被别人拿走了,那确实会被盗。这个文件事实上是私钥。所以应该保护好这个文件。刚才哪个链接中提供了各系统中安全保管此文件的办法。保证一个文件安全的方式有很多,也可以考虑干脆使用truecrypt加密,这个足够安全了。

加密之后的文件可以存到邮箱或者其他云存储系统中,也就不担心损坏了。你还可以建立多个wallet.dat,每个里面存一点钱,分别存放在不同的地方,这样就算丢失一个损失也不大。

现实中一样有丢钱包,信用卡被盗刷,网银被盗等等问题会导致财产损失。bitcoin反而现实安全很多,现实中你几乎没办法去增强自己网银的安全级别,但bitcoin的wallet倒是有很多办法。


4 bitcoin的发行是胡乱发的吗?

很多人说美联储虽然增加货币供应,但并不是满大街随便找个幸运的家伙就塞一笔钱,而是去发行国债或者变成银行贷款。但bitcoin是在计算的过程中碰上的,好像是随便发的。

这里存在一个误解,Bitcoin的mining过程并不是在空做计算寻找随机数,而是在做交易单处理,这种处理保证了整个体系的正常运转,这就是mining的人正在做的事情,他们耗费运算资源来保证交易正常进行,并且有一定机会获得回报。这也是劳动获得的回报,就像最早挖金矿的人,他们获得金子并不是凭空获得的,也是付出劳动之后的回报。

5 bitcoin体系安全性如果出了问题怎么办?

bitcoin依赖公私钥存在,对于足够大的公私钥体系,目前还没有破解或破坏的办法,要伪造的唯一办法就是去穷举,这在时间和计算资源上都非常不划算。(比如说,100年时间伪造出来一对公私钥?)

假如公私钥体系真的在数学上被找到了漏洞,可以大量伪造,那时候倒霉的可不光是bitcoin,整个社会都要崩溃。目前人类社会太多的地方依赖这种加密体系了,包括银行。所以说,bitcoin在安全性上仍然超过(至少不低于)目前的银行系统。

6 人们为什么会接受bitcoin?

人们接受bitcoin只是因为他们喜欢。比如我就喜欢,所以我愿意接受。一种等价物,只在于愿意承认他的人有多少。就算是货币,比如说美元,是世界通用的货币,但是你在中国,到楼下的便利店中用美元现金买一瓶饮料,能成功吗?同理,人民币目前有巨大的升值期望,但你拿人民币现金到美国超市购物,能成功吗?所以说任何等价物,包括货币,都是在有限范围内被认可的。目前在geek/hacker中,BTC正在逐渐被认可,这是一个好的趋势。

bitcoin论坛上有各种BTC为基础的生意,看起来还不错。以后应该会越来越多的人愿意使用BTC。

ps: 我昨天晚上在论坛上做了个小生意,赚了1BTC。为这个生意劳动耗时大约20分钟。如果用我的MBP挖到1BTC,大约需要5天。所以说,让系统尽快正常流通起来,大家就都有钱用了。

7 bitcoin为什么不可追踪

bitcoin的收款地址是可以随便创建的,wallet也可以随便创建。而且bitcoin软件本身就会在你每次收款之后生成一个新的address,下次你就应该使用新的(旧的当然也可以用)这就让追踪钱的转移变的非常困难(虽然一切都公布在p2p网络中),对应到具体的人更是困难,至少比现有金融系统困难的多的多。


8 bitcoin要耗费大量运算资源,是不是太不低碳了?

你知道现在为了维持货币存在,人类需要浪费多少资源吗?虽然bitcoin耗费能源,可总没有那些机构耗费的多...


我发了条推说:"或者说可以把BTC当作一个大游戏,其实wow金币也有一定虚拟货币的特征,但没有担保方法,没法控制滥发货币,也没法保证一直存在,blz一脑抽把业务停了,所有的金币都没了。bitcoin不会出现这种情况。"

@soulhacker 回答:"WoW 金币一度是很硬的通货(和人民币有相当稳定的汇率),但是后来玩家找到了增发的手段于是通胀贬值,而且随着 WoW 的越来越休闲和快餐化增发和通胀不断加速..."


最后,很多问题的提出,根本上都是不理解bitcoin的运作方法,还是推荐好好读云风这篇Bitcoin 的基本原理


update: 留言中有价值补充的我贴在这里,谢谢各位

两个反馈:
第一个是基于第4点,你说的其实没错,但是容易让一知半解的人误解,认为他个人付出的计算量就是劳动了,而每个劳动必须要获得回报。其实不尽然,其实那新产出的部分应该是对当时P2P网络上所有计算结点的犒劳,并不等价最终获得奖励的那个人付出的。其实最终是谁获得还真就是人为目的地尽可能随机分散分布,来保证BITCOIN的整个体系。而体系认为就算把这个时段集体的劳动结果撞大运似地分给某个个人,最终也会进入流通而造福所有的使用者。只是一点补充,怕其他人误解

第二点是关于WOW的那段补充,WOW金币的贬值倒真不是玩家发现了很强大的增发手段,当然的确有,但是那个对兑换价值的影响没有那么巨大,并且缓慢。真正成倍数贬值的还是BLZ自己的版本升级,调整了任务和掉落的金币产出,所以从数字上来说产生了金币的贬值。这点上还是印证了央行的不靠谱。 但就算是这种情况下,受概率影响的极品装备只要概率不调整,在一定的时期内价值还是稳定的,虽然你需要用更多的WOW金币去购买,但你购买更多金币所需的实体货币RMB数量没有太大变化,改变的只有汇率,但是真实的购买力没有变化

Posted by: Gossipsama | May 23, 2011 4:30 PM

原本还想写一篇关于 BTC 的私密性的 blog 的 :) 不过突然这个这么热,又不想赶热点了。

BTC 的 wiki 上关于 Anonymity 的页很有意思,居然拿 live in China 做假设。而且提到了 baidu ;)

MyBitcoin 是个有趣的服务,可以用来解决许多私密性的问题。

Posted by: Cloud | May 23, 2011 4:31 PM


抓虾
订阅到有道阅读

Subscribe in NewsGator Online
Add to Google
Subscribe in Bloglines
CC License. Some rights reserved.
署名·非商业用途·保持一致
本站之所有未作特别说明的内容均使用 创作共用协议.
POWERED_BY_MT_3.2