December 25, 2011

密码泄漏和黑天鹅事件

从天涯的密码被公布之后,我觉得这事情闹的有点大了,周围很多人恐慌,所以我就勉强写一篇说说我的看法吧...
==========================================

世界上没有什么东西是安全的,除非其毫无价值。所以最近发生的CSDN/7k7k/天涯等等密码库明文泄漏的事情完全在情理之中,甚至我相信还有更多的库还没进入大众视野。很多人可能是第一次遭遇这种事件,心理上承受的打击比较大,大概感觉应该像是被扒光了衣服丢在人堆里。其实这种事情发生的太多了,比如半年之前SONY用户数据库被泄漏,那个包含的信息更多,甚至连家庭地址都有,而且数量也大的多,据估计有7700万玩家数据。相比起来中国网站目前泄漏的这点密码实在不算什么。我相信好玩的还在后面。

在密码方面,我的个人经验是这样的:

1. 多数网站我不信任,所以都使用简单密码。为了增加一点乐趣,我还通常会用一些带有嘲笑意味或侮辱意味的词汇缩写做密码,既然知道肯定会被人看到,那还不如调戏一下看我密码的人。结果没想到这次泄漏出来之后调戏的人有点多。我相信这种共识在程序员群体中普及很广,CSDN泄漏的密码中极大比例是简单密码,并不能说明程序员没什么安全意识,而很可能是他们太有安全意识了,根本不指望网站能保密,反正也不重要,干脆用最简单的,省下来脑子去记重要的。在CSDN密码泄漏的当天,我问一个朋友,xxxx@xxx.com是你的帐号吗?他回答如果密码是12345678就是,否则就不是。他就是这样的心态。

2. 不要给任何网站用一样的密码,除非你确认他们全无价值,以至于被别人登陆了也没什么大不了的。

3. 对于最重要的服务,光靠密码是不行的。密码只是权宜之计,甚至可以说非常脆弱,这也是在各种条件之下权衡出的一个勉强可用的解决方案。除了密码之外还有很多方法(虽然也各有弱点),比如密钥(startssl.com用的就是http密钥),或者硬件token(除了银行,google 2-step也是),这些都能降低被盗几率。基本所有服务都可以找回密码,所以一个足够安全的邮箱才是最重要的。目前只有gmail在各方面都符合我的要求,比如:登陆出错之后图片验证码足够复杂,有登陆日志,找回密码有时间限制,有硬件token等。所以,就选gmail吧,如果你真觉得安全重要,就别在乎偶尔访问困难。之前因为gmail偶尔访问困难而把企业邮箱迁移走的团队,你们实在缺乏远见。

4. 在没有https的网站登录,登陆中发送的密码很容易被窃听。所以登录非https网站,需要清醒理解,如果当前网络环境不安全,这个密码很容易泄漏,即使是在网站本身有严格加密的前提下也是一样。如果在不信任的网络下,就先拨一个私有VPN吧。(delphij据说就算在美国酒店上网都要先拨回自己家里路由器上的VPN,要学习这种折腾精神)

5. 足够重要的服务密码要给予相应的重视。密码难记是正常的,除了努力记,还可以用一些可靠的密码管理器(请先确认使用密码管理器的计算机是足够安全的)帮助存储,比如mac的Keychain Access。不过就算有这些,自己也应该有几个超过10位的数字字母符号混合的密码完全自己记住。记密码通常是靠连续多打几遍,让肌肉反射记住而不是脑子。Mac OS X的Keychain Access可以生成一类叫做memorable的密码,是比较适合记忆的,强度也算过得去。如果不能确认计算机是安全的,那么密码写纸上比用软件记录还安全点。

6. 为了保证计算机足够安全,我个人还有如下习惯(可能有点极端)。 a) 不使用任何第三方输入法,除非开源 b) 在mac上不用root权限运行任何非系统自带程序,除非开源 c) 如果非常用不能确定的程序,专门给它建一个虚拟机 d) 不用任何所谓安全软件,除非开源,这和c所说的其实是一个问题,这类软件权限过高了。e) 手机不越狱也不取得root权限,有多少好处也不。

个人经验介绍完毕,下面来讨论一下密码泄漏事件本身。

密码泄漏事件是典型的黑天鹅事件,这个说法来自一本叫做黑天鹅的书,大意是这类事件在发生前谁都不觉得会怎么样,但在某个时间点一定会出现并造成重大损失的事件。在今天这个时代,因为信息已经传递的足够快,所以黑天鹅事件会更加频繁的出现。这类事件,没什么避免的方法,除了清醒的知道自己在做什么之外,唯一能做的就是增强想象力,尽量多想一些可能性。从这个角度说,这次的密码泄漏事件其实是好事,如果没有这么大规模的密码泄漏,恐怕很多人根本不会想到竟然还有这样一种可能。

所谓清醒知道自己在做什么,就是在填写个人信息(包括但不限于密码)的时候你是否考虑过这些信息会被用于哪里,对方是否有能力保护其安全。前几天居委会跑来要登记个人信息,我要求对方出示这样做的法律依据和保密方法,对方拿不出来,我就客气的请对方走人了,对方居然也很配合的没多说什么。我相信很多情况都是如果你在乎一点,稍微追问一下,结果都会很令人满意。大部分企业是根本没有安全审计流程的。所以千万别太相信他们的保密承诺,就算他们真的想保密,是不是有这个能力也得打个问号。

所谓增强想象力,就是要多考虑一些可能性,比如在这次之前,如果你曾经想到过某个网站用户库在将来可能会被明文放在网上供人浏览,那么你就不会在不同网站用一样的密码。这时候也就不用慌乱一团四处修改密码。(在你慌乱一团修改密码时,如果你所在的网络环境不安全...后果只会更糟糕)

对于黑天鹅事件最好的办法就是增强想象力,多数人是缺乏想象力的。说到这里,我想再提起一下现在已经不那么热的Bitcoin。我对Bitcoin的态度一直是支持的。就算今天看起来不太火,我的态度仍然是支持。有些人嘲笑我这个立场,但到目前为止,Bitcoin体系仍然完备且运转正常,我不知道他们言之凿凿的说我在这个问题上"错了"是来自什么判断。我想这正"缺乏想象力"的具体表现。当确认一个东西没严重漏洞,确实可行之后,就不能轻易忽略它,更不能用以往经验轻易判断为不可能发生。而更应该想想"如果发生了"之后怎么办。再换个角度理解这件事,就算在Bitcoin这件事上我的判断错了,这并不会造成什么损失,对于我个人似乎就是损失了点电费,我毫无困难的可以承受这些损失,而万一将来真的有一天发生了某个极小概率的黑天鹅事件,Bitcoin就有可能成为主流应用。其实上一次Bitcoin突然很热的背后原因是Wiki Leak的捐款渠道被关闭,人们突然意识到需要一种不被限制的金融体系。Wiki Leak这件事本身就是黑天鹅事件。Bitcoin当然未必会成功,但现在断言其一定不成功的人,的确是太缺乏想象力了。今天我们所使用的互联网,也是黑天鹅事件。90年代我第一次用互联网时,其晦涩难用怎么也让人想象不到有生之年能够普及,但仅仅几年,对人们已经是和水电一样必不可少的东西了。

在《黑天鹅》这本书出现之前,没人体系化概括这种现象,但类似的看法倒是一直存在,比如地球同步卫星理论发明人兼科幻小说家AC克拉克有个说法,大意是:如果一个德高望重的科学家说某个事情"不可能"通常他是错的,如果他说"可能"那么通常他是对的。所以应该把"我们不知道"这种态度做为面对事情的常态,尽量多相信一些可能性。

在我看来,这次密码泄漏事件所引起的震动,与其说是安全问题,不如说是出乎多数人的意料造成的恐慌。这些密码库其实早就在各种渠道流传,只是多数人不知道罢了。甚至可以说如果要出事早就出了,根本不会等到现在。目前造成最大影响的是人们意想不到所以恐慌,而不是密码库泄漏本身。甚至在半年前Sony数据库泄漏事件都不会让与此无关的人多想一些"如果..."。目前首要任务甚至不是提高安全知识,而是提高想象力。我的确在很多年前就想到密码可能会明文被放出来,所以我用各种骂人和嘲笑的话组合做密码,用来调戏能看到密码的人,到今天这事情果然发生了。这就是想象力的意义。我想任何人只要之前想象过这种可能性,都会对自己的密码更加认真一点。

PS: 说起Bitcoin,我一直关心这问题本身,从这里面学习到的思考方式和架构知识足以让我值回实验投入了,比如http://www.slideshare.net/dakami/bitcoin-8776098 ,看看是不是很有趣? 作者Dan Kaminsky称的上是顶级安全专家了。这是不要轻易判断"不可能"的好处,跟踪一个看起来实现概率不大,但基础完备的事件,从中能学到很多有用的东西。


update: 看到了 delphij 这篇,顺路推荐 https://blog.delphij.net/2011/12/post-608.html

October 7, 2011

Think different & be yourself 缅怀乔布斯

同时用此文参加imeigu的征文,首先发在imeigu: http://my.imeigu.com/5579705651/20416146

另外,arthur369 也写了 Apple产品的美学特征 ──缅怀乔布斯
---------------------------------------------

关于苹果几乎每天都在有人谈及,分析苹果的文章也四处都是,在这里我想写一些不一样的,这些在我看来更接近苹果精神的。这些精神我认为源自乔布斯,在前面的许多年中也只有他能守护,以他那种被八卦周刊们称做"人品差"(其实我很怀疑这只是因为他对记者和媒体太不友好,大家玩命黑他)的那种独裁、固执的方式守护。在苹果公司网站上缅怀乔布斯的文字中,最后一句是"Steve留下了一家唯有他才能创建的企业",正是如此。

苹果不是奢侈品,这一点经常被误传。当然苹果产品确实不便宜,但考虑其质量,往往是市场上能买到最划算的。苹果并不想做市场上最便宜的产品,价格战是最落后的方式,找到理念相合的用户群,并扩大之,这才是好的竞争方式。这个战略在今天看来非常成功,因为电子产品整体成本下降很多,生产成本也下降很多(感谢中国的世界工厂),而经济比90年代有大幅增长,这让现在的苹果产品看起来更容易接受了。在80年代苹果最糟糕的日子里面,这个策略不成功,x86架构的廉价计算机比精心设计的苹果实在便宜太多了,所以更受欢迎。对比当年,今天看来一台苹果笔记本和其他品牌的价格差距更容易被人们接受,而苹果产品细致美观让人们更接受这点价格差距。

不指望做最便宜的产品,才能做出来好的产品。因为一些努力都有对应的成本,尤其是硬件产品。但对应价格的产品质量必须要足够好。苹果产品关注细节,这些细节可能不会被用户非常直接感受到,但总体上会给人舒服的感觉。人的感官比我们所知道的更精细,一些我们并没有注意到的细节会改变最终感受。这种变态追求细节体现在所有地方,当你放大苹果软件和系统中的图标,通常会能感受到变态的细致。比如Mail程序图标上的邮戳,放大之后可以看到HELLO FROM CUPERTINO CA字样,这是来自苹果总部所在地的问候,放大Java设置的图标,你能看到咖啡杯图标中靠近边缘的气泡,正如我们在现实中的一杯真正的咖啡,放大Document Set图标,会看到那一摞书的书脊上都有书名。就算是在今天,苹果各种理念已经深入人心,在非苹果平台上也很难找到如此精细的产品。而人们平时并不太注意这些精细,只是觉得很舒服。这些成本花费是否有意义?我想答案是确定的,这就是乔布斯挑剔精神的体现。好的产品不应该让人能轻松列出各种好处,而是成为一个整体让人感觉很舒服。对于一个不那么特立独行和偏执的企业,降低成本始终是大事(想想现在的丰田汽车就明白了),能够不再乎成本一心追求产品质量,在这个时代已经是非常不容易。如果不是乔布斯这样偏执而天才的领导人,对于职业经理人来说,恐怕难以下定如此决心,更难获得董事会支持。

苹果产品并不完美,甚至有很多功能缺失。经常会有人对我说,你看苹果没有这个功能,没有那个功能。苹果的理念之一就是如果这个功能不能完美解决,那么就干脆砍掉,如果不能完美升级,那么干脆保持原状。这又是一个和传统观念相悖的做法,一般人们会认为"不完善比没有强",苹果彻底相反,不完善不如干脆没有。这种理念带来的好处是简化了复杂度,复杂度又和时间相关,按照这样的理念,控制功能需求,就可以在固定时间内提供完成度更好的产品。对于现代软件工程和硬件工程,最大的问题是复杂度难以控制,而难以控制的复杂度会导致产品研发周期变长,投入成本不可控,随后在量产过程,售后支持环节都带来更多不可预测的成本支出。做减法简直是必须的,但大家都知道做减法很难。从苹果的历史看来,乔布斯一直擅长做这件事,不仅在产品上,在企业管理上也一样。他回归苹果之后,在很短时间内砍掉大量非核心业务,让公司终于能顺利生存。随后集中精力在iPod,对于一个制造计算机和服务器的公司,专心去做一个MP3播放器,听起来很可笑,当时也有很多人甚至员工认为很可笑。这个MP3也没有什么伟大创新,只是更好用。最终这个产品成功了,随后才有今天的一切。

今天的苹果产品仍然这样,想想iPhone刚刚出世时,人们诟病什么?不能复制粘贴,单任务,不支持"流行的"Flash,不能换电池...,其实到今天还可以随便找出来iPhone一堆缺点。就算这些缺点存在,苹果的产品仍然变得流行,人们喜欢他们,而不太在意这些缺点,因为苹果提供了更重要的东西,大屏幕,多点触摸,传感器,一个真正的浏览器,方便的音乐播放和购买,优美坚固的外形...我们今天回头来看这些诟病,几乎都能揣测出来一些道理,单任务是因为硬件性能不够,无法保证流畅切换任务和并行运行(想想同时代的nokia多任务),不支持Flash是因为太消耗性能,不能换电池是因为增加可换电池仓增加成本和设计难度...能做这样的减法,不仅需要对用户和市场有足够了解,也需要对开发产品团队和供应链有足够了解。否则他怎么能知道什么可以减少,什么可以在未来版本中支持,什么永不妥协,什么必不可少?这些,乔布斯做到了。在功能、成本、时间中的妥协,寻找平衡,这是伟大的艺术。

我更愿意把乔布斯看作艺术家和精神领袖,他不是工程师也不是Geek。苹果从来不用复杂的名词描述产品,苹果的产品系列也很简单。你只需选择笔记本的尺寸,随后就只有高低两种配置,你无需了解手机的CPU,你只需选择存储大一点或小一点。在买苹果产品这件事上,用户只要知道自己想要什么就可以完成,而无需成为专家。在其他领域你可没这么幸运,无论是买计算机,买手机,买汽车买房子装修,在苹果之外的任何产品,你都先要把自己变成专家,然后才能选出来你需要的东西。简单就是美。简单的精神有体现在苹果的各处,无论是使用产品还是使用网站,获得支持还是培训,都很简单。甚至苹果的发布会,开发者会议,演讲者都使用简单的语言。有朋友笑称去参加苹果会议不用怕英语不好,他们用的单词都是初中生也能听懂的。除了少数Geek用户和专业用户,大多数人更愿意使用简单的东西。不仅在硬件上,软件也一样。在苹果系统中,不用考虑硬盘分区,只需按照用途放在对应目录即可,不用创建复杂的层叠目录用来存放文件,只需搜索即可。这种简单同样体现在苹果提供的网站服务上,iTunes Music Store发布于唱片工业和盗版战争最激烈的时代,那时候P2P下载音乐已经非常普及,多数人不太在意音质,他们会下载MP3然后刻成CD放在车上听(中国共享软件的前辈周奕在网上把MP3刻录CD软件卖给美国用户,赚了大钱)。iTunes Music Store提供了简单的界面,购买方式,简单的价格体系和使用规则,一上线就受到欢迎,前18小时卖掉了275,000 首,前5天卖掉1,000,000首,这个成绩证明了只要足够方便简单,用户愿意付钱购买音乐,几年之后他们更是干脆连DRM保护都去掉了(感谢EMI的大胆尝试),最终成就了今天最大的数字影音产品购买市场,这个辉煌延续到了今天的AppStore。在未来iCloud发布之后,你甚至可以把自己下载的MP3通过Match服务,交很少的钱,一次购买版权,这也足够简单吧?我相信多数人愿意花这笔钱。如何让产品变得简单,如何让一般人更容易理解,这是乔布斯擅长的。对比前几天的iPhone 4S发布会Tim Cook的演讲,是否觉得不如以往乔布斯演讲那么通俗易懂?Tim还没能和乔布斯一样驾驭内容,让演讲做沟通一般用户和产品的桥梁,他还需要更多时间。

乔布斯不是技术专家,也不是工程专家,但他有选择好的技术产品的能力。这也是一个卓越公司领导人必备的能力。在离开苹果,创建NeXT那段时期中,他奠定了今天苹果的技术基础。几个重要技术关头,他都选中了最好的产品,比如,操作系统上拥抱UNIX,这样才有之后转向Intel CPU的能力,也有了iOS使用ARM的能力,开发工具使用了Objective-C,当时的潮流是C++,今天在iOS和OS X开发上,我们亲自体验到了采用Objective-C而不是C++的好处,再比如选择在KHTML基础上创建webkit做为浏览器内核,今天移动设备上webkit已经成了浏览器的标准内核,android浏览器也同样基于此。更底层的还有放弃GCC投资LLVM编译器,这样给予开发者更多特性,帮助他们完成质量更高的应用。最重要的系统和开发工具是在距离今天非常遥远90年代初,在乔布斯离开苹果开办NeXT时做出的选择,实在不得不佩服他超越时代的技术判断力与直觉。

如果让我继续写下去,这篇文章还能写非常长。不过我决定就此结束。苹果的精神难以用语言阐述,需要用心体会。我的朋友 @soulhacker在twitter上"我对 Steve Jobs 最感恩之处在于他无可辩驳的证明了:特立独行、理想主义、完美主义、执着创新是可以成功的,并用他自己的三段人生经历教给我们如何与实用主义及商业社会良好的妥协",这是我在这几天见到对苹果精神和乔布斯本人最好的概括。

乔布斯的离去一定会对苹果造成影响,从艺术家乔布斯到供应链专家Tim,领导者角色的变化一定会影响到公司决策。但我相信这不会太坏,乔布斯的精神和气质通过他的产品,文档,技术影响着用户和开发者,对于苹果员工想必更是如此。特别是苹果那些和他一起工作了15年20年以上的核心员工,他们一定能将这些宝贵财富贯彻始终,并使之继续流传。苹果和乔布斯仍然有很多人们不知道的事情,那些想法和决策的产生,如何说服合作伙伴...这些恐怕只有在10月24日发布的乔布斯官方传记中才能得到答案了。

在苹果的世界中,创新远未到终点,苹果在之前很多年投资了很多技术公司,包括这次我们见到的siri,还有传说到未见产品的液体金属 Liquidmetal Technologies ,终有一天,这些技术会足够成熟可用,变成产品到达我们面前,那一刻,我们的生活会再次随之改变,如同苹果宣传资料上最喜欢写的那句"再一次,改变世界"。苹果的疆域扩展也未到终点,我们能看到的领域还有一贯有积累的教育市场,完成了准备工作的企业市场,还有面对客厅的Apple TV。未来还很广阔也足够令人激动,做为开发者或者创业者,我们对乔布斯最好的纪念是记住Be youself,做你喜欢的事,做和其他人不一样的事,改变这个不完美的世界。

June 26, 2011

microblogging和微博信息架构产品差距和影响

前一段时间仔细的把国内的微博产品都研究了一圈。所以我终于可以写这篇文章了。

这个话题说起来很复杂,我从信息架构开始说,后面涉及传播方式,社群,阅读负担和信息过滤,第三方和开放性几个方面。最后会使用我blog这几年的访问数据对新浪微博和twitter传播能力做一个简要分析。

以下除特指某一家的产品,我用国内微博代表国内除饭否之外所有其他微博,因为他们产品都很相似。

一 信息架构

twitter中所有信息是平等的,没有一些信息会比另外一些更加平等。这里没有所谓的评论,你可以选取喜欢的形式用RT的方式加上评论,如果不想被更多人看到,可以直接回复对方,如果只想转发,可以使用Retweet。在twitter的架构中,只有这种层级完全一样的信息。twitter不提供类似于国内"微博"的评论功能,因为一旦有评论,信息就不再平等。

而国内除饭否外,所有的微博都加上了评论。这是一个非常容易做出的抉择,因为总有人会说"没有评论不方便"。加上评论看上去很好,也并不难。不过问题也出现了。

评论让信息不再平等,发出的微博是主要的,其下所有的评论附属其上。一条微博一旦被删除,其下的评论也随之消失,这也充分体现了他们之间的从属关系。如果不特意展开去查看评论,一般情况下评论是不会被更多人看见的。甚至发出评论者的follower(墙内叫粉丝,关注者)都看不到。这样就严重降低了信息的利用效率。在twitter这种信息平等的系统中,我用RT形式发出的评论会被我的follower看到,也会进入公共timeline。这些评论会再次引起讨论或被RT。这些RT同样帮助传播了我所评论的信息。这样的信息传播速度和力度是在其他系统中没法实现的。

为了解决这个问题,国内的微博同样也有了转发功能。转发又分评论和不评论两种,无论哪一种转发,转发过的内容都成为转发者的一条微博,这种微博同样可以被再次转发和评论。于是问题又出现了,这些评论是附属于被转发过的微博,而不是原始的微博,于是这些评论也很难被最原始的作者看到,只能被转发者看到。

在转发的微博上的评论层级就更低了,不仅评论者的follower看不到,连本来应该看到的原始作者也看不到。

更糟糕的还在后面,发表评论的人,也没办法回溯自己发出过的评论。除非他记录下来所有发表过评论的地址 经推友提示,发现这个功能是有的,先点右侧我的评论,然后点上面发出的评论。在twitter的系统中,用户创造的任何信息都是属于用户的,都会出现在用户的Timeline中,这些都是用户的数字资产,不应该被轻易丢弃。而在国内微博的系统中,评论只是二等公民,这些信息一旦发出,和创造者就没什么关系了,创造者很难回溯,这些信息也会随着原微博作者的删除和消失。当然,在这些为了自己的利益可以随便修改用户帐号,删除用户信息甚至禁言的产品中,让用户创造的信息消失从来也不是什么必须考虑的问题。

可见,评论虽然创造了一些方便,但带来的麻烦也不少。不过国内的这些微博的产品定义也有不同,他们并没有想制造一个平等的信息生态,而是制造一种名人发言,普通人收听的信息系统,这比传统的报纸广播电视略有进步,距离twitter这种完全平等,高效快速的信息系统差距仍然很大。

鉴于其产品定位,名人会觉得更加满意,更有万人来朝的快感。而评论被传播的效率很低,也使名人在出丑的时候不那么容易被更多人知道,也算是一种保护机制。

从本质上说,国内的微博都是BBS的变种,甚至可以是新闻评论的变种。对比一下网易新闻的跟贴,除了没有人物姓名,似乎也没多大差距。

国内微博到现在为止没有给评论再加上评论,如果有这个功能,就可以在微博下面盖网易新闻评论的那种楼了,也更方便吵架。从KPI和用户活跃数上看应该会更加好看,所以很可以期望在未来的某一天会有人加上这个功能--按照他们的逻辑,这也能让用户更加方便,不是吗?

很多人号称新浪有评论,所以用户体验比twitter好。我觉得谈产品体验是一个专业的事,不是随便一个谁觉得什么好就是好的,用户体验这个词因为太容易理解,使得评论起来毫无难度,其实多数人对产品体验的评价都流于表面,非常肤浅。增加一个评论功能,这是多简单的事,无论twitter还是饭否,想加上这种功能都毫无难度,为什么他们不做?这背后自然是有道理的。【刚刚发现一个好玩的例子,列在文末的update1中】

注,国内微博可以使用"评论同时作为我的微博发布"方式,下面一节会提到转发+评论方式,但仍然有相当比例的信息单纯成为评论而损失掉。

二 信息传播

twitter的意义在于改变了信息传播的方式。在此之前,人们早有单中心传播方式(广播电视平媒),也有单中心带少量互动的传播方式(广播电视+短信互动),也有多中心群组传播方式(BBS,邮件组),这些传播方式共有的好处是声音可以被放大到极大,缺点是信息传播途径被垄断,普通人乃至名人都没法发出自己真正的声音。

twitter创造了一种完全独立的信息传播方式,无中心,双向,无群组,所有信息都在一个层级上迅速流动。这是一个巨大的放大器,尽管twitter也存在fo数量多少而导致部分名人有中心化的趋势,但总体来说,这还是目前让最平衡的传播方式。

国内微博和BBS类似,是多中心群组传播方式。

在twitter,只要你的信息引起了别人讨论,在讨论的同时就被传播了,传播的同时又可以被引发新的讨论,信息顺着无数条链路快速传播开,边传播边分裂出更多分支,这是一种如同核爆一样的链式传播。

在国内微博,如果所有人都采用转发+评论方式,一条微博发出之后的传播路线和twitter是类似的。但有了非转发的评论,一切都变得不同。假设有1/4的人采用评论,而不是转发的方式发表自己对原微博的看法(事实上远远高于这个比例),那么就有1/4本来可以引发链式传播的机会被彻底消灭。原本这些评论可能会引起更多评论,也可能引发其他特别事件,但是一旦进入国内微博的评论系统,他们就消失了,几乎没机会再进入传播流程。

国内微博这种系统更适合于名人,他们的粉丝数量足够多,以至于他们可以不在意这1/4的传播效率损耗,甚至1/2的传播损耗他们仍然可以无所谓。甚至他们可以干脆不去看评论,客观上降低了他们处理信息的压力。但对于普通人,这种系统是残酷的,结果就会导致普通人发出的信息没人回应,得不到传播。钱明奇在新浪微博呆了半年,他的信息并不是不重要,但传播开了吗?在这种系统里面,草根是无力的,普通人聚集多少人,也没办法让信息真正充分传播,必须要借助官方或者名人的力量才有可能。

这不还是BBS或者广播电台吗?只不过多给普通人一些幻觉,让他们觉得距离名人更近...其实,就算没有微博,名人的声音也能被充分放大,他们的话语权本来就比普通人大的多,而无论有没有微博,普通人仍然得不到传播机会。但在twitter这样的产品中,一切都不同了,普通人也会得到属于他们的传播机会,但这也正是名人不爽的,一方面他们一旦出错,就会被痛击,很难装下去,另外一方面他们仍然愿意垄断信息传播途径,并不愿意和普通人分享。

简单概括twitter,即,一切归于Timeline,这是整个系统中最重要,最基础的部分。无论是信息本身,还是传播方式,最终一切形成了每个人的Timeline,这些Timeline根据fo的关系不同千变万化,形成丰富而多样的生态环境。

三 社群关系

twitter的社群关系是建立在前面所说的,平等的信息架构和极快的链式传播基础上。在这种基础上建立起来的社会关系非常牢靠,信任度也更高。

因为信息架构平等,所以信息更容易被重视。因为传播极快,也就更容易找到欣赏的人。一切都归于Timeline,哪怕是随便对什么事情发表的评论也都很容易被查到,通过Timeline就更容易了解一个人的品味和趋向。

平等的信息也带来平等关系,无论是不是名人,只要在twitter和其他人产生互动,就会促进社群的形成,社群的形成也一样是链式的,人们可以根据很多碎片信息而决定互相fo,进一步交流。最终形成无数虚拟社群。

国内微博,信息被划分了层次,人也就随之划分了层次。评论微博的人很难和发微博的人产生更多互动,也不会有更多人看到这种互动,想了解一个人,只能在他Timeline中看到正经八百的转发和原创,没法追溯他对若干事情的看法。这样就很难建立信任。

这些基础影响的事情很多,几乎下面要说道的所有问题都是被这两个基础因素所影响。确实,什么样的土地,就会结出什么样的果实。一个社区的关系形成和产品是有关的,一些逻辑的权衡最后会决定用户行为,最终改变用户关系。twitter的用户关系并不是因为大部分中文用户不能访问,在当年twitter可以访问时,用户也是这样的关系,社群也是这样的氛围,从未改变过。对于一个SNS产品来说,最终形成牢靠关系才是最重要的,这是对用户最大的方便,其他能不能传图片,能不能发评论,与此相比都太细枝末节。为了完成最重要的目标,甚至必须舍弃一些用户体验才能达到,正所谓行大事者不拘小节。下面一节我会分析为什么web不能传图片是好的行为。

很多人讲,其实并不喜欢微博,也觉得浪费了很多时间,只是因为有用,或者推广和工作需要,不得不用。这也是一个有趣的现象,这种话我听到了太多太多次,以至于我怀疑是不是新浪微博就是一帮推销自己东西的人凑到了一起。每个人都想推销点东西给别人,借助别人力量完成自己的目标。

假设新浪微博是有用的,但twitter是有爱的。twitter是一个温暖真实的社区,大家都是靠着自己的兴趣生存。同样有人在这里完成各种交易,找到工作或合作伙伴,找到朋友,伴侣。一个有爱的社区同样会节约人们更多时间,集中于生活本身。

其实没什么东西是免费的。无论是利用社会媒体推广还是其他方式,都需要花费时间学习,也可能需要花钱。对于我所见的大部分企业,包括声称从微博获得很多好处的企业和个人,如果他们可以精心维护一个blog,写一些有意义的文章(而不是赤裸裸的产品推荐),同样时间会被传播开并获得商业机会。而且blog几乎永存,更容易被检索,微博如流水,24小时之后就都流过去了,blog始终存在,易于查看,一次写作后面很多年都起作用。如果能写出来真的好文章,时间越长,意义越大。

人们总希望去寻找省事的捷径,比如他们认为微博推广是一条捷径,事实上任何事情都没有捷径,捷径都是幻觉。

认为微博营销省钱的,他们忘记了花掉多少时间沉迷于此。时间不能用钱衡量,因为时间就是命。浪费生命省一些钱,值得吗?和评价产品好坏类似,这也是可衡量的KPI和不可衡量的潜在影响对比,人们不太愿意(或者没有足够能力)关注后者。

想获取知识的,如果你没耐心去看书或者开放课程,那么至少应该看一些认真写作的blog。我不认为140个字(或者被国内微博创新的+140字评论)能够给别人真正的意义,我相信我这篇blog有意义,但这不可能用140个字说完,为了让这个事情说清楚,有意义,能存在下去,我需要回到blog完成它,在此之前,我花费了几个月时间思考,研究,体验,最终又花费几个小时写,几个小时改。才能成为你看到的全文,随手发的140个字不可能有这种效果。

SNS的本质还是社会关系,有爱的关系比有用的关系好。

四 阅读负担和信息过滤

微博类产品因为信息刷新太快,所以造成了比以往RSS更严重的阅读压力,让人们阅读负担大大加重。也在其上花费掉更多时间,节约阅读负担问题非常重要。

twitter基础是140个字,其中可以加入链接,如果使用短链接能节约一些空间。但总体的140个字不会变。twtter没有评论,只能RT并评论,这样带来的好处是信息非常规整,一般一条信息高度不会超过100像素,在屏幕上一页内可以显示更多内容,更容易用浏览方式扫过,重复信息,图片等干扰小的多。

对比国内微博,因为有评论和转发的机制,导致一条140字的微博下面还要带一条原始微博,有的两者还都带图片。这样被反复转发之后Timeline会充满同样的内容,每一条还都占用了200像素以上的高度,这对Timeline破坏严重。阅读压力也就更大。

换言之,在单位时间能我能完成阅读的twitter信息数量远远大于国内微博,阅读数量足够多,才能fo更多人,处理(RT或评论)更多信息,和更多人交流,整个系统也因此更加活跃。

对比两张图,左边是twitter官网和两种常用客户端,右边是新浪微博。可以看到右边同样的高度只能容纳很少信息,新浪微博一条信息高度轻松突破200像素,转发如果带上图片能突破500像素。相对于twitter的100像素,新浪微博阅读效率低的太多了。换言之,微博控会比同样程度的twitter控,花费更多时间或获取更少信息,能进行转发或交流的数量也同样有这么大的差距。

对比以下两张图,很明显就可以看出在同样页面高度内,twitter可以比新浪微博多容纳多少信息。

twitter的web页面和主流客户端(点击放大):

新浪微博web页面(点击放大):


twitter严格保证了140个字,不会耍把网址当作一个字符这种小聪明,也不会让你附带一张照片不算字数。在twitter世界里,一切都是有价值的,写了链接放了照片或者视频,就只能少写几个字。这个原则来源于短信,既然人们用140个字的短信可以交流,那么140个字的tweet当然也可以,何况中文140个字已经比英文表现力强多了。

如果要发表你的评论,对方又写的太长,那么你只能人工缩减一下,要么简化你的看法,要么就光写你的看法只附带上对方ID。这些用法不是twitter设计出来的,是用户约定俗成的规则。这种自然形成的规则同样也降低信息过载机会,如果人工缩减内容,相当于人工减少垃圾信息,这是任何算法目前都无法做到的,这里碰巧通过人工完成了。当然缺点也一样存在,比如会导致删改原文,会导致意思被误解...但就算有这些缺点,我也仍然喜欢这种方法,加快信息流动速度的方法都是好方法,降低信息过载机会,就能节约人们处理信息时间,最终又加快信息流动速度。

在产品设计上,twitter一直贯彻这个原则。

twitter的手机客户端,可以很方便上传图片,但web版不可以,这是为什么呢?因为twitter不是照片分享站,大多数情况你的图片对别人意义不大,所以就不要上传干扰别人了,如果非要上传,可以随便上传到照片分享站,贴链接过来。而手机客户端分享照片需求很大,这些照片有实时性,具备分享意义。国内微博都提供了网站直接分享照片功能,结果就是大量无用信息(很多是商业推广)下面贴上一张和正文完全不相关的美女图和搞笑图,以期望获得更多转发。这种东西完全是破坏用户正常阅读,增加用户阅读负担。这本质是国内微博对富媒体滥用,导致富媒体信息更受欢迎,最终形成一个恶性循环,人们只关注带有强烈刺激富媒体的信息,更为简洁有效的文本信息受到的关注度被严重降低,以至于真正有意义的内容也得不到关注。再看前面的新浪微博,截图,看第一条中国企业家所发的内容和图片,他们之间有关系吗?毫无关系。就是这种毫无关系的图片在新浪微博满天飞,白白浪费人们的时间。

用户能在web分享照片看起来确实方便,其实背后对环境破坏有多大,是没法衡量的。不过职业经理人们只关心前者,无法考量的后者他们并不在乎。管这个叫做"功能友好"的人们,何等浅薄。

概括起来,无论是链接占一个字符还是可以附带图片字符不占字,本质上都是让富媒体内容变得和普通信息不平等,记得前面所说的微博和评论不平等吗?富媒体又加重了这种不平等。

我在twitter说出这个关于web为何不应该有照片分享功能的看法时,有人告诉我他问过王兴这个问题(饭否也同样不能在web分享照片),王兴也做了类似回答。

twitter的web版也同样权衡了用户使用方便性,每条信息右上角都有小图标标记信息属性,比如图片,视频,或者有对话线索。点击信息右侧即可展开,图片视频都可以直接看到,如果有对话线索,右侧则会一次展开相关所有tweet,这种基于线索展开的对话,比国内那种一条微博下面讨论意义大的多,既可以形成讨论,又不降低任何一条信息层级。

换言之,twitter的设计不强迫用户必须阅读富媒体内容,除非用户主动展开信息阅读。在信息严重过载的年代,这种设计非常有意义。如果文字内容有趣,我会愿意多看,但如果我不愿意看,也请不要占用我的页面空间浪费我的阅读时间。

五 一些原则和第三方软件

twitter产品形成过程很奇怪。这个产品功能改造来自用户和社群,而不是来自twitter公司。今天人们看到的twitter和几年前我刚刚开始用的时候完全不同。原因是twitter只创造了信息架构和API,之后就不再管了。

阴差阳错也好,运气也好,认为twitter公司能力差也好,人手不够,偷懒也好,他们确实只是设计好信息架构和API,没做更多的事,之后用户登场了。这就是开放平台的好处,用户可以按照自己想要的去完善。不同的人心目中有不同的完美产品,于是各种完全不同的客户端和第三方网站同时被不同的人使用,最终所有信息对聚集回twitter的信息架构中。这也是一个历史上从未出现过的事。在twitter之后,从信息架构和API开始的产品设计逐渐成为一种开发方法,影响深远。

说twitter刻意保持网站的简陋也不太对,不过twitter保持网站只能完成最基本的功能(可能只是偷懒),确实对生态圈完善有帮助。一方面简陋的网站清晰演示了核心功能和信息架构,一方面也确实留给了第三方开发者更多空间。缺点也确实让新人不容易入手。(这几年有不好的趋势,twitter对第三方开发者也逐渐收紧政策,希望以后不要变得更糟)

twitter大概有最丰富的第三方软件,除了官方软件优秀流畅(收购的tweetie团队,tweetie团队首先在移动设备上发明了"下拉更新"操作,现在已经成为触摸屏上刷新信息标准动作),还有s60上的神器gravity,信息过滤最方便的hootsuite,最华丽的tweetbot,简洁快速支持stream API的echofon。所以我一直说,twitter是一种协议,你可以在这个协议之上创造任何你喜欢的东西。国内所有微博都是一种产品,附着了太多商业目的,这两者不在一个层次上。

说到tweetbot,值得特别讲一下他们的故事。这个iPhone软件开发团队只有两个人,他们开始做tweetbot的时候,twitter还没有收购tweetie团队,也就是说没有官方软件。开发进行了半年,收购完成,twitter把过去收费的tweetie变成了免费官方软件。这对于tweetbot这种希望销售软件的团队打击很大。不过他们还是坚持又做了半年,完成了tweetbot。这个软件上了appstore立刻热卖,人们都很喜欢,因为其特点太鲜明了。除了功能全面,最重要的就是华丽,操作感,绘图,声音,无一不经过精心打磨,完美到极致。在官方客户端已经做到足够好的时代,仍然有这样一个收费软件出现,仍然受到用户欢迎,实在是一个奇迹。就算你觉得twitter不怎么样,也强烈推荐感受一下这个软件,绝对值得$1.99这个价格。这也是有爱和有用的区别,twitter产业链上虽然也有商业spam,但活跃了很多真正热爱他,全神贯注只关心做好产品的人,这些人制造了独一无二的产品和体验。

twitter是需要学习的。我完全不同意"好产品不需要学习"这种说法。事实上人类社会大部分有意义的东西都需要学习,不需要学习的除了维持基本生命的动物性就只有一些毫无意义的事。完全不需要学习的有什么?大概只有吃饭和睡觉,或者看肥皂剧发呆。就算是吃饭,如果要吃的好,也同样需要学习。其他可以带来更多意义的东西,无论是计算机本身,或者是各种工作技能,都需要学习和长时间的锻炼。如果不学,连使用计算机和用键盘打字都有难度。

花费一些时间理解这个世界的规则,理解人们的生活方式,找到适合你的客户端,twitter就无比强大。这其实和真实社会更相似,twitter是信息流动更快,更刺激,放大效应更明显的真实社会,这里也有名利场,但也有真实社会的可爱和温暖。就算是你很普通,但只要你的观点有价值,一样会被传播开,一样很多人fo你。国内微博就是名利场,如果你有个吓人的头衔,那么只需去机场书店买一本成功学,每天抄几句,一样会被人捧上天。

twitter基础是公平的,信息可以安全保存,你可以信任他。新浪微博我们不谈敏感信息,涉及他本身的不敏感信息也一样被删,上次谷奥指责新浪抄袭,结果不是被禁言了吗?没有公平信念,就不会有真正好的SNS产品。

如果有可能,我觉得所有人都应该试试twitter,体验一下这样一个前所未有的产品是什么样,感受一下这个人不多但传播能力惊人的社区。如果有困难,可以去试试国内twitter最正宗的继承者饭否。王兴山寨了很多东西,他的可贵之处是同时山寨回来了开放和气度。饭否至今不加评论功能,难能可贵。所以饭否用户和twitter用户具有很多同样的特征,他们同样有爱,也有同样的效率。被关站一年的饭否,归来之后仍然获得了当年忠诚的那批用户,这些用户在饭否活跃度极高(如前所述,也和饭否产品设计简洁有关)。

微博的战争其实刚刚开始,目前的新浪微博只是恰好符合新浪的传媒特征,也和之前的名人博客有联系。这些名人本来就有话语权,让人们感觉新浪微博非常火。其实距离战争结束相差很远。无论是腾讯网易和搜狐,最糟糕的策略就是跟随新浪,不幸的是目前这三家都采用了这个策略。真心希望各家以自己的特点为基础,做出来有特色的东西,真正让micro blogging成为协议。就我的体验看来,无论用户质量,活跃度还是产品,饭否仍然很棒,希望饭否能继续改善产品,早日赶上。

六 附:数据分析

我从2003年开始写blog,目前手里有的访问记录是从05年记录的。中间我写过3篇文章引起了比较大的反应,在我blog上都创造了数万的访问量。利用这些数据,我设计一个简要粗糙的统计模型,用来衡量twitter和新浪微博传播能力的差距。twitter特殊在于常年被封,又有大量不同第三方工具,所以用户来源非常多样,并不是都来自twitter.com,要统计非常难。这也就是这个统计模型存在的意义。因为数据获取困难,所以这个统计模型有大量估算和抽样,未必准确。也欢迎提供数据或者挑毛病。这是一个有趣的话题,也值得研究。

数据来源:我的blog,twitter

数据收集:
A Google百度和谷歌的那些事 发于 2010-01-14
2010.1.14-2010.1.17 3天 59,355 Visits 83,586 Pageviews
1. (direct) / (none) 21,278 35.85%
2. t.sina.com.cn / referral 7,349 12.71%
3. 9.douban.com / referral 6,234 10.78%
4. douban.com / referral 2,604 4.50%
5. twitter.com / referral 1,888 3.26%

B 写给和百度作战的文艺工作者们 发于2011-03-26
2011.3.25-2011.3.28 56,365 Visits 82,489 Pageviews

1. t.sina.com.cn / referral 19,170 34.67%
2. (direct) / (none) 16,885 30.54%
3. douban.com / referral 3,286 5.94%
8. twitter.com / referral 792 1.43%
10. 9.douban.com / referral 723 1.31%

C 新浪微博你让我浑身发冷 发于2011-06-09
2011.6.9-2011.6.11 30,511 Visits 39,779 Pageviews
1. (direct) / (none) 11,993 39.31%
2. weibo.com / referral 4,444 14.57%
3. douban.com / referral 1,746 5.72%
4. t.qq.com / referral 1,576 5.17%
5. fanfou.com / referral 1,547 5.07%
6. twitter.com / referral 1,073 3.52%
10. 9.douban.com / referral 490 1.61%

以上数据均为发表文章当天开始,3天数据,只选重要数据,不包括和本次讨论无关数据(比如搜索引擎来源)。
这三篇文章特点鲜明,除了都在互联网上引起较大流行之外,其和新浪关系正好为:A 中立,B 有利(被盗版的作者们都聚集在新浪微博,是维权主阵地),C 有害(直接指责新浪和微博)
B篇因为被大量名人转发,所以可以理解为享受等同名人待遇。其他2篇为草根待遇。

直接计算新浪微博和twitter带来的流量比分别为:
A 3.89 倍
B 24.2 倍
C 4.14 倍

twitter因为被封,现在剩余中文用户不过5~10万,新浪微博声势正旺,在Q1财报中提到的用户量是1.4亿。twitter取高值10万用户,计算 140000000/100000=1400倍。而事实上就算享受了名人待遇的B,也只有24.2倍。按照这个数字计算,新浪微博以高于twitter用户量1400倍的巨大数字,只多带来了24.2倍访问量,如此计算,新浪微博信息传播能力实际只有twitter的1/57.3,小的吓人。如果用文章A/C的非名人待遇计算,则只有1/359或1/338。非常符合前文分析,新浪微博因为滥用富媒体和评论,导致人们处理信息难度更大,传播能力大大下降。换言之,新浪微博只是稍微丰富一点的单向媒体,顶多算web 1.5,距离twitter真正的web 2.0时代相差很远。

刚才说了,twitter因为常年被封,所以能看出来源为twitter的只是从twitter.com来的流量,只占中文twitter用户中极少部分。不过就只对比这极少部分,结果仍然令人惊讶。为了让数字更加真实,我试图寻找一个统计模型,给twitter计算一个系数,让twitter数字更加真实。这里应该注意到3篇文章的direct访问量很大,事实上作为个人blog,直接访问量应该很小,大部分用户来自订阅搜索和SNS,换言之,用户很少有把我blog放入收藏夹定期访问的习惯。因此我判断目前direct访问中有相当比例是来自无法追踪来源的twitter用户。


于是我又统计了在这3篇文章发表之后1个月内的direct访问量,作为平时数据用于比较,分别是:

2010.2.1-2010.2.28 28天 对应文章A
1. (direct) / (none) 2,939 31.49% 104/天

2011.4.1-2011.4.30 30天 对应文章B
1. (direct) / (none) 5,692 29.92% 189/天

2010.5.1-2010.5.30 30天 对应文章C
1. (direct) / (none) 6,044 38.78% 201/天

用A/B/C三篇文章数据对应这些数据计算,(发文3天直接访问量/3-发文后一个月平均每天访问量)/(发文3天twitter带来流量/3) 这个计算方法是试图找出我blog正常直接访问量和有可能的无法追踪的twitter访问量关系,计算结果为:

A (21278/3-201)/(1888/3)=10.9倍

B (16885/3-189)/(792/3)=20.60倍

C (11993/3-201)/(1073/3)=10.61倍

平均14倍,也就是说,应该把能记录的twitter访问量*14,是更加真实的twitter访问量。其中B的20倍相差过大,干脆忽略不算。那么也有10倍差距。

为了交叉验证,我又选取了另外一组数据,这组数据是通过twitter中观察使用twitter的web页面发推人数获得的,如下:

我的timeline 2/10
我的timeline 1/10
搜索"@hecaitou" 0/10
搜索"我" 3/10
搜索"吃饭" 0/10
搜索"赞" 2/10

按照这个抽样计算,使用twitter web用户只占全部用户13%。也就是说不可追踪用户有7.5倍左右。和之前计算出的10倍比较接近。

如果把A/B/C三篇文章中twitter带来流量都*10,会发现结果和新浪微博已经非常接近。也就是说,新浪以1.4亿用户之巨,和twitter的10万用户传播能力差不多。

仔细观察这些数据还会发现有趣的事,我发现:


  • 豆瓣传播能力惊人,已经和新浪差距不大

  • 饭否重开之后逐渐追了上来

  • 腾讯微博用户量也在快速上升

综合这些数字,我认为可以支持我前文所提出的结论,新浪因为过度使用富媒体,用评论破坏了信息架构,导致人们信息处理能力大大下降,试图利用新浪微博做营销的人占相当比例,充数的僵尸占相当比例,综合这些因素,导致新浪微博只是看起来热闹。实际上传播能力并不强。饭否是twitter精神在国内的传递者,虽然关站一年,错过了微博产品的快速发展时期,但其和twitter一致的信息架构和第三方,也形成了类似的社区气氛,在C文章数据中,已经可以看到饭否和新浪微博差距只有3倍,相信会有机会追上来。

根据这些数字,号称在新浪微博对工作有用,有营销效果,很可能只是自欺欺人。同样的时间如果花在其他平台,效果也差距不会大。这个结论对名人可能有所不同,但对普通人我认为是准确的。所以如果你不是名人,到现在在新浪微博仍然没有几万粉丝,那么这种营销对你毫无意义,你的存在是帮别人营销的,并不是营销自己。

所以综合以上,最终我的结论是:

1 国内微博产品设计导致了信息流动速度不够快(这说不上好或者不好,或者这就是他们追求的)。
2 twitter和饭否是高速信息流动系统。
3 豆瓣,腾讯微博,饭否,都不可小看。
4 twitter和饭否一对杯具,一个被封多年,一个被关站一年,都错过了最佳发展时期,但其产品设计仍然保证了用户忠实,社区氛围好,传播能力极强。
5 微博营销是自欺欺人,这才是庞氏骗局。所谓有效的要么是偶然,要么是特殊名人的特殊时期,要么是不会算数,不会衡量效果。在新浪微博,除了李开复和姚晨那种一线名人,其他名人其实也很可怜,一样没什么人关注。
6 国内微博不是SNS,只是有一点社会化味道的媒体,最多只能算web 1.5
7 这场战争刚开始,距离结束还远着呢。
8 大多数人眼光短浅,认为"产品"好坏只是让他用起来是否舒服。其实让你不舒服的产品可能会有更好的效果,只是你不能理解罢了。
9 推荐阅读: 为什么我永远不会雇佣一个"社交媒体专家"
10 twitter是microblogging这个概念的创始者,也贯彻最为彻底。饭否是twitter精神在中国的继承者。新浪微博做成了140个字的BBS。腾讯是QZone和IM的延伸,网易完全没弄明白自己在干嘛,搜狐不小心做成了tumblr,还不如直接改名叫轻博算了。


注:我写这个blog时,和菜头 @hecaitou 也在twitter发表一些看法,我们很多地方看法类似。这篇blog是我个人独立研究完成,与和菜头的结论,是同时彼此独立研究的结果。不过我也盼望他能写一篇blog,做为经历了两个微博产品的人,他应该有更多有价值看法和数据。


update 1: 后来想起来,如果所谓"让用户舒服就是好的",那么当用户140个字写不下的时候,用户也是不舒服的,为什么不干脆放宽字数限制,让用户随便写?别笑,用户真的有这需求,还有个叫长微博 http://weibobobo.com/k/ 的东西,用来把正篇文章抓成图片贴到微博上。

June 9, 2011

新浪微博你让我浑身发冷

------
本文特别声明,本文和其中使用的图片均可任意转载和使用。感谢传播。
------

新浪做为中国最早的在美上市互联网公司,一直在诚信方面有不错的口碑,美誉度较高。很多事情人们甚至会替他们辩解,在中国开个公司不容易,要多往好处看。所以今天发现这个公司可以无耻到这么彻底的时候,确实让人发冷。

事情的起因很简单,google的新闻站谷奥发现一篇译文被新浪科技抄袭,这里说抄袭是有证据的,因为就连谷奥翻译错了的地方,新浪科技也照单全收一字不差还原错误翻译。这是一个基本的常识,大家都写对了那是正常的,如果错都能错成一样,那显然是有问题。 谷奥列出新浪抄袭证据的原文在此 ,有兴趣可以仔细看。

这事情只是个开头。后面的才精彩。一般来说这种事情行内多了去,大家抄来抄去,被揪住一次也就嬉皮笑脸道个歉,被抄一方也不会在追究,也就过去了。奇怪的是新浪这次用了一个奇怪的方法,把这个事情弄的越来越大。

首先是新浪科技的编辑骂谷奥傻逼(这在后面新浪科技发的官方声明中变成了"新浪科技编辑骂了两个字母进行回应"),然后总编辑陈彤在微博痛骂谷奥,引起大量用户评论数百条,这些评论先被删至剩30条,随后又恢复,转天这条微博也被删。不过这里有截图

转天谷奥创始人到新浪沟通抄袭事件,新浪仍然拒不承认抄袭。至于"错都错的一样"这种铁证,新浪装作没看到。之后的事情更加戏剧。

新浪科技发了一篇新闻,表示自己绝无抄袭。这篇新闻的留言中凡是对新浪不利的言论一律不显示,只有几条夸新浪的留言显示出来。之后干脆关闭了评论。这篇新闻的结尾是:"新浪科技频道重申:感谢社会各界一直以来的大力支持,欢迎大家继续对新浪科技的工作批评、指正。",这虚伪的像个笑话,人家批评你们骂人家,新闻评论都不敢开放,还好意思说欢迎批评。

很快,新浪微博小秘书威胁谷奥官方帐号不要造谣,最终结果是谷奥官方帐号变成了号称先审后发,其实不能发表状态,之前发布的和此事相关的微博均被删除或隐藏。谷奥是加V认证的帐号。

事件简要回顾完毕。

这个事件的谷奥一方,是一个只有2个人的个人网站,另外一方是市值近70亿美元的上市公司。这样的实力对比下,新浪从高管到员工,倾全力打压一个个人网站。原因只不过是谷奥对被新浪抄袭事件要个说法。这种底气的来源大概就是微博的发展,新浪已经可以认为,我打压你,你无法还手。

以往人们在媒体无法表达的事情,可以在自媒体和sns表达,如果新浪垄断了微博,将来只要你和新浪有冲突,或者你的东西被新浪看上认为可以盈利,你在自媒体也就出不了声了。新浪产品线复杂人也多,谁都有可能不留神和他们发生冲突。

之前作家和百度的维权事件,新浪微博是主战场之一,但新浪爱问同样盗版他们的小说。如果作家们质疑一下爱问,恐怕结果也是被封杀。诸如此类的事情,以前有不少,以后会发生的更多。比如一家基于新浪做SNS游戏的公司,新浪自己想抢你的业务,你会没法还手,没法出声。所有在新浪微博培养的关系,粉丝,声誉,都不是你的资源,而是新浪的。只不过是对方看你还不算讨厌,暂时让你存在而已。一旦和新浪有冲突,这些都没了。现在看好新浪,爱微博的人,如果有一天发现自己的利益被新浪所占,又无处申诉,感觉会怎么样?这种事情之前也发生过,恐怕除了当事人,别人都没注意,比如新浪微博曾经强制收回大量特殊微博账号 ,这些叫做微招聘,微公益的帐号,起初都是因为用户对这个平台的热爱而自己注册和维护的,做大之后被强制收回。关于这个事情,可以看微公益帐号创造者所写的事情经过:新浪"微博强拆",拆走的都是用户的心 。这是发生在今年3,4月份的事。

在这个事情之后,所谓的新浪微博开放,做为开发者的我是不会再相信了。新浪科技和谷奥只是义气之争尚且如此,利益之争会如何?一个平台,丧失了中立理性和宽容,不能面对自己的错误,无法改正,乱用资源和强权,一定不会成功。毕竟互联网还是一个存在充分竞争的行业。

如果新浪微博真的垄断了这个行业,未来他的业务线一定会和你发生竞争。微博和以往的SNS不同,是工具也是媒体。一般来说人们碰到不公可以寻求媒体救济,但在新浪这,你没机会。在媒体和舆论上会成一边倒的状态。看这次新浪科技的声明,内容完全不真实,但被攻击的一方只是个人网站,没办法找到一个话语权对等的平台回应。无论你是什么样的名人,都没机会。目前在新浪平台受益的人,都应该好好思考一下如果这样发展下去,你的未来是什么。投资人们,如果你的项目被新浪先看中,如果你们的项目被新浪山寨,做营销的,如果新浪想自己赚营销这笔钱,做自己的营销平台,创业者,你做的产品被腾讯山寨的时候你可以骂,将来被新浪山寨了,你怎么办?...在新浪微博平台上,你们拥有的资产,都在新浪老大哥的垄断之下,剩下的无非就是什么时候杀你这只肥猪而已。最后你最多像已经没法发言的@谷奥现在做的那样,把自己的文章链接写在bio中,新浪真是欺人太甚。

这样的未来,让我浑身发冷。中国之前任何一家互联网公司,无论是百度还是腾讯,都没能把事情做到这么绝,就算是腾讯,也不会因为用户在QQ中交流对腾讯的不满而封掉用户的发言权利。我始终认为,microblog应该是一种协议而不是一种工具。这种工具应该打通几家,而不是被一家拥有。就像邮箱一样,协议和产品需要分开,你可以用新浪邮箱我用gmail他用网易邮箱,我们互相能收到对方的消息,而不能是必须大家都去用一家的邮箱。我觉得如果实在不行,搜狐网易饭否联合吧,打通你们的API,让用户流动起来,别坐等被人各个击破。

为了不让这个一家垄断的未来成真,现在能做的就是力图让几家竞争者平衡,至少应该留下足够强的竞争力量,所以我呼吁停止使用新浪微博,转向腾讯,饭否,网易,搜狐。这个行为看起来有点赌气,可是想到未来,这是为将来的自己留后路。就算你不想那么多,现在开始给自己在其他几家的平台上培养一些资产,留作备份,也是应该的。也就是说,无论你是否停用新浪微博,如果你觉得这个自媒体平台有意义,那就应该立刻把几家全开了,一起用,这样你才能安全,至少将来还有渠道说自己要说的话。

在现实世界我们已经充分体会到了一家独大没有竞争的后果,幸好在虚拟世界,现在你还有机会亲手改变。


====================================

下面这两个badge是我的选择:


我把他们放在blog侧面,就算为多样化的未来出点力。你的选择?

这里还有更多图样可以选,挑个你喜欢的吧。
ps,为了实践我的建议,除了twitter,本人恢复更新网易微博 @virushuo 饭否 @virushuo 我还会开国内其他几家的。每天均花一些时间真人更新,同时无限期停止更新新浪,并求新浪删我帐号。大家墙内见。

May 23, 2011

关于bitcoin若干问题我的看法

最近关于bitcoin突然在中文圈子火了起来,似乎是引爆点到了。半年前我也下载过,但是没弄明白怎么用,说回头看看wiki,放在一边就给忘了。现在想来悔不当初,当时如果下手估计也能弄到几百个吧...

这个项目非常有趣,或者说非常酷,而且前所未有。我对bitcoin的态度是强烈支持,并且希望它成功。我愿意接受bitcoin付款购买我的软件什么的。云风的文章是目前对bitcoin原理说的最清楚的,不过四处还有不少疑问,我把常见疑问汇总起来,按照我的理解做个回答,算补疑。本人计算机还行,数学一般,经济学不懂,所以也有可能有错,大家可以继续拍砖。

1 信用从哪保证

人们最常考虑信用问题,比如说,现在货币是政府担保,bitcoin谁来担保?在有纸币之前,人们只是在自然界寻找那些"不容易获得"的资源做为等价物,比如贝壳。后来才使用贵金属。再后来纸币和贵金属挂钩,最后脱钩,最后这几步就是最近几十年的事。

现在大家以为纸币是有信用担保的,某种意义上说没错,各国央行提供了这种担保。但另一个角度看来,这种信用担保完全靠不住。现在的通货膨胀和紧缩,经济好或者不好,都和央行如何发行货币相关,或者更确切的说,和美联储有关。谁来担保他们不去乱发货币?

人们对纸币的贬值表示担心,会买入大量的贵金属以期望"保值",说明人们也并不信任目前的货币体系。换到bitcoin这,机器和算法保证了bitcoin无法被任意超发,如果要更改算法,就要p2p网络上的大部分节点都换成新的算法,否则就毫无意义,换言之,bitcoin的信用是靠使用bitcoin的人本身来保证的。从这个意义上说,bitcoin比央行信用的靠得住。

你永远也不知道各国央行背后干了什么,即将干什么,但是你能明确的看到bitcoin的代码,知道算法和一切细节。哪个更有信用?

2 bitcoin是否能和经济总量匹配,不匹配是否能造成通胀

bitcoin的货币单位BTC,按照目前的算法,最多可产生2100万个(可能需要100年...),这和目前的世界经济总量确实不匹配。但是我认为把BTC和经济总量对比并无意义,目前的经济总量是用纸币(比如美元)衡量的,这种衡量方法本来就不是真正的"经济总量",或者说经济总量这个词对于bitcoin体系来说毫无意义。

其实应该把这个问题换一下,就是BTC是否够用。这个问题也不用担心。目前BTC显示的是小数点后2位,其实内部存储了小数点后8位。也就是2100万*10^8,这个数字已经大的吓人了。这背后的意思是说,BTC可以看作无限可分的,如果存量稀少,人们就会采用更小的单位,比如0.00001BTC能买到一瓶可乐,如果存量过多,人们会采用更大的单位,比如10BTC能买一瓶可乐。

其实黄金也可以这么用,只不过黄金并不是真正的无限可分,不好携带也不好转移,事实上没办法真的这样使用。

因为没有滥发货币的央行,所以也就没有快速恶性的通胀了。BTC的产生速度稳定,人们就可以在较长时间内使用一种合理的单位来给商品和服务定价,这种价格是相对稳定的。

3 bitcoin是否容易损失或者被盗?

这个问题在 https://en.bitcoin.it/wiki/Securing_your_wallet 中有详细说明

概括一下,其实你只需要保证自己的wallet.dat文件存在,你的钱就不会损失。因为bitcoin系统中,你拥有的货币数量是根据交易单计算出来的,而交易单存在在整个p2p网络中。就算你的计算机坏了,只要你保存了wallet.dat,就能够重新取得交易单,你的钱也就并不会少。

至于被盗,如果你的wallet.dat被别人拿走了,那确实会被盗。这个文件事实上是私钥。所以应该保护好这个文件。刚才哪个链接中提供了各系统中安全保管此文件的办法。保证一个文件安全的方式有很多,也可以考虑干脆使用truecrypt加密,这个足够安全了。

加密之后的文件可以存到邮箱或者其他云存储系统中,也就不担心损坏了。你还可以建立多个wallet.dat,每个里面存一点钱,分别存放在不同的地方,这样就算丢失一个损失也不大。

现实中一样有丢钱包,信用卡被盗刷,网银被盗等等问题会导致财产损失。bitcoin反而现实安全很多,现实中你几乎没办法去增强自己网银的安全级别,但bitcoin的wallet倒是有很多办法。


4 bitcoin的发行是胡乱发的吗?

很多人说美联储虽然增加货币供应,但并不是满大街随便找个幸运的家伙就塞一笔钱,而是去发行国债或者变成银行贷款。但bitcoin是在计算的过程中碰上的,好像是随便发的。

这里存在一个误解,Bitcoin的mining过程并不是在空做计算寻找随机数,而是在做交易单处理,这种处理保证了整个体系的正常运转,这就是mining的人正在做的事情,他们耗费运算资源来保证交易正常进行,并且有一定机会获得回报。这也是劳动获得的回报,就像最早挖金矿的人,他们获得金子并不是凭空获得的,也是付出劳动之后的回报。

5 bitcoin体系安全性如果出了问题怎么办?

bitcoin依赖公私钥存在,对于足够大的公私钥体系,目前还没有破解或破坏的办法,要伪造的唯一办法就是去穷举,这在时间和计算资源上都非常不划算。(比如说,100年时间伪造出来一对公私钥?)

假如公私钥体系真的在数学上被找到了漏洞,可以大量伪造,那时候倒霉的可不光是bitcoin,整个社会都要崩溃。目前人类社会太多的地方依赖这种加密体系了,包括银行。所以说,bitcoin在安全性上仍然超过(至少不低于)目前的银行系统。

6 人们为什么会接受bitcoin?

人们接受bitcoin只是因为他们喜欢。比如我就喜欢,所以我愿意接受。一种等价物,只在于愿意承认他的人有多少。就算是货币,比如说美元,是世界通用的货币,但是你在中国,到楼下的便利店中用美元现金买一瓶饮料,能成功吗?同理,人民币目前有巨大的升值期望,但你拿人民币现金到美国超市购物,能成功吗?所以说任何等价物,包括货币,都是在有限范围内被认可的。目前在geek/hacker中,BTC正在逐渐被认可,这是一个好的趋势。

bitcoin论坛上有各种BTC为基础的生意,看起来还不错。以后应该会越来越多的人愿意使用BTC。

ps: 我昨天晚上在论坛上做了个小生意,赚了1BTC。为这个生意劳动耗时大约20分钟。如果用我的MBP挖到1BTC,大约需要5天。所以说,让系统尽快正常流通起来,大家就都有钱用了。

7 bitcoin为什么不可追踪

bitcoin的收款地址是可以随便创建的,wallet也可以随便创建。而且bitcoin软件本身就会在你每次收款之后生成一个新的address,下次你就应该使用新的(旧的当然也可以用)这就让追踪钱的转移变的非常困难(虽然一切都公布在p2p网络中),对应到具体的人更是困难,至少比现有金融系统困难的多的多。


8 bitcoin要耗费大量运算资源,是不是太不低碳了?

你知道现在为了维持货币存在,人类需要浪费多少资源吗?虽然bitcoin耗费能源,可总没有那些机构耗费的多...


我发了条推说:"或者说可以把BTC当作一个大游戏,其实wow金币也有一定虚拟货币的特征,但没有担保方法,没法控制滥发货币,也没法保证一直存在,blz一脑抽把业务停了,所有的金币都没了。bitcoin不会出现这种情况。"

@soulhacker 回答:"WoW 金币一度是很硬的通货(和人民币有相当稳定的汇率),但是后来玩家找到了增发的手段于是通胀贬值,而且随着 WoW 的越来越休闲和快餐化增发和通胀不断加速..."


最后,很多问题的提出,根本上都是不理解bitcoin的运作方法,还是推荐好好读云风这篇Bitcoin 的基本原理


update: 留言中有价值补充的我贴在这里,谢谢各位

两个反馈:
第一个是基于第4点,你说的其实没错,但是容易让一知半解的人误解,认为他个人付出的计算量就是劳动了,而每个劳动必须要获得回报。其实不尽然,其实那新产出的部分应该是对当时P2P网络上所有计算结点的犒劳,并不等价最终获得奖励的那个人付出的。其实最终是谁获得还真就是人为目的地尽可能随机分散分布,来保证BITCOIN的整个体系。而体系认为就算把这个时段集体的劳动结果撞大运似地分给某个个人,最终也会进入流通而造福所有的使用者。只是一点补充,怕其他人误解

第二点是关于WOW的那段补充,WOW金币的贬值倒真不是玩家发现了很强大的增发手段,当然的确有,但是那个对兑换价值的影响没有那么巨大,并且缓慢。真正成倍数贬值的还是BLZ自己的版本升级,调整了任务和掉落的金币产出,所以从数字上来说产生了金币的贬值。这点上还是印证了央行的不靠谱。 但就算是这种情况下,受概率影响的极品装备只要概率不调整,在一定的时期内价值还是稳定的,虽然你需要用更多的WOW金币去购买,但你购买更多金币所需的实体货币RMB数量没有太大变化,改变的只有汇率,但是真实的购买力没有变化

Posted by: Gossipsama | May 23, 2011 4:30 PM

原本还想写一篇关于 BTC 的私密性的 blog 的 :) 不过突然这个这么热,又不想赶热点了。

BTC 的 wiki 上关于 Anonymity 的页很有意思,居然拿 live in China 做假设。而且提到了 baidu ;)

MyBitcoin 是个有趣的服务,可以用来解决许多私密性的问题。

Posted by: Cloud | May 23, 2011 4:31 PM

May 19, 2011

Google AdSense以及blog的选择

最近一些中文blog的Google AdSense帐号被封,引起了很多争论。这个问题并不像看上去的那么简单,没法简单的说出谁对谁错,从规则上说,我认为Google确实缺少被封之后有效的救济手段,但从实际来说,这又存在很多困难。要理解这些问题的产生,就需要弄清楚AdSense的整个模式是怎么来的。于是,我们得从广告开始说。

一 广告,效果,作弊

抛开广告的形式,把广告抽象为广告这个词,那么广告本身没什么复杂的,无非就是甲方利用乙方进行宣传的活动。但事情一旦涉及到了钱,就会变得复杂。涉及到了钱,甲方(广告主)就希望少付钱,多办事,乙方(发布商或者叫做媒体)就希望多赚钱,少出资源。这本身就是矛盾的,于是双方就要议价,讨价还价,这样就有了广告报价,什么位置多少钱,买多长时间多少钱,打包几个方案多少钱,诸如此类。有了价格和交易,就一定要存在中间环节,这样就有了广告代理,媒介之类的角色存在。这些中间商的存在目的自然都是为了获取利润。

有了中间商之后,这个游戏就更复杂了。除了普通甲乙双方做生意的"店大欺客,客大欺店"的讨价还价法之外,中间商会做更多的事情,比如如何排期,如何排位置,给什么样的客户什么样的价格,这样本来很简单的广告终于变成了一般人搞不明白的东西----搞不明白过程,也搞不明白价钱。

对于广告主,刚才说过,他们是希望少花钱,多办事的,他们有足够的动力想出很多办法来衡量广告效果。过去在传统媒体上,他们会在不同的广告上使用不同的电话号码,看哪个号码打的人多,在互联网时代他们监测流量和广告的点击量,更聪明一点的广告主会给广告加上代码来跟踪进入用户最终的行为。对于中间商和发布商来说,日子越来越难过,他们必须保证广告有"效果",才能赚到更多的钱。

于是就有了作弊。以上说的所有角色都有充分的动机作弊。发布商不用说,他们希望得到更多的广告费,中间商自然也一样。甚至广告主这边具体的执行人,有时也会为了工作业绩或者和发布商的连带关系而作弊。

作弊问题伴随着广告的存在而存在,随着广告形式的改变而改变。传统媒体会虚报印数,门户网站会虚报流量,放点击广告的会用程序或人工去多点几下广告,按照效果付费的广告作弊的方式更令人叫绝,人们真的会去做和正常用户一样的行为----感谢中国便宜的人力成本。我有一个做网络游戏的朋友,她会认真的检查广告带来的用户是不是真实,她总能发现好玩的事情,比如,所有人物都在某个时间段迅速达到某个级别之后再也不登录了,也发现过新注册的用户很多密码是一样的...其实这也没什么可惊讶的,只不过是作弊方不太认真而已。

跟这个行业打过点交道的人,应该都熟悉扣量这个词。这个词的意思是参与广告的几方因为各种原因,对报表中体现的数字表示怀疑,于是大家一起商量核算出来一个新的数字。对于大部分广告投放来说,广告主发言权比较大,因为他们掌握着钱,于是他们常常会按照经验少给对方一些钱,或者要求对方补做多长时间的广告,这个就叫扣量。

看到了传统广告(其实互联网广告也不算太传统了)是怎么玩的,就很容易理解,没有什么广告比Google AdSense再简单了。对于传统的广告,看上去赚钱很多,但每个环节都要消耗大量的人力成本,这种广告是不可能让小网站赚到钱的。大网站面对大广告客户,能值回这些人工成本,小广告主或小网站则完全不划算,他们能赚到的钱甚至连这些人力成本都不够,更别说利润。可以说,如果没有AdSense,小网站是拿不到任何广告的,除非你自己想办法去搞定各种关系,拿到广告订单,有谁能轻松做到这些?


二 Google 怎么做

众所周知,Google很多年前是个技术很好但不赚钱的公司,直到后来找到了广告的盈利模式,才变成了现在的科技巨头。Google崇尚使用机器和算法,不愿意依靠太多人力。最终Google使用了AdWords这种广告模式,其核心在于内容针对匹配,自助发布,按照点击计费,价格透明。和前面所说的广告模式相比,这是颠覆性的模式。在这种模式中,竟然没有中间商存在的空间,广告价格、位置排列、发布过程,全被机器取代,而且价格更准,费用更低。中间没有了人力成本,这种模式就变得可以复制和爆炸性增长,除了Google自己网站搜索结果右侧和顶部的广告,他们还通过AdSense这种方式投放到其他网站上。这就给了很多网站一个获得广告投放的机会。

特别注意,这种模式之所以能出现并盈利,主要原因就是工作都由机器完成而非人工。如果有了人的参与,除了人力价格问题,人也会倾向于去寻找利润更高的客户,如果和不同规模的网站签约和客服成本差不多,收益却相差很大,人自然会更愿意把同样的时间和精力花在赚钱更多的网站上,这样就回到了前面所说的广告困难,小网站没有任何机会。

Google的广告同样也涉及效果和作弊。从前面的描述可以看出,如果Google不能有效的让机器来反作弊,这个模式就崩溃了。在这个模式中,除了非常重要的大发布商或专业发布商,Google必须倾向广告主,因为只有广告主投了钱,整个模式才能运转,如果广告主认为Google广告效果不够,那么模式也要崩溃。

基于以上两点,Google的反作弊模式必然是优先保护广告主利益,提供自动而且严格的反作弊。作弊这个词有贬义,在Google的官方文档中,通常使用"无效点击"这个词。这样现在大家看到的现象就非常好解释了,Google无法提供人工客服给小网站,那样等于是赔钱,与其赔钱,还不如不要这个小网站的广告流量。Google会尽量识别作弊,但任何技术都有准确性,这种技术不能保证100%准确,所以一定会有网站被误伤。对于足够大的网站,或许Google能通过一些方式协调扣除部分无效点击,对于小网站,这么做的结果还不如直接封杀。

这是这种商业模式必然的结果,谈不上作恶或不作恶。我承认对于完全没作弊而被封的网站本身,这是不公平的,他们也会认为Google在作恶。这应该是一个"艰难的选择",虽然损失了一些人的利益,但大部分人,无论广告主还是发布商都因此受益。Google应该非常清楚这些,所以Google AdSense的合作协议和常见问题中都明确指出了"Google 保留以任何原因(包括来自任何来源的无效点击活动)停用任一帐户的权利。"

我非常同意AdSense并不是最好的系统,也不是最好的模式,它有缺陷,并不严谨,会有误伤。但也得承认,这是目前存在的最好方式,对于广告主和发布商都是最好的模式。对于广告主,价格透明,节约成本,效果明确,方便,一次投入成本很低。对于发布商,简单,不限制规模,多少能赚点钱。除此之外,还有其他公司能提供这样的模式吗?没有了,就算曾经有也死掉了。

因为大规模使用了机器,所以哪怕是一个个人,也可以当作广告主,通过Google的广告系统宣传自己的产品,同样就算是一个个人也可以当作发布商,在自己的网站上发布广告。这种做法确实改变了世界,这种做法允许哪怕一个人这么小的单位,有机会参与到广告投放,发布,盈利的过程中,把广告行业的参与者扩大到了前所未有的范围。今天被封杀的人当然会觉得懊恼,但如果换个角度,你是广告主,会不会因为被退回了一笔广告费而惊喜?

对于Google来说,这是帝国的基石,除非到更好的办法,否则不可能改变现在的模式。

小小提示一点,大家应该都知道不要点击自己的广告,但你有没有认真看过AdSense的所有相关资料?最重要的《AdSense 基础知识》,特别是《AdSense 合作规范》其中的《无效点击和展示》部分。如果你不了解一个系统,就不可能正确的应用它。这些文档中提供了很多东西,在我看来,很多放AdSense的网站都是违反规范的,被封也是早晚的事,如果Google愿意投入足够的人工客服,他们应该可以一个个指出你哪里做错了。

当然这些规范就算都做到了,也不能保证一定不被封,不过总会让几率降低一些吧。对于访问量偏小,扰动起来容易的个人网站,更应该认真阅读这些资料。

读这些东西很费时间,但做什么事情不需要时间呢?天下没有什么事情是"轻松赚钱"的,所有事情都要投入足够的时间和精力。AdSense并不是一种轻松赚钱的方法,同样有许多东西需要学习。

Google从来没隐藏过这些信息,无论是申请AdSense的TOS或者这些相关资料,都多次明确指出Google有权停止帐号,并且不给出任何信息。这也并不是"霸道",和Google其他算法(比如反垃圾,反内容农场,排名)一样,这些算法都是保密的,因为一旦公布,人们就更容易找到对付算法的办法。很多企业都不会公布具体的审核标准,比如Paypal如何认定欺诈,至今仍然保密。既然签署了TOS,理论上是应该仔细阅读过的(虽然很多人根本不看),Google已经充分提示了各种风险,所以这是信息完全公开,平等的商业合作,和Google是否作恶没关系。如果在接受一个商业合作之前了解清楚,读完资料,至少不会和现在这几位一样大喊"天啊,我怎么会被封..."。但想想买来东西会读说明书的人也不多,更别说这么长的文档了。请问,这要怪谁?

twitter上的@newsinchina最近发表了不少关于AdSense的心得,基本都是正确的,而且切中要害,有兴趣的同学不妨去看看。好玩的是,这位同学的正职工作和IT一点不沾边,但是他对AdSense的了解远远超过了很多自认为是IT圈的人,包括最近被封的这几位。在各位觉得AdSense被封属于晴天霹雳的时候,看到一个圈外人比你们更了解这系统,脸红吗?

三 中国的问题

所有模式在中国,都需要另外解释一下。中国确实是一个与众不同的地方。

Google Adsense刚刚开放中国市场之后的一段时间,是封杀帐号最厉害的一段时间,我想Google可能从来没见过作弊这么凶猛的市场,对于其他国家,用人力去点击广告获得收入不是特别划算,但在中国,人们可以去三级城市以下雇非常便宜的劳动力来做这件事。

后来的事情好玩了,这些事情背后的策略我没有直接证据,但根据现象,还是能推测出来一些东西的。之后的几年随着李开复在谷歌政策的推行,有几年的时间几乎没有听到帐号被封的情况。与此同时,Google在中国有了广告代理商,不再是自助投放。记忆力好的用户大概还记得,这几年的AdSense广告质量低劣,匹配非常差,还有大量的图片广告。这些图片在不同网站看上去都是一样的。整个系统看上去不再像内容针对广告,反而像其他广告联盟做的那种Banner广告。同时,李开复在各种场合反复提到谷歌中国的广告收入正在快速提高。就是在那个时候,我撤掉了这个blog上的AdSense广告

这几件事放在一起看,会很有趣。首先,反作弊力量下降,那么广告主就会损失更多的钱,对应下来就是广告的投放成本变高。随之带来的就是小广告主无法承担,只能不做了,不在乎价格高的广告只有医疗广告或者干脆骗人的广告。谁去寻找这种不在乎花钱的广告主?只有靠代理商的线下交易了。

但总之谷歌是能赚更多的钱了,发布商也能赚更多的钱了,代理商也赚钱了,看起来是好事?当然不是好事,这样的做法是损害Google生存的基础,把一个科技巨人变成了恶劣的广告联盟。

一转眼就是几年,大家都相安无事。为什么现在突然出现了大面积的Adsense帐号被封?是什么在发生变化?

今年对于Google是非常重要的年份,创始人拉里·佩奇重新接任了CEO。如果平时留意,可以从各方面看到Google和前几年的区别,动作更快,更有活力,无论是决策还是产品发布,速度都快了很多,Google似乎回到了创业时期最好的状态。对于一个这样规模的公司,这可真不容易。

加强对AdSense的管理,大概也是这一系列改变中的一种吧。我没有证据,但从时间和逻辑上推测,这是合理的。

中国的blog们叫喊不公平的时候,不知道他们是否考虑过,中国是广告点击欺诈最严重的地区。我甚至直接认识的人中就有在二级城市靠点广告分成赚钱的,他们有几十人的规模,每天只做一件事就是点广告。他们有各种技巧,让点击起来真实,不容易被发现。就算比点击广告更严格的效果计费广告,也有我前面说的那种人工注册游戏帐号办法,这方面,中国人有丰富的经验。在这样一个市场上,误杀就更加难免了。我并不是认为误杀是合理的,但是,又能有什么办法呢?

极端一点看,我认为这是Google走向好转的开始。前面几年Google有点令人失望,谷歌就更不用说了。现在一切都重新走向规则和有序,长期看来前景看好。(如果你有美股投资的能力,买入GOOG吧)

四 blog的投入和选择

最后简再说一下关于blog的选择问题。我是03年年开始写blog的,到现在有8年多(我不会用什么"第九个年头"这种词显得自己更早一些),算是中文blog中比较早的,比我更早的人,我都能数的出来。前面提到过,我曾经放过一段时间AdSense广告,到07年撤掉了,之后再也没放过。

最早放AdSense广告更多的还是偏好玩和观察,广告质量下降之后,我认为广告收益远远低于对我blog的品牌造成的损失,我也不愿意让看我blog的人看到太不靠谱的广告。这样撤掉就是非常直接的选择。

blog给我带来的好处不少,比如记录和整理了一些东西,对个人成长有帮助,认识了不少朋友,让别人更了解我的特点,合作的时候会顺畅很多,这些都是无形资产。有形资产也有,比如因为blog而得到的项目,获得的媒体约稿等等。除此之外,当我要宣传自己的产品时,blog也对我有很大帮助。

我身边认真写blog的朋友不少,他们基本都是原创,很少有摘抄型的,这些家伙获得的好处比我更大,有的出书,有的出名,有的彻底改变了自己的生活。

我非常没法理解这次被封的两位,一位干脆直接关站,另外一个为得不到每年400美金的广告费不知所措。难道他真的认为他的名气和机会完全是因为自己足够nb而出现的,并不是blog带来的吗?

blog是一种兴趣,也是一种生活态度,或许我们可以不这么功利的看待这件事,创造并不是一种痛苦,而是乐趣。有一类blog主要内容就是摘抄,他们确实需要保证一定的发表量,这是有点累,但这不也正是他们自己的选择吗?

最后,为了表示对一定给blog找个盈利方式这种短视行为表示讽刺,我决定为blog文章接受bitcoin捐助,bitcoin是一种完全虚拟的货币,确切的说,是一种利用p2p网络产生和分发的虚拟货币。对这个话题有兴趣的可以看云风写的这篇 Bitcoin 的基本原理,非常有趣的。

我的bitcoin address 是 1Gq9Kqt55vTGtxHYAmPiLtS8bw9dAzoosx ,现在网站 https://freebitcoins.appspot.com/正在免费派发bitcoin,每个gmail帐号给0.02个BTC(bitcoin货币单位),你去拿了然后送给我0.01我就很开心了。

关于这个话题还可以看看谷奥创始人gokeeper写的说说 AdSense 帐号被封和写 blog 的心态

---------------------------------
附:考虑很多人上twitter不那么方便,经过@newsinchina授权转载他发的关于AdSense的推过来。

http://twitter.com/NewsInChina/status/70395975189020672

小心翼翼地看着几个IT大拿在讨论ADSENSE封号事件.作为非IT人士但也有ADSENSE帐号的用户,我也说说我的看法.1中文博克实在不适合放ADSENSE,因为广告匹配太差.如果要靠这个赚钱,最好是某个专业产品的网站,比如:美容,养生等.

http://twitter.com/NewsInChina/status/70396372167303168

2.ADSENSE在英文站匹配的非常好,根据你的内容.但在中文站一塌糊涂,无论你写的什么内容,总是出现些男性健康/整容广告,所以你还不如索性就做这一类的网站.

http://twitter.com/NewsInChina/status/70396879078297600

3.据我所知,通过ADSENSE赚到钱(这里指的是挺多的钱)的网站是有的,但都是商业类站点,个人中文BLOG我还真没听说过能靠这个赚到钱.

http://twitter.com/NewsInChina/status/70397833865478144

4.ADSENSE团队是重视和他们认为重要的网站的关系的,可以享受GOOGLE专员电话指导和咨询.比如某个美容/化妆品题材之类的网站.GOOGLE绝对不会乱封他们的帐号,而且会和指导这些站如何放置ADSENSE代码更有效.就是广告位的设置.

http://twitter.com/NewsInChina/status/70398800447025152

5.ADSENSE是极力建议他们认为有前途的商业站点定向投放ADSENSE广告的.举个例子,你的汽车类站点作的不错,ADSENSE就会联系你在你的站定向投放福特汽车公司的广告,这样的CPC会高的多.当然这个待遇只针对那些GOOGLE看中的网站.

http://twitter.com/NewsInChina/status/70399290677272576

6.ADSENSE看中的是一个网站的商业价值,这决定在这个网站的广告价值,GOOGLE也要对广告商花的钱负责.很遗憾,绝大部分个人中文BLOG根本不会被GOOGLE重视,这些站点的各种作弊也令GOOGLE头痛.

http://twitter.com/NewsInChina/status/70400395205287936

除非你是被ADSENSE看上的重要的有价值的网站(月光博克属于这类,曾被ADSENSE作为范例教材),否则你的中文网站的ADSENSE广告点击将十分不值钱,一个点击1美分很常见.

http://twitter.com/NewsInChina/status/70401066004520960

8.被ADSENSE封杀了帐号,确实毫无办法,只能自认倒霉.作为个人站长,只能做到自己不做任何违背TOS的事情,但是对于TOS的理解,这个谁说的清.如果哪一天我被封号,我也只能自认倒霉.但我依然要说,截至目前,ADSENSE是最好的广告商,没有更好的选择.

http://twitter.com/NewsInChina/status/70401930874200064

9.如果你是个人纯BLOG,自己写着玩的,我觉得你挂着ADSENSE可以,但就当这玩艺和钱无关就好了.如果你真指望靠这个赚钱,这不是不可以,那你自己就要动脑子在你的网站上,这就是以广告赚钱为目的的BLOG,定位就和纯粹个人BLOG不同.

http://twitter.com/NewsInChina/status/70402622045159425

10.举个例子,我是卖WORDPRESS主机的,为了业务我也会在GOOGLE做广告,我的设定是每次有效点击0.40元.如果你做的个人BLOG是针对WP主题的,这时候我的广告出现在你的站,匹配度很高,有人点击我的广告,GG至少会分其中的2毛给你.

http://twitter.com/NewsInChina/status/70403272422342656

11.一个美容减肥的ADSENSE广告出现在一个美容类网站上,这样的点击很有效,各方都满意.同样这个广告出现在你的个人IT内容的BLOG上,如果这个广告被点击,很可能就被视作无效,次数多了,广告商不满意,GG可能就判断你作弊了,其实你很冤枉.

http://twitter.com/NewsInChina/status/70403828700299264

ADSENSE经常封杀中文站的帐号,我认为根本原因还是广告匹配度太差所致.广告商看到被扣了很多钱,却没有生意,就会投诉GG,GG的调查结果往往就是站长作弊,所以封号.实际上是广告匹配本来就很差,风马牛不相及.

http://twitter.com/NewsInChina/status/70404634090553344

有些中文博主既想做纯粹的抒发各种个人感想的BLOG,心里又想赚点钱或者希望这个ADSENSE帐号不被K,其实我的建议是从你的BLOG拿下ADSENSE帐号.否则哪天被K了又会纠结.

http://twitter.com/NewsInChina/status/70405355796045825

月光博克可以作为一个榜样,月光定位的是IT资讯,ADSENSE广告也都是这方面的,匹配度高.这样的站被封杀的可能很低.你可以去做个专门的IPHONE内容的BLOG,只要专业有深度,都有望从ADSENSE赚点钱,而且被杀概率低.

http://twitter.com/NewsInChina/status/70405713666641920

最容易被ADSENSE干号的网站内容:万金油似的内容包罗万象的个人BLOG,毫无专业性;大量转贴转载或者改写其他网站原创内容的.

http://twitter.com/NewsInChina/status/70407640345362432

我坚持认为即使是中文个人BLOG,只要你能做到内容有一定的专业性着重于某个领域,内容保持原创.你的ADSENSE收入可能依然不高,但是你被K号的几率小的多.因为你的网站广告匹配度必然会比那些万金油似的啥内容都有的网站好的多.

http://twitter.com/NewsInChina/status/70408430426394624

最后友情提醒:如果你的中文BLOG的内容属于包罗万象的,比如你今天发表一篇关于瓜子的;明天发表一篇肉蒲团的,后天来一篇特供蔬菜或者IT内容的.那么请赶紧撤下你的ADSENSE,等你想到好的niche之后再投放广告.毕竟申请这个不就是为了赚点烟钱吗?

http://twitter.com/NewsInChina/status/70690425974964224

继续谈adsense:你的ADSENSE收入来源于在GOOGLE投放广告的广告商,GOOGLE会分一半左右的钞票给你,所以每个广告的点击,广告商都要付费。所以广告商很重视ROI(RETURN ON INVESTMENT),这也是广告商选择广告平台的最重要考量

http://twitter.com/NewsInChina/status/70690559567732736

GOOGLE在这方面一直是对广告商高度负责的,玩过ADSENSE的人都知道,ADSENSE每个月结算时都会修正你的ADSENSE收入。我听说过的最牛逼得是把一哥们的3000刀修正为150刀,所谓修正就是ADSENSE去除无效点击将这部分钱还给广告商。

http://twitter.com/NewsInChina/status/70690771292004352

对于广告商而言,他们的广告出现在与他们的广告相关的网站内容上,这时候的点击的ROI自然就高。反之出现在与其广告内容毫不相关的网站上(比如杂乱无章的个人BLOG),其广告的ROI自然就会非常差。这也是有些喜欢作弊者喜欢用导流量的方法来赚钱,但很快被K的根本原因。

http://twitter.com/NewsInChina/status/70690868255916032

中文ADSENSE广告的匹配度非常差,很多时候确实站长自己没有任何违规,但也确实从你的网站产生了大量对广告商毫无用处的无效点击,他们不满意就会向GOOGLE抱怨,他们是GOOGLE的衣食父母,GOOGLE很重视。所以这就产生了大量帐号被K。

http://twitter.com/NewsInChina/status/70690961554014208

ROI是K号的最重要考量,现在ADSENSE技术提高了,对于恶意点击或者站长自己的错误点击自己的广告,ADSENSE已经可以识别,在这方面误杀的可能不大。

http://twitter.com/NewsInChina/status/70691046463504384

GOOGLE采用的是对申诉基本漠视的态度。其实换一个角度看,GOOGLE也没法认真对待每一个申诉,否则他们的工作量太庞大,这是不可能的任务。毕竟和百度、阿里相比,ADSENSE还是非常不错的,没有比ADSENSE更好的选择。

http://twitter.com/NewsInChina/status/70691186473578497

如果要避免帐号被K,最重要的还是要选择自己的博客内容方向(如果你确实想赚点ADSENSE的钱),这一点不容易,你要动脑子。

http://twitter.com/NewsInChina/status/70691247211282433

只要你的站点内容有一定的专业性,FOCUS在某一个领域,那么你的站点的ADSENSE广告匹配度会高的多,你站点上的ADSENSE广告的ROI也因此会高,而你的ADSENSE帐号被K的可能性则小的多。

http://twitter.com/NewsInChina/status/70691370054074369

最后建议:想靠ADSENSE赚钱的,还是花点心思考虑英文站吧,同样都是网民。我不得不说欧美澳网民(全球就属这仨地方点击值钱,神马中东地区、印度、中国的流量堪称垃圾流量)素质更高,他们点击ADSENSE广告的热情更高,同时恶意点击甚至COPY别人代码搞破坏的情况极少。

http://twitter.com/NewsInChina/status/70691628775522304

而国人的行为习惯大家都清楚,甚至于我认为一个成功的中文ADSENSE赚了钱的网站都必须低调,不要让无关人士知道你的站,否则恶意点击/COPY会终结你的ADSENSE,你也无可奈何。对此我只能SIGH一声!

---------------------------------

April 1, 2011

数字化版权,接受或反抗

注:这篇文章是为南方周末而写,发表在2011年3月30日南方周末,分别为:数字化版权:反抗什么,接受什么"Google Books侵权"到底怎么回事两篇,内容略有补充和修改。我在这里贴的是原始版本,更原生态一点。

----------------------------------------------------------

去年,我决定从北京搬家到上海。临行之前把在北京八年积攒的书半卖半送给了朋友,暗自发誓再不买纸书。无奈的是除了从amazon买英文书,几乎没有什么靠谱的办法可以正常的买到我想看的中文图书。于是一年之后,家里又重新堆满了纸书。我甚至和一些认识的作者商量,能不能我转帐给你一本纸书的钱,你给我一个电子版,我保证不泄漏出去。答案也都是否定,或者是出版社不允许,或者是这样操作太麻烦。总之,一年的时间,我没能用电子化的方式买到哪怕一本中文图书。需要被电子化和数字化的东西,不止有文字,还有音乐,视频和软件,其中软件比较特殊,天生就是数字化的产物,除此之外它们所面临的情况都是差不多的。

在这几天,和这个话题相关的有两件事值得重视。一件是Google在美国的图书和解协议被驳回,另外一件是百度文库中充斥着盗版终于让中国的作家们愤怒了。

这两件几乎同时发生在两个国家的事情,看上去有些相似,其实本质大有不同。甚至可以说他们分别代表了数字化出版的两极。把这两家放在一条坐标轴的正负两边,中间还可以依次摆上amazon和apple这两个巨头,在他们之间再星罗棋布分布着各种小网站和创业公司。这样,整个数字化出版的生态,就齐全了。

Google激进,Amazon和Apple保守,他们在尝试未来可行的道路。而百度的做法,是为了自己的利益侵害别人。

百度文库不是一套简单的"盗版文章下载系统",而是一个复杂的积分系统。要在百度文库下载,需要有积分,而最快的积分获得方式,是上传文档,并设置积分,这样上传者在别人下载的时候可以分到积分,这些积分又可以用来下载其他文档。这样说起来很绕,概括一下就是:如果你要下载,就必须先上传。如果大家都上传自己创作的文档(或者自己拥有版权的文档)那确实是一件好事,可是哪有这么多人有创作能力呢?于是只能去"借用"别人的文档上传了换积分。这样一来整个模式就变成了传说中的盗窃集团和黑帮的模式,"入我门者,先去偷","入我帮派者,先杀人"。百度文库用这种模式鼓励了普通用户成为盗版者,为百度提供无版权内容,百度自己则试图以"避风港原则"解释自己只是平台,盗版的不是自己,是用户。

百度文库的这种模式是很恶劣的。无论Google,Amazon或是Apple,甚至无数小的创业公司,如果想要涉足数字出版,首要任务都是保护好版权人的利益,一方面维护法律上的公平,另一方面也要通过技术帮助行业正常发展,让创作者得到合理的收益,保持一个正常的生态。百度则完全把创作者踢开,只想自己如何快速积累内容流量并盈利,至于行业如何,创作者如何,他们不在乎,甚至法律如何他们也不在乎。这样的事情百度操作起来游刃有余,在文字之前,他们在MP3上也干过同样的事情。

百度和爱国者电子书合作电子书品牌百看,把这种基于盗版的商业模式又推进了一步。在美国的情况是Amazon和大批出版商签订了书籍电子版的版权,确定了双方满意的分成模式之后销售电子版,为了让读者体验更好,购买更方便,又开发了电子书设备Kindle。国内电子书市场争夺也非常激烈,拥有足够多可供阅读的内容,对于电子书的销售和品牌有决定作用。爱国者基本没有自有版权,又想做电子书,他们干脆和百度文库合作,把百度文库当作内容源。在合作方式和用户体验上,他们复制了Amazon Kindle的模式,唯一的区别是不提版权,完全基于盗版完成。市场已经证明了Kindle是受欢迎的,可想而知,一个基于盗版的产业链会带来什么样的危害。根据去年年底Amazon公布的数字看来,他们销售的十大畅销书电子版销量已经超过了实体书,电子版销售只进行了3年,这个产业的变化速度越来越快。同样的情况如果放在中国,因为百度文库并不需要付钱,就意味着出版商和创作者能赚到的钱减少的速度会越来越快。按照这个速度发展下去,民营出版商会受到巨大冲击,甚至大批倒闭。创作者本来就不多的版税收入也会锐减,这对文化出版行业是毁灭性的打击。

这并非危言耸听,这样的行业毁灭在通用软件市场已经发生过一次。美国的情况不同于中国,他们有完善的版权保护法律,执法严格,百度文库这种模式在美国根本无法出现,盗版软件下载站也不能生存。所以他们到今天仍然有通用软件市场,也有单机游戏市场。在中国,几年前通用软件,个人软件,单机游戏这三个市场已经被完全毁灭。中国最大的通用软件公司金山软件变成了一家靠网络游戏赚钱的公司,金山词霸在日本销售情况很好,在中国不赚钱,可以说金山在用日本的软件销售收入补贴中国的软件市场。当一个市场正常的盈利方式被消灭,剩下的就都是不正常的。所以我们有全世界最多的流氓软件,木马病毒,还形成了灰色产业链。我们不再有早年那些制作精致剧情引人的单机游戏,我们只有粗糙的网游。甚至网游都被私服影响,没法正常的靠卖点卡盈利,只能靠卖游戏中的虚拟装备赚钱,由此又引发了盗号木马等一系列新的问题。我们的网站没法靠收会员费赚钱,只能有铺天盖地强制弹出的广告。在被无知识产权保护而摧毁的软件,游戏行业,因为其模式复杂,尚可以靠转型和增值服务生存。可是作家们怎么办?靠在文章里面做品牌植入,靠免费写书当名人去做广告代言?

Amazon的经验证明了数字出版是肯定会到来的,因此无论是出版行业还是创作者,都应该学会接受新媒体,而不是简单拒绝。电子书比传统纸书有太多优势,环保,成本低,无需物流配送,检索容易。今天在文字上的情况,多年前在音乐市场也发生过,起初人们认为MP3音质不如CD,现在仍然有很多爱好者坚持使用CD,但更多的人已经接受并愿意购买MP3,数字化之后的新市场比传统唱片市场大的多。

唱片行业也曾经和数字化进行过殊死搏斗。在美国不会有百度文库和百度mp3这样的产品出现,当时唱片行业最大的敌人是P2P技术,P2P是一种没有中心网络的点对点传输技术,网络上没有存储内容的中心节点,所有内容都分布在不同用户的个人计算机上。使用P2P技术,没有一家明确的公司会对侵权行为负责,因为每个用户上传的只是一个文件的某一部分,所以也很难追求上传者的责任。唱片公司只好用了一些策略,他们雇人往P2P网络中上传假内容,文件名起成音乐的名字,但实际内容是噪音或者其他无用的文件,这种假文件大量的混入P2P网络,让用户下载体验变的很差,用户下载到的东西往往是不能用的,还有一些crack利用这个机会上传病毒。这段经历好像是在给Apple的iTunes商店模式铺路,用户越来越希望得到一个安全可靠的下载数字音乐方式,就算付钱也没问题。唱片商也终于能够接受了数字化的方式,最终几方一起促成了iTunes商店的成功,重铸了Apple的辉煌,也挽救了正在衰落的唱片业。

在所有数字化媒体公司中,Amazon和Apple相对保守,他们的游戏规则更像人们日常所熟悉的。他们和出版商签约,获得书籍电子版的代理权,通过自己的渠道和技术平台出售。Amazon从传统书籍在线零售基础上增加电子版出售业务,而Apple几年前在数字音乐的发行上也积累了丰富的经验。总体来说,除了和出版商(唱片商)在定价权上的争夺,这种模式没有太多问题。

相对于他们,Google正在推广的模式是激动人心的。以往人们找到一本好书,要么试读,要么看书评,要么等朋友推荐。从本质上说,都是先体验书的某个片段,之后做出购买决定。问题是,这个可供体验的片段是固定的,要么由出版商选出来,要么由书评人选出来,或者是朋友选出来。这些选择未必适合你的口味,可以想象,世界上还有很多书,是我愿意读的,但是我无法找到说服我去花时间读完全书的那个片段,别人也没办法替我找到。Google books要做的正是解决这个问题。Google会在用户搜索的时候,根据用户的搜索,在巨大的书库中寻找匹配的内容,把找到的片段展现给用户,如果用户觉得这就是他需要的,那么可以付钱购买这本书的电子版。这样的好处是展现的片段并不固定,根据搜索条件不同而变化。这样用户更容易找到他们值得阅读的书--正如Google之前在网页搜索上所做的,通过编制索引和公正的排序,让用户找到值得去访问的网站,并给网站带去流量。Google books是帮助用户找到适合的书,并给书带去流量,最终转换成销量。

因为不是固定的推荐某一片段,而是根据用户搜索条件选取,所以Google必须拥有书的全部内容,这就是所谓"Google扫描全书"说法的来源。这里尤其需要注意的是,Google虽然拥有了全书内容,但并不会直接展现给用户,那样是侵犯版权的,Google永远只会展示符合用户搜索部分的上下文片段,这并不侵犯版权。何况按照Google提出的和解协议,仅是扫描和索引这些内容,就愿意付给作者60美金。这是前所未有的模式,也是技术和版权结合最好的方式。顺着这个思路,我们可以想象未来更多可能。比如说,我搜索到了有兴趣的内容,但是觉得为这一点内容买一本600页的书没必要,也太贵,版权持有者能不能允许我只买我需要的这10页?再比如说,能不能和互联网的模式一样,通过展示和书内容相关的广告付给版权持有者收入,而对读者免费?可以想到的可能性有很多,一旦这个模式运行起来,就会开启巨大的长尾市场,给出版商和作者带来原来不可能有的收入。这些,都是过去传统图书不可能做到的事。

用户也可以通过Google books的ebookstore购买全书,或者按照Google展示的链接到Amazon等在线书店购买。美国版权保护严格,出版商地位仍然非常强势,在定价权上Google并不占优势,目前ebookstore的定价是按照书籍上标记的实际定价确定的,而在Amazon购买实体书往往有折扣,所以比较起来从Google购买电子书的价格并不比实体书便宜。对于作者来说,在这种模式下得到的版税仍然是通过出版商获得的,出版商和Google的协议分成比例并不相同,比较多的出版商可以获得70%分成,不同的出版商通过协商有可能得到不同的分成比例。

这是一个伟大的构想,考虑到人类几十年前甚至更久以前创造的书籍和资料,在今天由于缺乏引导,已经几乎无法被普通人接触到,Google Books事实上是在挽救人类的历史和智慧。但这样的计划,为什么会遭到诉讼,并且和解协议最近还被判为无效呢?导致诉讼的原因有几个,包括:


  1. 孤版书和绝版书的版权获得方式问题,一些书已经不再出版了,Google可以从图书馆找到这些书并扫描索引,但是这些书的版权和版权人如何界定。

  2. 图书馆是花纳税人钱的公益组织,等于他们用纳税人的钱买来的书,现在去和Google这样的商业企业合作,这在法律上会导致一些问题。而且如果Google Books形成垄断,最终导致一些图书馆关闭,如果恰好这些倒闭的图书馆中有绝版书,其他地方看不到了,就等于是把纳税人的共同财产转移到了商业企业中。这些问题在美国都是无法被容忍的。

  3. 如果所有的书都被Google Books收录了,Google可以决定如何展示和设置阅读权限,这就造成了垄断,导致公民获得知识的权利受到限制。在美国,这种情况会被认为不公平,也是无法容忍的。

  4. 除此之外还有一系列关于钱的问题,比如出版商和Google谁拥有定价权,图书馆使用Google Books要不要付钱等等。这些都是操作上的细节问题,并不重要。

根据这些问题,Google在09年提出过一份和解协议,并提交法院希望获得许可,这份协议基本上得到了出版商和图书馆的认可。但是其他企业又表达了不满,比如Amazon,Yahoo,微软等等在或者未来有可能在数字出版市场上盈利的公司甚至组织了一个联盟对法院施压。最近这次法官驳回和解协议,其争议主要集中在对于孤立版权作品的opt-out和opt-in,也就是说,到底是默认进入,版权人不满意可以撤出,还是根本不能进入,直到获得版权人许可。这部分书主要集中在不容易获得版权或版权人无法联系等情况,如果一一签订合同会浪费大量人工,导致这个项目难以进行。但如果采用默认进入的方式,又显得不公平,对版权人有可能不利,或者会造成垄断。

仔细了解之后我们可以很清楚的看到,对于美国出版商,版权人和司法部门,在方向上都是可以接受Google的做法,只是为了保护宪法所赋予的公民权利,预防可能发生的垄断,需要在细节条款上做若干约定和限制。这绝不是之前中国作家们所理解的"Google侵权"或者"Google作恶"。或者说,就算Google的做法有错,这个错误主要是对美国纳税人"不够公平","可能形成垄断","可能妨碍公民获取知识",这也算不得作恶。

虽然和解协议还需要调整,但和Google明确签订了版权的出版商提供的电子版本已经可以在Google Books的ebookstore购买了,当然,现在还只有美国的IP和信用卡帐号才能支付。目前的价格并没有什么优势,一些电子书甚至比实体书还要贵,这大概是平衡了各方利益之后的结果。

在中国,数字版权的问题更加复杂一些,出版社对数字版权的态度很不一致,有一些在尝试,一些绝不接受,还有一些虽然在尝试,但希望自己搭建数字化平台,不愿意和其他厂商合作。这些态度导致了实际操作更加困难。虽然百度的做法是这个公司一贯行为的延伸,需要被制止。但解决数字化出版的问题,并不是打压下百度就可以彻底解决的,最终方案还需要出版社,作者和商业公司一起努力,寻找各方都能够接受的解决方案。

无论基于以上何种模式,读者,作者还是出版商,都应该看好数字出版的未来,对于所有行业,数字化都是大趋势,如果转型得当,就能完成产业升级,整个产业中所有角色都可以获得更多的好处。但是在讨论具体的执行细节之前,必须先制止百度文库这种侵略性的发展,制止基于盗版的商业模式和产业链的形成,不然未来面对的不是内容枯竭,就是一个如同今天软件行业充满流氓软件一样的灰色市场。

March 29, 2011

草民跪拜程皇

前天写了个blog,被转载不少。转天见FT中文网刊发腾讯科技频道总监程苓峰文章一篇《韩寒是1微博是0

此文观点对错暂且不说,其中【随同韩寒博客火起来的。还有两篇草民写的博客,被很多V用户称为"比韩寒更精彩,更狠辣"。】一句看的颇为疑惑。从下文描述,这两位草民的文章至少有一篇是我那篇。

草民这词已经多年不见。自从封建帝王时代结束,自民国以来,中国只有公民,再无草民这一说。实在令人不解这说法是怎么冒出来的,难道是程总监文化程度不高,把公民二字误写成草民?想来也不对,既然能在一个市值第一的互联网公司做总监,还给媒体写稿,文化程度不高是说不过去的。FT中文网之前也算靠谱的媒体,编辑也不应该连错字都看不出来。这猜想应该不靠谱。

再看原意,草民这词就算使用,基本也用于自嘲,但用在他人身上,那就是嘲讽。就像程总监可以自称"家慈的犬子"(王仲夏创造的这个说法),但我要冲着他说一句犬子程苓峰,估计他也得跳起来。如果是拿草民二字替我自嘲,那就是说程总监缺点起码的文化修养,好歹也算个文化人,这猜想恐怕也说不过去。

原句说到"被很多V用户称为",莫非这V用户是草民的对称说法,加V就不是草民,不加就是?想这草民一说,是皇权时代没官职的人自称的,如果在新浪微博加V被程总监当做一种官职,那么新浪就被他当作了皇权,对于到现在的概念,新浪微博就是政府。这说法置党和国家于何处?莫非因为腾讯微博竞争不过新浪,就派了他们的总监一名暗中怂恿众人以新浪当政府,好早日给新浪扣一个煽动颠覆国家政权的罪名?这猜想太阴谋论也太宏大,看的我自己都心惊肉跳,不妥,也放弃了吧。

好吧,这词是想不明白了,还是看看这文章吧。

按照互联网的规矩,如提及别人观点,尽量加引用链接,这样读者可以顺着线索扩展阅读。这种扩展带来了更多的知识量和交互,也是知识共享的基础。程先生此文提及别人观点不少,链接反而一个没有,这也是难能可贵的。一般来说,如果不加链接,也尽量应该指出原文是谁写的,以供读者查询。志向远大点的作者,您就算不为了读者方便,假使您的文章能流芳百世,将来人们考古找起来线索也方便,也算好事。做为一个互联网公司工作的人,如果不按照互联网的规则办事,这文章写的就不算合格。

写到这里,我突然明白了什么,翻看程苓峰老文,此人时常辟谷,对不起,我看到这两个字和科技中心总监的头衔放在一起,"顿时就凌乱了"。这样说来也就大约可以理解了,大概是程先生辟谷太多,营养不良,精神恍惚,穿越回了某个朝代,自己成了皇族,看我们这些blogger自然就是草民了,除了跪拜一下程家皇帝,我也没什么别的办法了。

调侃归调侃,正经说说我的希望:

1 在互联网上写文章,要按照互联网的规则来,该引用引用,该链接链接,方便读者,尊重原作者。
2 摆平心态,人没有三六九等,既然来交流,就平等交流。
3 不要过度放大微博的作用,这只是交流方式的一种。

最后,同为FT中文网撰稿人,我认为FT的质量日益下降,至少几年前我所熟悉的FT,不会刊发这种质量的文章。考虑到FT中文网北京办公室正在搬家,大概是工作环境变化,有点浮躁,可以理解。希望FT保持固有质量,不要因为营业额,团队的扩大而降低品质。


March 26, 2011

写给和百度作战的文艺工作者们

我是一个靠写代码生活的人,我觉得我们这个行业,和创造文艺产品的人--比如写书的作家--是非常一致的,盗版问题同样影响着我们,只不过我们用的是和作家不一样的语言来创造产品。比作家们幸运的是,我们可以完全脱离中国市场,去做英文的德文的日文的法文的软件,而且特别不要做中文的软件,这样才能让自己的作品在一个正常市场内销售并获得应有的收益。我们认为中国的问题无解,于是我们放弃了。我们不再愿意创造中国人普遍可用的工具,因为赚不到钱。作家们比我们悲哀一些,因为文化和语言是有民族性的,你们不能把中文的作品卖给其他国家的人,也很难快速学会用其他文字写作。于是,你们只能死磕。

在前面的这些年,大家始终没意识到这个问题的严重性,也从来没有什么行动,虽然你们可能早就从百度mp3下载音乐,下载盗版软件,损害着其他领域的创造者们。今天你们也面临着一样困境。现在痛苦终于降临到了你们身上。

或许你们还记得,不到一年之前,google books索引你们的书,仅仅是索引(用户只能在搜索的时候展现片段内容做为提示),而不是让用户阅读,google就愿意付给你们60美元。但你们嘲讽的拒绝了,你们认为那是作恶。比如王晓峰这篇 《股沟挖了一条沟》 当时我就明白,过不了多久,你们会后悔的,但是确实没想到来的这么快。事实上google books确实没有作恶,他们做的事情和书商摘取你们作品的片段放在广告宣传页上一样,让读者搜索感兴趣的内容的时候,知道你的书中有提及,如果要阅读,需要付费。

数字化大潮势不可挡,这本来是全球搜索巨人释放的极大的善意,这大概也是数字阅读解决方案中,技术和商业结合最好的方式。可惜王晓峰这种自傲的文人认为是作恶。他那篇讽刺google的文字到现在还能搜索到很多,我承认王晓峰影响力不小,但他错了。大部分作家或许都是这样,他们活在自己理解的世界中,不愿意学习新东西,甚至连多想一些都不愿意。在他们的世界里,就是出版卖书赚钱,从来没想到世界变化如此之快。在上一次对google的攻击中,只有韩寒认真的了解了google到底干了什么,并公开发文支持。对这个事情有兴趣的可以读韩寒这篇blog:http://blog.sina.com.cn/s/blog_4701280b0100fzmm.html

而今天你们看到了百度文库可以不花钱看你们的文字,于是你们集体愤怒了。我今天要告诉你的是,这还不算什么,对你们更有杀伤力的,是百度和爱国者一起做的叫做"百看"的电子书。新闻见此:http://tech.sina.com.cn/digi/mp4/2011-02-23/19475209593.shtml 这是爱国者出的电子书阅读器,它的特点是可以直接连接到百度文库。今天你们知道了百度文库是什么,那你们终于可以想象当人手一本这样的电子书的时候,会发生什么。就是人们只要买这么一个设备,就可以想看什么就看什么,而且阅读体验和纸书差不多,可以随身带着,比纸书方便多了。这个计划如果成功,那就是你们这个行业的灭顶之灾。百看我一不小心就会打成白看,这名字起的真好啊。

呵,对于百度和爱国者,他们管这个叫做"希望能将更海量的知识、文档和消费者分享",对于你们,意思是人们再也不用花钱买你们的书了,到时候恐怕不仅作家会死,出版公司也会死,大出版社或许不会死,但他们也只能靠印教材活着了,印厂的日子也不会太好过。要说什么破坏了社会稳定,这东西才是,他会瞬间摧毁几个行业,摧毁文化的基础。盗版从来都不是最可怕的事情,最可怕的事情是成建制的盗版,百看和百度文库都是成建制的盗版。所谓成建制的盗版,意思是说盗版者不需要付出任何东西,甚至不需要知识和技巧,直接就可以"享受"盗版,这种盗版用起来比正版还舒服(正版无论如何都要有个购买过程,总是多了一步)。这时候,谁会傻瓜的麻烦去付钱呢?在和成建制盗版对抗的过程中,我们软件作者们想出了最多的花样,各种加密,各种功能限制都被用来保护软件,软件作者以牺牲产品体验为代价进行加密,甚至曾经不惜破坏盗版者的电脑。最终的结果,是我们失败了,至少在中国失败了,到今天还有专门盗版iPhone软件的网龙活的很好,并以此做为盈利模式。幸好在美国,通过法律,大家都成功了。对于搜索引擎所谓的"避风港原则",美国也有"数字千年法案"应对。(google的数字千年法案看这里 http://www.google.com/intl/zh-CN/dmca.html )。按照这个历史看,如果不改变方法,对文字作品的斗争,在中国一样会失败。

这次所有作家写出来关于这件事的文字,看着都是那么的无力。请问你们面对抢劫者的时候,哭穷,叫惨,这些都有用吗?没用的。你们需要战斗,而且要用自己擅长的方式来战斗,把对方拖入你们擅长的战场中,并击败他。对于作家,我觉得最好的办法就是用文化摧毁对方的品牌。做法很简单,不用正面去攻击骂对方,你们只需在自己创造的文化作品中,让作品中的角色说话。比如很酷的主人公会对别人说"用百度真丢人",漂亮的女主角拒绝追求者的时候会说"你还用百度,这么土,我才不跟你交往"。我这只当扔块砖,具体的技巧你们擅长,就像前面提到王晓峰那篇愚蠢的blog,影响了很多人,他们会拿着这个来说"你看,google也作恶嘛"。作家本身就是媒体和文化的创造者,你们有能力不依靠别人,仅靠自己在文化和品牌上摧毁对方。。特别需要注意的是,"把作品中反面角色的名字起成李彦宏"的办法并不好,因为你们要对付的是百度这个品牌,并不是其创始人。换言之,李彦宏卸任百度CEO,盗版的状况大概也不会变好。

前面很多年,google被欺负你们不说话,甚至你们还参与欺负google。现在,你们知道了google的好。虽然我觉得你们活该,但现在还不算太晚,来战一场吧!这战斗不会一帆风顺,因为对方有钱,你们很有可能会被要求删除相关内容,很有可能百度在你所谓的媒体投放了巨额广告,你的领导要保护他。但这其实都不算什么,百度虽然势力庞大,但也比不上***强大,你们不也在作品中变着方的挖苦他们吗?这就是所谓"你们擅长的战场"。

你们大概会质疑这种办法的效果。这确实是一个长期的缓慢的过程,但确实有杀伤力,文化的威力,你们最清楚。只不过,你们得丢掉心理的幻想,不要觉得对方是可以谈价钱的。你见过拉磨的驴子和主家谈价成功过吗?对于百度,你们就是那驴子。这是你死我活的战争,甚至不是你们自己的战争,是文化行业的战争。请你们不要拒绝新媒体,传统出版一定会消亡,而且消亡速度在逐渐加速,要学会正确的使用新媒体。或许当你们这么干了,百度会付出公关费来摆平你们,他们现在每年也支付着大量的公关费对付各种负面,但这些钱不会给你们这些创造内容的人。甚至将来百度变成唯一渠道的时候,你惹急了了他们,他们会干脆在搜索结果中封杀掉你。如果大家都用百度,你这个人在互联网的世界就像不存在一样了,不要以为荒唐,这就是现在网站站长们碰上的问题。所以现在动手还不算太晚。除此之外,你还能做的了什么?

至于不用百度还能用什么,我的妈妈65岁,用google几乎所有的产品。其他,你们自己看着办。

Google退出中国的时候,你们一声不吭,之后的两个月,你们对google books口诛笔伐。今天,如果你决定不做什么,不写什么,至少也应该把我这文章让更多人看到吧。

注1:王晓峰并非错字"王小峰(真名王晓峰,笔名王小峰,网名带三个表)" 来自互动百科

注2:去年我写过一篇关于百度和google的blog,如果你看完本文有兴趣知道更多,请看这里 http://blog.devep.net/virushuo/2010/01/14/blog56google_blogtinyfool_1_go.html

March 23, 2011

关于ruby/ror我的体验和看法

这几天在twitter上说到不少ruby到底好不好的事情,总结一下,写了这个blog。

今年年初开始我打算深入体验一下ruby on rails,对我来说,已经很多年没有接触"新语言"了。在这个深入体验开始之前的几年,也有若干次浅尝辄止,基本都是玩了几下,觉得要学的东西真多,用PHP顺手写一个也很简单嘛,就放弃了。

但我想一个东西迅速风靡世界一定是有原因的,就算我最终不去真正使用它,弄清楚背后的原因也是值得的。于是我就放下了老程序员的心态,像一个初学者一样从最基本的文档看起,尝试各种大家称赞的项目,搞不懂的地方就去问熟悉ruby的人,不仅问如何实现,还要问"为什么会这样","过去什么样","其他语言解决某个问题的方法在这里如何对应"。几个月下来,虽然我还没能用ror真正开发一个完全独立的项目,但总算是有了一个全貌的概括性了解,也知道了历史和文化,体会了社区的氛围。这个时候,我想大概是可以对rails发表一些评论了。

在这一次尝试之前,我最担心的事情是"性能问题",现在看来这是一个伪问题,首先ruby的性能并没有这么差(前几年确实不太好,不过现在已经很好了),其次,用来做一个网站应用,无论是什么语言,最后都要依靠缓存和分布来解决,也就是说最终都要依赖于正确的系统架构,而不是语言本身的性能,最后,就算是性能真的差又完全不可解决的问题,完全可以用效率更高的语言来写,把处理的结果通过各种通讯方式交给ruby就是了。在计算机硬件发展到今天这样,性能问题大多不存在,只有架构师水平的差距。我见过很多用了几十台机器的系统但抗不住几十万的负载,这能怪语言和平台本身的性能差吗?

在所有关于ruby优点中,我唯一不能认同的是"学习曲线平缓",事实上,ruby的学习难度比较高,确实远远高于PHP,要说平缓,大概是相对于J2EE的平缓。我相信这是很多对ruby误解和攻击的来源,从表面上看起来,要学会ruby尤其是ror,至少需要理解设计模式,知道服务器系统的运作方式,甚至需要熟悉操作系统,要用好ror,更需要接触各种项目和各种标准,这些都需要花去很多学习时间。同时配合的还有各种测试工具,部署工具,虽然不是必须,但最终还是要学的(这里我还欠缺很多呢)。我曾经开玩笑说ruby社区的人破坏了英语的纯粹性,因为他们fork新项目太容易,大家都喜欢创造各种开源项目,直接符合功能的名字都被用光了,于是只好用各种奇怪的相关的英语单词,以至于搜索很多英文单词竟然会找出来ruby的项目。这些东西直接塞给一个初学者确实有很大的压力。ruby on rails的Getting start又太停留在表面,勉强算是尝鲜,距离真正实用差的太远。相对来说,PHP就简单多了,页面直观对应在PHP文件上,什么都不用懂也能写(当然写好也很不容易),这造成的结果就是谁都可以懂PHP,但不是谁都能懂ruby。人们为了掩盖学习的痛苦,就容易去攻击对方无用。在我这次下决心深入学习之前,我也觉得PHP最好,记得之前某次尝试的时候 @rainux 跟我说,刚刚上手是很难感觉到ror的好处,需要持续用一段时间才会慢慢发现。

ror在架构和开发流程管理也坚定的支持了很多理论,比如MVC,比如敏捷,比如TDD...这些同样增加了学习成本,当然也增加了被攻击的接口,比如:TDD太扯淡了,所以ror也扯淡。或者:我最讨厌敏捷了,所以也讨厌ror。实际上,敏捷和TDD本身都没错,他们都有成熟的方法论和实践,有足够好的工具配合,能解决很多问题。如果不认同这个,只能说是开发和项目管理经验太少,没碰上过复杂问题。有错的是对敏捷和TDD的错误鼓吹,两者不能混在一起。

另外一个常见说法是寻找ruby的大流量项目案例。但其实寻找ruby开发的"top项目"没意义。DHH和37s创造的都不是适合所有人的产品,他们只愿意在某一领域做到最好。不是所有人都有兴趣创造亿级别产品,何况也没几个人真能做成。对大部分项目,千万是一个很好的级别,那是ror最佳实践领域,而在现实中,大部分项目能做到100万pv,已经算了不起了,想亿级别pv的技术方案未免过早了。

在组织技术团队的问题上,流行语言的难度是差不多的,10个人的团队任何语言都很容易组织起来,但换个角度看,任何语言也很不容易组织10个人的团队,只不过难的方法不一样。A语言可能是找人难,一周就收到1份简历,B语言可能是鉴别难,一天收到200份简历,看都看不过来。其实最难的事情是组织一个10个人的靠谱团队,这个团队用什么语言相对于寻找10个靠谱的人的难度可以忽略不计。

选择一个语言,并不是选择语言本身,同时也是选择社区。ruby社区的活力,友好,规整,统一的审美,给我留下了非常深刻的印象。DHH和37s对这个社区影响巨大,我也相信他们的理念,小公司未必不好,小公司未必不伟大,追求pv不如追求极致的产品。我们创造一个产品,是为了解决一类人的问题,并不是为了超越谁或和谁竞争。

15年前,PHP 3.0之前的版本完全不可用(当然,那时候PHP的简称还叫做Personal Home Page),那时候用c写cgi/isapi或者用perl是网站最常见的开发形式。那时候说PHP是下一代语言,很多程序员都会不同意,他们会挑出来PHP一万个不如c或者不如perl的地方。这些都没错,但世界是会变化的。PHP今天确实成了一种应用广泛,老幼皆宜的语言。我并不认为未来ruby会取代PHP,但至少,我认为下一代高质量的互联网产品出现在ruby社区的机会更大,这就像当年PHP vs perl一样,乃大势所趋。

最后我说一句可能不太好听的话,如果你没有下决心转型成为一个写信教主那样的专门忽悠的人,如果你还觉得技术有点意思,还想自己创造点产品,那么应该保持足够的技术敏感力,认真的学习一些新东西,而不是给自己寻找各种借口。就像这张漫画一样。要多问问自己,是这东西真的不好,还是自己学不进去了?当然,承认后者是很难的。一年前我也确实没学进去。

我学ruby的过程中,很多朋友提供过不少帮助,没有他们的回答和blog,估计会学的更难。在此一并感谢: @rainux @robinlu @moming2k @Anxonli @soulhacker


抓虾
订阅到有道阅读

Subscribe in NewsGator Online
Add to Google
Subscribe in Bloglines
CC License. Some rights reserved.
署名·非商业用途·保持一致
本站之所有未作特别说明的内容均使用 创作共用协议.
POWERED_BY_MT_3.2