少年心气 - 艾伦·斯沃兹(Aaron Swartz) 的传奇

艾伦·斯沃兹 (Aaron Swartz) 于美国时间 2013 年 1 月 11 日在纽约自杀。终年 26 岁。

他是什么人?一个程序员,技术作家,互联网活动家,还曾是个不折不扣的少年黑客,一个传奇人物。早在 14 岁的时候他就参与制定了 RSS 1.0 的技术规范,并成为 W3C RDF 核心工作组成员,因而有机会和蒂姆·伯纳斯-李这样的互联网先驱合作。。艾伦·斯沃兹在哈佛斯坦福大学读了一年后辍学,在 Y Combinator 夏季班孵化课程上创建 Infogami 软件公司,不到一年的时间 Infogami 并入 Reddit,他成了 Reddit 三位创始人之一。之后 Reddit 被 CondéNet (Wired 杂志的母公司)收购,不过在 2007 年 1 月,他被 CondéNet 莫名解雇。Infogame 是一个 Wiki 平台,曾被他用来支持 web.py 以及 Open Library 项目。

2009 年九月,他与几位技术同道创建 Jottit ,与 Infogami 相似的一个网络服务,为了有效支持 Jottit (一说是在 Reddit 的工作期间), 他开发了 web.py,这个 Python Web 框架在 Python 社区有广泛影响力。在技术领域,他还与 John Gruber 共同设计了 Markdown 规范。

艾伦·斯沃兹是维基百科的活跃志愿者,他开发过类似的网站甚至早于维基百科。他对维基百科的分析文章 Who Writes Wikipedia? 获得了广泛关注并被广泛引用。他是 The Semantic Web: A Network of Content for the Digital City 一书的共同作者。 学术方面,作为研究员完成了在哈佛大学伦理中心实验室关于体制腐败的研究工作。在那里,他与 Lawrence Lessig 教授进行了合作。Aaron Swartz 对政治和社会活动相当热衷,先后参与组建多个非盈利组织,2010 年,发起了 Demand Progress 项目,组织抵制互联网审查(SOPA/PIPA), Aaron Swartz 是最初的抵制活动发起人之一。

艾伦·斯沃兹强烈拥护信息的自由传播,他于 2007 年领导开发了 Open Library 项目,该项目宣称将收集每一本出版过的图书的信息。他于2008年推出了「游击队自由访问宣言(Guerrilla Open Access Manifesto)」,宣称不论信息存储在何处,他们都将义不容辞地「获取信息,建立备份,并同全世界分享」。

在 2009 年 ,艾伦下载了大约 20% 的 PACER 数据库的内容(正常访问每篇要付费 10 美分)并且公布于众,随即被 FBI 调查。此事最终不了了之。

他的人生转折点在 2011 年 7 月,艾伦·斯沃兹入侵麻省理工学院网络,下载了著名的期刊数据库 JSTOR 上大约 500 万份(一说是 480 万份)学术论文和评论文章,随后被捕并被诉讼,如果所有罪名成立,斯沃兹将最多获刑35年以及上百万美元的罚款。此事在美国互联网和学术界引发广泛关注,超过 4.5 万人为他签名请愿。这件事情给他带来了相当大的麻烦。Alex Stamos 的这篇文章阐述了诸多事实,家人和朋友深信艾伦·斯沃兹在这一事件上受到政府不公正的对待,间接促成了悲剧。目前不确定他的自杀是否与此事有直接关联。艾伦·斯沃曾自述长期受抑郁症以及各种病痛的困扰。

迫于公众压力,2011 年 9 月 6 日,JSTOR 宣布将来自 200 多种期刊的近 50 万篇论文向公众开放,全部免费提供给公众使用,不需注册也不用顾虑所属的机构属性。很多人认为,此举不过是 JSTOR 的公关行为。

离世前,他为 Avaaz 基金会工作。这是一个非盈利组织。

以上描述仍然无法概括 26 岁的 Aaron Swartz 做过的所有事情,比如他和 Taryn Simon 的作品 Image Atlas (2012) 曾被 New Museum 作为特色作品选中, 不管怎样,这样一个天才黑客,如此年轻离世,对这个社会是一个巨大损失。

蒂姆·伯纳斯-李爵士在 Twitter 上哀伤的写道: 「Aaron dead. World wanderers, we have lost a wise elder. Hackers for right, we are one down. Parents all, we have lost a child. Let us weep.」

感谢 Aaron Swartz 为互联网做出的巨大贡献!

Smells Like Teen Spirit,少年心气。

今天不想说什么小道消息,把这则信息仔细整理了一下,期待更多人读到,知道世界上曾经有过这么一个年轻人。

人不学习要落后

今天研读了一下这篇论文「网络流量分类研究进展与展望」。前段时间曾经有大量的 VPN 等翻墙方法失效,据信与这篇论文有一定关系。

0

这篇论文的研究由臭名昭著的方校长领衔,介绍了流量分类研究的进展及面临的挑战,并提出了相关挑战的解决方案。这类研究的目的是什么呢? 「不仅可以帮助网络运营商提供更好的服务质量,而且能够对网络进行有效的监督管理,确保网络安全。」重点在「对网络进行有效的监督管理」,也就是说老大哥要盯着你。

而已经有的网络流量分类研究的方法有哪些呢? 主要有四类:基于端口号的分类方法、基于有效负载的分类方法、基于主机行为的分类方法,以及基于机器学习的分类方法,当然他们有各自的优势和不足,及适用的场景。其中基于机器学习的分类方法,对于前几种方法不适用的情况依然可以奏效,研究人员相对比较兴奋。

SSH 隧道流量分类的研究已经基本不存在障碍了,因而最近一周内,境外 IP 的 22 端口,有翻墙流量的基本也被封掉。至于 HTTP 流量的的细粒度识别,基本已经没什么难度,对于 Facebook、Gmail、Youtube 的识别准确性,高达 93%。所以,HTTP 层面是一封一个准儿。

除了 P2P 之外,Skype 一直是一个异类,因为国外不少电信运营商也对 Skype 比较忌惮,一直在研究 Skype 的流量特征,不过 Skype 一直在升级,不断的消除自己可被识别的特征,上面提及的四种研究方法奏效不大。

最近微软不是说要在全球范围内关闭 MSN Messenger 服务么?独独保留中国大陆的 Messenger 服务是为什么呢? 商业层面的考虑肯定会有。另外,如果中国用户都切入 Skype 的话,监控这个事情就不太好做了,而 Messenger 的所有聊天内容都是非加密的,可监控的,包括你说的每一个字。

Skype 则不然,协议是加密的。当然我说的是国际版的 Skype,而不是 Tom-Skype,Tom-Skype 「会根据关键字将用户的文字聊天记录和用户信息上传并存放在可以从公司外部进入的8个中国大陆服务器上」,所以,我一直说中国互联网用户没有隐私,隐私个屁,无脑青年一说隐私,老大哥就发笑。

论文同时「遗憾」的指出,针对网络协议动态变化时的流量分类技术的研究还未有效展开,比如流量混淆: TOR 推出的 obfsproxy (模糊代理)。但我有理由相信,我们国家怀着「崇高使命」的青年科技工作者们已经针对类似课题展开相关的研究并且已经有实质进展了, 至少我相信在方校长的有生之年是可以做到的。

一切阻碍信息流通的行为都是反动的,落后的,卑鄙的,不管他们觉得自己的动机多么正确。这是逆历史潮流而动。有良知的互联网人应该唾弃这样的行为。

今天的内容可以会让不少朋友看不懂,没事的,即使你看不懂,我相信将来你的儿孙会看懂,我们的后代会看懂。

这是历史。

今日小道消息:有人爆料,近期百度正在与金山网络、腾讯及相关投资商谈判入股,目前已基本确定将控股金山网络,腾讯方面也已同意。我觉得这事儿怎么不太靠谱呢?金山网络到底有啥值钱的东西阿。怪事。百度入股微博还是挺靠谱的事儿,入股个金山网络有个毛用。

第二则小道,有人说中华英才网被爱尔兰尚龙集团收购。这个尚龙集团,在国内收购不少网站了,号称「全球15个区域,27个国家运营超过500个网站」,怎么看着感觉带着一股妖气呢? 至少我的直觉如此。

昨日的图,应为「捕鼠器或是捕鸟器」,有叫「夹子」的,西北有的地方叫「夹脑」… 很多朋友都答对了,没法发神秘大奖了,干脆统一颁发一个「见多识广」称号。

友情提示:小道消息的所有历史内容可以通过 http://hutu.me 获取.

友情提示:本人的个人站点已经改版上线,地址是 http://dbanotes.net/ 看看不费电,不看会后悔。

总有些聪明让我们泪流满面

1. 淘宝有人销售 代挂 「QQ 显示 iPhone 在线」的服务. 生意好的已经卖出几百笔了。

2. 有卖家在淘宝上用「一元秒杀」套取用户信息,将拿到的信息用来做营销。

3. 电信的 ADSL 路由器和光猫,有人提供所谓的远程破解,淘宝上也有人卖这个服务。

除了这些小聪明,我看过更多是属于无脑而遇到神仙的。比如说,某神奇老中医给孕妇开个「祖传秘方」,说能让孕妇生男孩,当然药物比较贵,不贵如果药不灵的话,费用如数奉还。

结果呢,无数去求医的人到处说,真灵阿…

看不出来其中猫腻的人智商不够,傻子都知道有 50% 的生男孩儿可能性,骗一半人的钱就够了。可是,这样基本的骗局,现实生活中就是有很多人上当。这就是所谓的「存活者偏差」的最简单版本,因为死掉的人(不准的)不会说话。

其实是某种形式上的数学问题。傻子太多,骗子会九九乘法表就够用了。

小道辟谣

今天看到爱范儿上有「业内人士」写「虾米网」的报道说如是说:
「网站创始人王浩是阿里巴巴早期的技术部员工,业余爱好就是玩乐队,后来毅然拉了几个同事出来另起炉灶开始创业,真正的根据兴趣来创业。据说,早期天使投资 200 万的是张英(马云的夫人)。」

张英是投资人?这个说法实属扯淡。虾米网跟张英有个毛关系阿。不带这么黑的,太阴谋论了,张英投资口碑网的案例你们听多了吧?

你推荐的那本书有没有电子版?

经常看到有人问「你推荐的那本书有没有电子版?」

这么问的潜台词其实就是「你告诉我网上哪里可以下载到盗版?」 要我说阿,绝大多数人一年都看不完 20 本书,20本书满打满算也就一千块人民币。别说你就缺这一千块。还有人说你误解我啦,我不是想看盗版,我是想着环保呢,有电子版我也会买… 你看,这么一说很容易绕到盗版的问题上去了,这是几辈子纠缠不清的问题。

那么我是要说什么呢?如果有人告诉你,读完了这本书薪水能涨 20% ,请问还有几个人会到处费那么大劲找电子版? 肯定都立马自己掏钱直接网上下单,隔日送达。偷着研读了… 所以,有人问「你推荐的那本书有没有电子版?」其实他就没当这是个多重要的事儿。是这么个理儿吧?

今日小道:其实阿里收购虾米的事儿,我之前在小道消息里说过了阿,为啥没人关注呢?媒体的朋友们,专业意识不够嘛。至于拆分事业部的事情,没啥可评论的,洗洗睡吧。

友情提示:被新浪微博关小黑屋的朋友可以用 OS X 10.8 或者 iOS 6 的微博发送工具发图片微博,别发文字,我没有真正测试,因为还没被关小黑屋,被关了的可以试试看。

题图:不堪一击 作者:方少华 (你看,我用这张图其实也是盗版阿…)