« Widget星球 | 回到主页面 | 「你的夢想,自己會來找你。」 »

September 07, 2007

塔哥的指点

关于Widget,塔哥说:

“如果样本数量足够大、变量足够充分,在充分记录、比较每个人的各种信息之后,电脑几乎可以充分了解一个风格、取向、爱好,并进而推荐适合他需求的信息。”

这个说法不是非常严谨。从理论上,能够无限逼近真实分布的前提应该是,让我们假设变量是离散值,比如是三值的(是,否,不知道),那么如果样本数量n趋近无穷,变量数d也趋近无穷,那么必须有n/(d^3)也趋向无穷。就是样本数的增加速度必须远大于变量可能的组合数。

但是现实世界往往是反的,样本数永远是有限的,因为上网的人是有限的,但是可能的变量是可以不断增加的。所以进行机械的穷举的结果就很可能是找到很多碰巧的事情,按照data mining的意思,这种东西是要避免的,data mining要找大趋势。换到统计上说,就是你找到一个模式/规律,首先必须有足够多的样本支持,其次要有独立的样本来肯定你的发现。这个,一个没法理论化的东西就是选择合适的变量。事实证明,好的搜索算法在海量的变量中找出一个规则,远不如一个差的搜索在几个非常有机会的变量中搜索有效。这个,就需要做mining的人的个人技巧了。

说回来,我觉得这个跟widget没啥关系。这个说的就好像你以前提的,google胜在哪里?胜在它存储收集信息的能力。有了这些海量数据,配合上合适的分析,就有了别人无法企及的有效的传播发行渠道,自然会有人找上门来。imdb本身就是一个无形财富,因为它有无数人的欣赏习惯,这个对于卖碟的,是个无价的财富。同样,netflix里每个订购者的看碟习惯和清单,也是无形财富。这些,都跟widget无关。widget是内容,你掌握了发行渠道,最有效的发行渠道,自然会有好的内容出现。但我不认为这里有多少共生关系,这东西又不像ps3,你必须用你独家的开发工具,别人如果能提供更有效的发行渠道,苍蝇自然要吃别人的肉。赫赫。

非常聪明的说法。

由 张亮 发表于 September 7, 2007 02:51 PM

评论

呵呵,我也觉得前篇文章结论下的有点快
widget是象RSS一样大家都认可的形式?还是某个创业家的大事业?前者很好理解,乔布斯也可以用widget干点事,就象他们也用RSS。后者谁要是能一家独大,还是?芾训摹3齈AYPAL的规模,恐怕难。PAYPAL控制了整个支付流程,而普通widget受制于流行样式、流行功能,可能会出现最大的widget网站,但是规模大不会让用户更加青睐你。我现在用PAYPAL,发现对方如果能用PAYPAL对我来说太方便了,如果不是PAYPAL是什么CHECKOUT之类的,我就疯了。


不过文章写的真好

有朋友老跟我说张北海,我看了他的书之后,觉得国内很多杂志记者写的报道比他写的好,只不过张北海在美国,而且具备野心和格局罢了,记者能写的比他有趣多了

hht 发表于 September 7, 2007 04:57 PM

PS3需要独家开发工具??那么育碧这样的外包开发公司不是惨的尿片钱都没得啦

张一谋 发表于 September 8, 2007 11:20 AM

呃,爸爸我无法在你的饭否上跟你说话,所以来这里跟你说:“回家了以后你应该看的,是the l word”…

Ex 发表于 September 24, 2007 10:55 PM

发表评论




记住我?