。把在客栈刷碗多年,多少有点口水战抗体的店长也给吵烦了,喵的,今天非得把事情说清楚不可。

ok,搜狗是个自称“更懂网络”的搜索引擎,它们最近比较多分支服务,其中一个就是搜狗拼音输入法,2006年6月左右的产物,老特点是词库很大,最新特点是风格皮肤很多,当然也只能说是适应需求而已。

right,Google原来也是个搜索引擎,目前其在中国的分部称为“谷歌”,最近(准确时间是2007年4月2日)深居简出的开发人员们也推了个谷歌拼音输入法出来,特点之一也是词库很大。

问题在于,到底要多大的词库,才能正好对上特殊人名,才能正好同时出错?

1annoy.jpg

这点鸡毛蒜皮的小事也好吵?这可是弱肉强食的网络世界,你认为搜狗被谷歌咬着了不会主动站出来喊痛?当双方的搜索数据库都要以TB计算时,区区MB级的词库有99.99%的相似度又是否很奇怪?双方的单词库都通过大量相似的用户数据生成,谁又有权利宣称自己拥有某个词库的“所有权”?

事实上,谷歌完全可以“盗取”搜狗的词库,对比自己的数据库,添加新的单词,修正错误的部分,然后笑着发布“新”产品。请问搜狗能怎么告谷歌?估计顶多能让谷歌移除“不应该出现”的人名吧。反之,就算搜狗也“借用”谷歌的词库,谷歌也不会蠢的动用自己的使用条款来对付搜狗吧?这将会是一个打不完的官司,所谓的铁证完全可以在服务器端伪造或证伪,我们通过浏览器在客户端发掘的信息不过是冰山一角而已。(当然我倒认为两家对输入法市场垂涎三尺的公司该上法庭去对质,用不知所以理由的趁热打铁,最后庭外和解各付表演费用50%,皆大欢喜。)

有趣的是,就算我们每年往词库里丢过百超女,过千动画,过万句话,词库总大小也只有这么大。所以说真的,让他们折腾去吧。搜狗喜欢公开修正单词,谷歌喜欢暗地里努力都是他们自己的事,用词库分胜负绝对是网络新世纪的笑话。

与此同时,店长也发现,没什么人在谈“免费”的谷歌输入法(准确的说是Google谷歌的“拼音输入法”)的背后巨大商业前途。我不解,虽然中国素有“爱屋及乌”一说,虽然搜狗的部分宣传让人恶心,但只对搜狗横眉冷对也实在太便宜了谷歌。

这次词库纷争国内Blogsphere有名的几位都打了个擦边球,洪波说搜狗最近功能太花哨,不够塌实,而William Long则息事宁人的说“中文输入法本来就类似一项公益事业”……这算什么,谷歌对市场的进攻就值这么点墨水?(喂,都无纸化了!)

不对,正如Techcrunch在从去年末今年初连续报道Google多个服务的失误时作者Michael Arrington的原话——

They can’t kill the motto, so they need to live up to it, permanently.

他们不能扼杀自己的座右铭,因此他们得永远与之共存。

爱屋及乌是一回事,到了市场竞争又是另外一回事,如果谷歌真有心做公益事业,为什么他们不把输入法放到code base下?为什么整个公司使用Linux人数在85%左右的公司会先开发Windows版本的输入法,尤其是在类似SCIM(Linux上的输入法)开发人员苏哲也已加盟谷歌之后?我讨厌阴谋论,可惜这是该死的输入法阵地,除了阴谋论已无其他解释——

谷歌很想知道你在想什么,可能比你妈更想。

(但它也许并不想知道你是谁)

因为你其他的“免费服务”上有ADs。而当你拼死拼命想买个超女DVD时,谷歌会很乐意协助你。当然,是通过某些巧妙的方式,绝对的公平竞争,绝对的不作恶。

Google Talk是网络聊天工具,到底打不过大众化的QQ和MSN;Gmail是优秀的网络邮件,但用户量距离早已起步的Hotmail和Yahoo Mail还很遥远;至于Google搜索本身,除了到今天我们还不想用cn外,来自百度的压力也很够呛。

“HI!老板!我有个好主意!这办法“允许”用户自愿选择是否连接服务器,只要他们愿意,我们随时随地都能收集数据!”

啊亲爱的,你说这是什么呢?

Windows拼音输入法的阵地上还剩下什么?著名的紫光和微软多款?对于动画迷来说,连绫波丽,明日香,工藤新一,毛利兰,灰原哀,卫宫士郎,远坂凛都不认识的是不是太落后?对于工作人员来说,Google和Microsoft每次都得输入这么多字母本来就是浪费时间……你需要Google的公益事业帮助你吗?来,免费的输入法,拿着。

店长对谷歌的拼音输入法仍有保留,至少我还没到非告诉谷歌我要买Wii不可的地步。

哦对了,为什么我不谈搜狗的邪恶?因为不用谈,截图即可。

1data.gif

请告诉我这数据怎么来的。

1state.jpg

希望某作者不是吃了一记闷棍。

1style.jpg

我有4G内存,4核CPU和4颗GPU,我觉得我的输入法太快了!

说实话搜狗的数据库大概不足以制作太好的英文输入提示,我只能为此表示哀悼了,数据量谷歌还是更有底气,你们努力吧。

说到底,为什么谷歌和搜狗没吵?因为他们吵必烧钱,与其烧钱,不如赶快分饼。

至于口水战等杂务,留给fans里喜欢血刃的各位吧。

完。

继续阅读

“ Pinyin Input: Thy glory shines upon Market Share. 拼音输入法,搜狗或谷歌,一切为了市场。 ” 已被炮击3次

  1. 認真看完了,分析的滿透徹。不過呢……
    與其這些輸入法,我更習慣予使用微軟拼音輸入法3.0版
    (為什麽呢?
    (笑..
    大家都在乎于輸入法的簡化便利,但是有沒有發現,無論是最近吵的要死的搜狗與狗狗輸入,還是去年據稱下載最多的第3方輸入法紫光。都無法完美的輸入[繁體]文字……
    我對連[什麽]的繁體文字都可以用[什么]代替的輸入法完全保留意見,不能說是失敗,只能算是失望。

    下載的头像

    #1

    下載

    乘坐着 Firefox 2.0.0.3 Firefox 2.0.0.3 与 Windows XP Windows XP

    发射于 10:10 on April 6th, 2007 [回复]

  2. 滿臉笑容地為樓上 +1

    Ling的头像

    #2

    Ling

    乘坐着 MyIE2  .net clr 1.1.4322 MyIE2 .net clr 1.1.4322 与 Windows XP Windows XP

    发射于 19:38 on April 8th, 2007 [回复]


Trackbacks & Pingbacks:

  1. [...] 搜狗拼音输入法 Google谷歌拼音输入法与盗用搜狗输入法字库 Pinyin Input: Thy glory shines upon Market Share. 拼音输入法,搜狗 … Google拼音输入法诞生了! Google谷歌拼音输入法–下载来用吧.. [...]

比特客栈的连珠合璧

比特客栈的东奔西走

比特客栈的旁门左道

News at: [2010/03/02 - 02:04] [2]

今天中国把Disqus.com(跨网站的留言互动服务)给封了,一如之前的Tweetmeme按钮地图炮,这次又会有一大批网站(例如mashable和scobleizer)无法直接查看留言和间接被大幅度降速(遇上Disqus的JS库时要等待超时才能继续读取页面)。现在就看哪天Google和中国闹翻,政府对Analytics或API发射地图炮了。

提问:中国IT公民安分守己的日子还可以保持多久?

更新:这次切断似乎并不完全,是不是又一次海外CDN封锁,我仍在调查中。

News at: [2010/02/27 - 03:24] [15]

原来是Daughtry的歌,后来Westlife翻唱了,于是很多网站上有MV。有趣的是,国内网站通通只有一个版本,Westlife的雪地基情版。找了很久,仍只有聊聊数个现场版与特辑……这着实让我非常的不解,一首燃歌,有啥不行的?直接跑到Youtube版,一看,原来是Daughtry燃错地方,所以他们把它浇灭了,慎密而仔细的。

但他们忘了,有些火种是不会熄灭的。它们只是在等待,等待着人性的光辉。它们仍会发光发热,一如人类祖先发现它们的那天。

进入漆黑的房间,我们知道及时开灯。若未来一片漆黑,我们会在何时点灯?

What About Now ?

via youtube

News at: [2010/02/22 - 17:49] [4]

其实中国的老百姓走向街头和我们西方是不一样的。西方人走向街头讲的是权利,而中国人走向街头的讲的是规则。

不管你是什么人,戴着什么有色眼镜去看待这篇文章,最后的结论都会是:它不仅有数据可证,还踩到了现实的脚趾,不痛是不可能的。

via 中国选举与治理网

News at: [2010/02/19 - 22:24] [4]

对于大多数社会人来说,有假期的年已经过完了。店长也是,只不过我的假期似乎都花在这个叫萌番的网站上了。正确的说,从1月中旬开始计算,我大概花了100个小时在该网站的开发和设计上……对于当前的完成度,我还是比较满意的。

在四处宣传该网站招揽白老鼠之后,萌番也从alpha进化为可以见人的beta了,于是开始公测。注册邀请码是beta,其余请见网站自身说明。

关于这个网站的开发原因,我会在今后的文章中说明清楚。现在旅客们只要知道它是捏它营萌番老站的合体,基于萌翻频道的代码库,利用了我测试贴纸生成器宅种培育室的经验就行了。呼,希望这是我做的最后一个ACG相关的网站项目……

那么,我们有空再谈。

News at: [2010/02/14 - 14:15] [4]

Is anyone except me thinking “the Stig’s Japanese cousin”?

Some say on a steel horse she rides. And that she collects Hello Kitty merchandise.

via danbooru

News at: [2010/02/13 - 21:28] [7]

他们说:你是互联网,我是防火墙!

我们应:离开小黑屋,圣战在街上!

~虎年快乐~

News at: [2010/02/09 - 15:35] [4]

到头来还是电影的质量拯救电影的票房;当然如果你能像Avatar一样制造口碑就更NB了。

via yunakiti & walkerplus

News at: [2010/02/09 - 15:15] [3]

A Way Back上有一篇重新审视网站字体排序的文章。虽然中文世界的字体堆栈一般只有宋体和雅黑两种(而且是浏览器默认,不是CSS定义……),但随着不同操作系统的出炉,默认字体的比率也发生了变化,这篇文章尝试探索CSS字体家族定义的优化(仅用系统内的默认字体,而不是embed)。顺便一提,此站也是经典的blogazine + typography爱好者。