googlebot

根据Philipp LenssenGoogle Webmaster Central Blog的报道,原本用于Google News的First Click Free选项现在也将对任何网站启用。所谓First Click Free(首次点击免费,下简称FCF)是指允许网站可以用户与搜索引擎提供不同的页面内容,假如他们满足以下条件——

通过点击Google搜索结果访问该页面的用户可以和Googlebot看到相同的内容。

这个条件包含两层意思——

对于一个需要注册才能浏览的网页,假设管理员将它的完整内容显示给Googlebot以赚取排名,则来自Google.com或Google.cn等等搜索页面的访客应与注册用户有一样的浏览权限;

反之,对任何不来自上述地址的访问,网站有权利选择不显示完整内容(例如强迫“注册新用户”)。

尽管Google称此举是将平时无法访问的相关页面纳入Google搜索,但包括Philipp在内的一群Google支持者却表示疑惑和反感。看似人畜无害的FCF会引起争议,是因为这个提案存在不公平竞争的灰色属性,这个属性在Google News的模式上可以忽略,扩展到整个网络则非常不妙。

不妨来假设一个案例,假如角川出版社制作了一个封闭式小说分享站,同时为了让站点的排名靠前,启用了Google的FCF支持,允许googlebot抓取小说内容,会出现什么问题呢?

问题1:大量游客使用伪装的user agent或referer浏览网站。因为判断googlebot的官方最快捷手段就是UA(准确的办法是DNS Lookup,逐个检查访问者不可行),至于UA伪装有多容易,我们在Pixiv懒人套装动漫花园Private Tracker上的测试足以说明。

问题2:其他网络搜索引擎必须伪装成googlebot抓取小说的内容(这当然是违反Google条款的)。取决于网站的性质,这可以是好事也可以是坏事;Google有明确的协议让站主阻止缓存这些网站的内容,但去到其他搜索引擎的手头上呢?反之,管理员希望页面的内容出现在百度上,他们就必须再增加referer和UA检查。从网页设计的角度出发,这等于在促进“为搜索引擎设计网站”的概念,脱离了人本的概念。

问题3:假如一个页面可以通过Google搜索页面访问,很容易会造成用户认为该页面能永久访问的错觉;然而由于Google的FCF协议只保证来自Google网址的访问通畅,无论保存为书签还是转载到其他页面,该页面都不会显示原版。这等于是对搜索引擎最厌恶的cloaking(包括google自己)采取睁一只眼闭一只眼的策略。同时,由于服务器只认google网址的referer,任何使用google搜索API的网站都将得不到这个好处。

以上的问题,总结而言是Google尝试通过自己庞大的市场份额为Googlebot赢得类似VIP一般的访问权限,间接将其他搜索引擎的竞争力削弱,同时为Google用户创造更多“留在Google上”的借口(例如:由于页面无法直接访问,不得不退之保存特定搜索页的病态网络)

FCF仅解决了抓取受限页面的技术问题,却激化了大范围的网络问题,更为行业竞争营造了负面气氛,实为不可取的策略,客栈上下对Google的决定感到非常失望。

继续阅读

“ Google新FCF规则与搜索引擎不公平竞争的激化 ” 已被炮击6次

  1. > 问题1:
    UA伪装容易,但是“大量游客”伪装UA并不容易。对所有人来说,伪装UA并不比从google搜索结果链接进去简单。

    > 问题2:
    fcf其实是一个网站与搜索引擎互取其利的过程,独立性的丧失的坏处看起来没有想像的那么大。

    > 问题3:
    没有人会在使用收费期刊数据库的时候转载全文的链接吧?类似的,一个常识的普及而已。

    总得来说我觉得google这次在继续走向不平衡的一极,不过fcf具体的问题并没有文中提到的那么严重,店长如此痛心疾首大概是因为fcf确实不是干净的技术。

    mcv的头像

    #1

    mcv

    乘坐着 Firefox Firefox 3.0b5 与 Ubuntu Linux Ubuntu Linux

    发射于 13:03 on October 21st, 2008

  2. >>对所有人来说,伪装UA并不比从google搜索结果链接进去简单。
    这是在没有Google FCF的时代。一旦FCF开始流行会怎样?

    >>一个网站与搜索引擎互取其利的过程
    默许Google用户看到与百度用户不同的内容,这是不公平竞争。

    >>一个常识的普及而已
    你是站在熟练电脑用户的角度看。

    First Click Free无视Web Accessibility(第二条),在服务器Security Model中添加漏洞(第一条)以及鼓吹作弊/收费(第三条)的倾向极其明显。这对站主和用户都会造成长远影响。

    店长的头像

    #2

    店长

    乘坐着 Firefox Firefox 3.0.3 与 Windows Windows XP

    发射于 16:07 on October 21st, 2008

  3. 看完后觉得很混乱,于是跑去看原文,还是混乱…… 怎么看都是一个实现可能性很低的方案,尤其是应用到新闻以外的情况下。

    个人的感觉:
    1. 站点存在规制内容的webmaster,不会存在因为需要提高google排名而被迫开放FCF的情况。而在google全文都没有提到必须开放多少规制内容的限制的前提下,webmaster依然有很大的选择空间。因此,应该不会对现有的体系造成太大的冲击。

    2. FCF没有什么门槛,也就是其他搜索引擎介入也是很方便的事情。长远的说,应该会趋于一个平衡。

    3. FCF针对的应该是已经或者必然会成为收费站点,也就是本来就会有规制内容的站点。

    4. FCF和Cloaking还是存在本质上区别的行为。凡是FCF抓到的内容,用户还是能访问其全部,而Cloaking显然不同于这样的结果。

    其实FCF这东西,评论里有人写了,”Implement this, and pay me a commission on revenue, or give me a job and I’ll implement if for you” = v = 言下之意就是只要google不区别对待FCF的站点,webmaster也没什么可能性刻意去嵌入FCF….

    CYan的头像

    #3

    CYan

    乘坐着 Firefox Firefox 3.0.3 与 Windows Windows XP

    发射于 10:24 on October 23rd, 2008

  4. CYan你也没理解我的话么……

    FCF的网站对于Google用户自然不是cloaking,但对于其他网站呢?

    如果收费网站只针对Google提供收费内容,则这是Googlebot比其他搜索bot有更高的权限;如果网站本来就是cloaking站,只是针对Google进行调整,则其他搜索引擎要继续受害。

    Google当然可以说他们不是太平洋警察,但作为最大的网络搜索站,鼓励减少信息封闭(FCF还是将信息标价,只是第一个Free),或者在推出FCF前与其他搜索引擎做出公平协议不是应该是事情么?

    FCF只有在大多数搜索引擎上都能施行才有意义,然而就如我之前所说,FCF自身会引导问题,目前只是Google独大的借口罢了。

    店长的头像

    #4

    店长

    乘坐着 Firefox Firefox 3.0.3 与 Windows Windows XP

    发射于 16:59 on October 23rd, 2008

  5. 嘛,话题的出发点不太一样吧。我只是觉得FCF似乎没可能普及开的感觉=w= 如果真的要FCF,作为推广网站的目的来说,站长不会选择仅限于在Googlebot上FCF吧。而且我始终觉得如果搜索引擎不拿钱养着的话,没什么站点会实质上使用FCF吧….

    不过从好的方面去想的话,如果这样的方式能够促使原先封闭的信息开放第一步Free的话,对信息自由也是有好处的。至于有可能会促使原先就免费的信息因为FCF而变得封闭起来,这点还有待观察了=w=

    至于Google独大,也不是一天两天了。如果说期望商业公司应该负起应有的全部社会责任的话,可以批判的对象就太多了-w-

    CYan的头像

    #5

    CYan

    乘坐着 Firefox Firefox 3.0.3 与 Windows Windows XP

    发射于 00:12 on October 24th, 2008

  6. First Click Free计划原用于Google News上的收费媒体,扩展到整个网络的吸引力不强,概念上又有漏洞,说明Google这个举动是缺乏谨慎考虑的。

    PS:为了不让微软般的垄断重演,我们必须将公平竞争的标准提高。

    店长的头像

    #6

    店长

    乘坐着 Firefox Firefox 3.0.3 与 Windows Windows XP

    发射于 02:19 on October 24th, 2008


比特客栈的连珠合璧

比特客栈的旁门左道

News at: [2009/07/05 - 03:49] [0]

haruhi-virus

News at: [2009/07/04 - 06:00] [1]

布什在伊拉克被人扔鞋,美国人笑了;秦刚被BBC的记者问倒,我们也笑了。

News at: [2009/06/30 - 21:28] [2]

you-re-fucked-but-you-liked-it

While this was a difficult decision for us, we felt that moving away from LAN play and directing players to our upgraded Battle.net service was the best option to ensure a quality multiplayer experience with StarCraft II and safeguard against piracy.

Safeguard Against

PIRACY

前几天我正想着回国,然后Google被封了;昨天我正想星际2快出了,今天它给我这条新闻。算,该干啥干啥去。

via digg and every gaming blog.

News at: [2009/06/29 - 00:28] [2]

sos-history-is-upon-us

最近在听这张由东京爱乐乐团演奏,香港出生的Philip Chu指挥与由良浩明小提琴独奏的回忆之作(均为游戏OST老手)——《涼宮ハルヒの弦奏》。私以为,自己对SOS团早已不抱有那种心乱跳气乱喘的湿嗒嗒的暗恋之情,但《弦奏》用绕梁三日的曲目辩证了我的错误。仿佛电视连续剧中的旧情人重逢:见到多年所爱的她/他以熟悉而又略带新鲜感的面貌出现在自己眼前,不禁心生某种难以形容的怀念之情。换入《弦奏》的背景,这就成了一种特殊的思乡愁。

(继续阅读)...

News at: [2009/06/28 - 21:50] [0]

loli-not-found

注意到这次日本众议院讨论修改儿童色情禁止法时的议员发言吗?中间偏右派的党派(包括执政的自由民主党公明党)都发言支持扩大儿童色情的定义范围,并加强对儿童色情持有者的搜查;反观社会自由派(反对派民主党与偏左的社会民主党),则强调新法进一步模糊了儿童色情的定义,将大批无辜的艺术作品归类为色情,一旦发现误判亦没有补救法规,认为新法不应该被通过。

尽管反对党的说辞有力,自由民主党与公明党持有日本众议院480个席位中的330个却是不争的事实,两党合作通过这个提案应该不是问题。要阻截新法例,只能依赖在参议院拥有最多席位的民主党争取(即便如此,法例仍能以众议院2/3支持的优先形式通过)。

说到底,这是日本民众选择偏右与保守派的成果——就像9/11之后的美国民众支持布什,间接酿造了伊拉克战争。去年,美国人再也忍受不了共和党的执政艺术,于是奥巴马上台;日本人民(尤其是受影响大的宅民),又会在下次大选中如何抉择呢?拭目以待

PS:日本UNICEF协会(非UNICEF的分部,为私人公司)的大使陈美龄果然有跑出来发言,但同样是宅站,翻译报道的方式却大不相同——Canned Dogs是完全翻译了各党代表的发言归纳稿;而Sankaku Complex则是将责任推在香港出生的陈美龄身上,对执政党的主动修法只字不提。自行鉴别,避免脑残。

News at: [2009/06/28 - 17:13] [5]

belkin-usb-wireless

贝尔金的网络适配器(从低端到高端)绝对是全球最会掉线的无线产品。若哪天它能保持一个小时不掉,我就打好包袱面朝东边看日落。我承认我在店里时太急,没去查它的网络评价,现在后悔已晚。

logitech-keyboard

说起让我跪地的产品,Logitech的Ultra-Flat Keyboard(罗技得意手/珍珠超薄)也是一例,没错它比较便宜,没错它设计精巧——但你看到了它的按键排位么?仔细看上图,不难发现九宫格数字键紧贴在主键盘的右侧——那翻页(Page Up/Down),定位(Home/End)与文本编辑(Insert/Delete)会在哪里呢?当然是混在Ctrl/Alt与功能键之间——有如将特殊功能键放在Ctrl左侧的老式IBM电脑,都是“回家收拾你”的阴险设计!

以上产品花费本人80GBP,也是我第一次体验用880RMB烧火取暖是什么感觉。言不尽意,老泪纵横,记于本栈,以示后人。

News at: [2009/06/26 - 06:05] [2]

outlookisgreat

via zeldman

News at: [2009/06/26 - 06:01] [0]

The Hottest Girls app is temporarily sold out… To answer the question on everyone’s mind: Yes, the topless images will still be there when it is sold again.

via venturebeat