Get the Flash Player to see the slideshow.

Archive for 十一月, 2007


对百度搜索竞价排名的一些疑惑

最初接触搜索竞价排名是在 2004 年中期。当时我还在 Oxford English 实习,有次替 Christine 去京广中心参加行业门户慧聪网的一个活动,主题正是推广慧聪旗下的搜索网站中搜网的竞价排名,以及其桌面搜索网络猪(按:网络猪,如其所号称的,确实该是中国最早推出的桌面搜索概念产品,当时 Google 都还没有在国内开始 Google Desktop,百度更是落后于千里之外。可是现在网络猪似乎已销声匿迹,看来来得最早并不一定能活得最好。)
当时中搜推出的概念就是按照不同的价位出卖任意关键词,相同关键词出价最高者(如果没记错,价格是由中搜给定的)出现在搜索结果页面的第一屏最前面,依此类推。我回到办公室向 Christine 汇报时大力向她推荐了这个概念,但是对于中搜的产品总隐隐感到有些不对劲,却又不知错在哪里。
今天我又提起这个话题是因为本机构新来的空降兵正打算向百度(的代理商?)购买一两个关键词,以求我们能够在更多人眼前露脸。我知道之后习惯性地 Google + Baidu 了一下,结果没有豁然开朗反到多了一些疑惑。百度的竞价排名比三年前中搜的概念先进或者说复杂了许多,不只是简单花钱买座位的模式,而是与点击率挂钩(这里面至少有部分来自 Google 的创意)。大约是说,如果你对“我爱你”这个关键感兴趣,当用户用百度搜索“我爱你”后出来若干个结果,若你同意为每次点击你指定的结果的用户向百度付 5 毛钱,而你的竞争对手只愿意为他的结果向百度付 4 毛钱,你指定的结果就会排在你竞争对手的前面。(我承认并没有仔细研究百度的策略,以上解释仅供参考,若需详情请访问百度竞价排名网站。)
我的疑惑正是从这里产生。以用户的角度来说,判断一个搜索引擎好坏的标准就是搜索结果是否能够快速而且尽可能准确地显示我期望的结果,或者说相关度是否足够高。这个标准应该是不变的,但是由于对“尽可能准确”的定义不同,便产生了不同的搜索引擎。从结果来说,我个人目前比较认可的 Google 的方式,大约是与复杂计算方法挂钩的 PR 值相关的因素决定了一个网站在搜索结果页面中的位置,但出现在越前面的一定是使用的人最多的。我不知道百度的定义是如何,但是可以想象,一旦百度在其公式中加入了竞价排名的因素,结果的准确度(至少对于参与竞价的关键词而言)一定会受到商业因素的不良影响,付了钱的结果可能就会把你真正想看到的结果挤到一边去。在我看来,这里的问题就是他们混淆了搜索引擎和黄页之间的区别。一旦搜索引擎的结果只能体现广告客户拼价格的血腥程度而失去了准星,用户就会投奔别的更公正的搜索引擎而任这个贪财的家伙慢慢死去。这就是 2004 年我感觉到却又说不出来的那个“不对劲”。
反过来,作为世界上最大的广告公司,Google 的策略却从来没有(据我所知)冒过影响结果准确度的险,而是剑走偏锋地创造了 AdWords 和 AdSense 模式。同样是以点击率来付费,只不过广告出现的地方和形式不同,却为广告客户、用户及其自身都创造了巨大的价值——这一点看看 Google 恐怖的股价即知。这是一个更健康的循环,不断改进准确性(以及易用性和功能性)的搜索引擎不断吸引到更多的(更忠诚的)用户,更多的用户就会变成更大的广告受众群,更大的广告受众群又会吸引更多的广告客户,更多的广告客户带来的当然是更多捆的钞票……生生不息。

准完美回归

我的 blog 终于回来了,虽然还不是 100%,可能有 95%,但这已经足以使我欣喜若狂。
自从 5 月底我的前任 SP 中风以来,我唯一的指望就是通过在它中风前半个月无心插柳备份的 sql 文件来恢复我之前的心血,但遗憾的是,半年过去了,我所能看到的仍然只是那个 1 M 多一点点的 sql 文件,在里面隐隐约约能看到我之前的一篇一篇 post,只不过都是乱码。
我尝试过很多方法,也通过 Google 学习了很多人的经验,在别人的案例中通过数据库文件恢复 Wordpress 似乎是轻而易举的一件事,但在我这里无论我多努力导入 sql 之后连个水花都飚不起来。别人经常遇到的问题是导入后出现乱码,可我却多么希望能看到哪怕乱码啊!
因为我的案例有小小不同,我从 blog 甲备份出的文件要导入另一个网址不同数据库名称不同的 blog 乙,通常导入之后因为数据库前缀不同原来的表和导入的表成为平行的文件,而且 Wordpress 关联的仍然是原来的表,我不知道怎么更改导入的表的前缀,也不知道怎么修改 WP 的 configure 文件来实现这个目的……好吧,我承认这是活该我不够努力,我并没有认真地去读 MySQL 的档案(不过数据库的知识也确实比我想象的复杂难懂许多),因为事后证明这些调整可能并没有那么复杂。
最后的最后,blog 回归(很遗憾)并不是因为我成功找到了恢复的方法,只不过是我找到了正确的人。趁着这几天难得的清闲,我向曾经中风的 SP 求救——这是我看得到的最后一根稻草了。或许也许可能是出于负罪感,他们倒也爽快应援,只不过开始时还不是很够认真,但几个回合之后,他们终于成功地帮助我那瘫痪的 blog 恢复到了2007年5月17日的模样。这已经是我能期望的最好最好的结局。非常感谢他们,虽然让我落入这步田地的也是他们。
现在的状况是,5月17日之前的东西全部回到赵国,而此后的那些 post 我则通过自己订阅的 RSS 手动进行了恢复,唯一同时也是很严重的损失是我刚到广州后写的关于这座城市的很长的一文,叫《孤城》。没法复制回来的原因是当时 RSS 设置的不是全文阅读(自作孽,不可活。)。所以这里顺便问一声,万一如果假如碰巧哪位也有订阅过在下的 RSS 或者有任何其他形式的这篇 post,请吭一声。谢谢了啊。至于后来在 Drupal 里的那些篇,一共也没多少,有意思的更是无限趋近于零,只是挑了几篇复制回来。总的来说,我回来了。
一招被蛇咬。为了防止悲剧再发生,我极大地加强了备份,除了现在我可信任的 SP Dreamhost 每天会自动为我备份一次,我同时使用了 [...]

折腾

有一个词叫折腾,不过我用在这里其实是想悄悄地鼓励一下自己滔滔不绝的 DIY 精神,因为我的 blog 又搬家了。
真是好笑,一只 blog 一年之内大搬了两次家——尤其是对于一只青黄不接的 blog,听起来就像炒绯闻,不过不管怎么样,我又回来了,从 Drupal 回到 Wordpress。
自从 2006 年开始 Wordpress 之后,一切都很好,我也养成了定期记些流水的“好”习惯,一直到今年五月我用 3 美元换来的无限期空间中风倒地——MySQL 5服务器崩溃,而且 SP 居然没有任何备份,于是我的好习惯被迫终止。同时倒地的还有我苦心经营多年的而且正渐成气候的 fun@1982 (这是我之前用了很久的 blog 名字)。除此以外,还有一宗惨剧不得不提:JJ 因为听信了我的谗言,也在这个便宜不是货的空间上使用了我帮她建立的 Wordpress 的 blog,于是另一出家破人亡的悲剧也诞生了。这出悲剧的最后一折是 JJ 从此以后对 Wordpress 和自建 blog 丧失了信心(so far so bad)。
如果我没有记错,我的 blog 史嘎然中止的时间正是我离开北京来到广州的时间。纯属巧合。

之后我改用了 Drupal ——另一个基于 PHP 的开源 CMS (Content Management System)。Drupal 是一个非常好用和强大的系统:安装简易、使用方便、弹性极强。它很适合用来建立社区网站、企业网站以及个人网站,blog 当然更不在话下。比如,NASA 和 MTV 的一些子网站,以及大型新闻网站 New York Observer [...]