易栈网-膘叔（Neatstudio.COM）

易栈网-膘叔

Drupal 的钩子(Hooks)

佑阳记事

MYSQL连载预告

小孩会叫papa了

web工程师的web架构设计经验分享

日志分类

热门标签

日志归档

搜索文章

最新评论

博客信息

友情链接

hooks这玩意，一向是被认为是可扩展的代名词，当一个系统启动了hooks后，他就变得可扩展了，同样，他的性能也就需要被众人拿出来做比较了。
目前被很多人拿来做比较的是两款程序：drupal和wordpress，是使用量最大的博客程序之一，在很多人眼里，这两个程序已经脱离了博客，而是CMS了。drupal前后台不分是我最不舒服的地方，所以wordpress才是我的首选。或许大家看到我的TAG里面还有ThinkPHP和QeePHP，那是因为这两个框架都在考虑有行为加入，行为嘛，相对于框架，就当于一个hooks，所以我也加上了这两个框架
thinkphp的Add_filter,add_action和wordpress有点相像，而qee因为没有仔细看过，所以不太清楚（flea的时候好象没这个功能）

跑题半天了。上文了

Drupal怎么就知道什么时候调用一个模块来处理特定的请求？

这个是通过Drupal的hook机制完成的，下面解释一下hook的工作机制。

当Drupal处理来自用户的一个请求，它通过一系列步骤进行。比如：Drupal核心首先引导这个应用，确定关键变量和经常使用的功能。接下来，它加载关键库、主题和模块。接下来，它继续处理请求，将请求的URI映射到正确的处理代码，等等。然后它为数据应用一个主题，为输出来格式化信息。最后它返回输出结果到用户的浏览器。

在循序渐进的预定义时刻，Drupal进行勾取。这意味着什么呢？简短的说，它意味着Drupal测试部分或全部当前启用的模块，寻找遵循特定的预定义模块的函数。一些已经连接这个进程到“回调”的模式经常被用在事件处理模块中。Drupal和这个是类似的，但是更加充满活力。

比如说，当它正在创建一个页面浏览内容时，Drupal可能再模块中寻找叫做<modulename>_block() 和<modulename>_view()的函数（在这里<modulename>被每个Drupal检测的模块的名称代替）。寻找模块包含的这些函数被叫做实施hook_block()和hook_view()勾取。

当Drupal找到这些函数，它执行它们，并且利用这些函数返回的数据创建一个响应来发送给用户。然后Drupal继续循序渐进的处理请求，或许在它进行过程中执行许多其它的钩子。

当所有的步骤完成并且一个响应发送给用户，Drupal自动清除并且推出。

模块可以定义自己的钩子，这些钩子又可以被其他模块使用。这样一来，hook机制可以扩展到提供复杂的定制行为。

当一个模块提供匹配一个钩子的签名的功能，我们就说那个模块执行那个钩子。比如，假设Drupal有一个叫做hook_example()的钩子。如果我们定义一个叫做 mymodule 并且包含一个叫做 mymodule_example() 函数的模块，我们就会用到 hook_example().

Hook对于面向对象程序员的启示：

那些对面向对象编程熟悉的程序员可能发现在面向对象语言中考虑将钩子作为一个类似于接口方法或者抽象方法的机制是很有用的。钩子是Drupal将寻找的函数并在某些情况下需要出现在你的模块中。就像接口方式，一个钩子的函数签名必须匹配Drupal的预期签名。而和接口不同的是，模块开发者可以选择（在一定程度上）哪个钩子去实现、哪个钩子去忽视。Drupal不要求每个定义的钩子都实现。

参考：《Learning Drupal 6 Module Development》

原文来自：http://www.cnblogs.com/stylesheet/archive/2010/04/16/1713512.html，上次我也写过wordpress的hooks，其实原理都差不多。

几件小事记录
1、会牵着大人的一只手走了。还是摇摇晃晃。但这是个好兆头啊。应该快了吧。呵呵。会自己扶着床边、墙边往前走了

2、爸爸等音节有点会发了。只是妈妈一直不会叫。

3、拿着碗喝水，但放到嘴边时，还是有点控制不住力量

4、睡觉前讲故事。三个小猪。讲到大灰狼的时候，和妈妈一起：呼（这是大灰狼吹小猪的房子的声音）哈哈

原来的连载因为一些原因停了N久，从下周开始，每周继续连载。

这次，直至结束。
优化方面的事情以及MYSQL集群等，可能暂时不能涉及
仅涉及MYSQL最基本的一些资料，我想这也应该足够了吧？

今天有点激动，回到家和小孩玩的时候，小孩憋了半天，叫了papa，我也就很激动的在说：叫爸爸，叫爸爸。然后他又憋了半天，终于又叫了一声papa，然后害羞的头撇过去了。

哈哈

记下今天的日子：2009年1月21日。小孩会叫papa了。

等下次会发b音的时候，我再贴上来

原文作者：yizhu2000

链接：http://www.phpv.net/html/1663.html

本人作为一位web工程师，着眼最多之处莫过于性能与架构，本次幸得参与sd2.0大会，得以与同行广泛交流,于此二方面，有些架构设计的心得，不敢独享，与众友分享，本文是这次参会与众同撩交流的心得.

架构设计的几个心得：

一，不要过设计：never over design

这是一个常常被提及的话题，但是只要想想你的架构里有多少功能是根本没有用到，或者最后废弃的，就能明白其重要性了，初涉架构设计，往往倾向于设计大而化一的架构，希望设计出具有无比扩展性，能适应一切需求的增加架构，web开发领域是个非常动态的过程，我们很难预测下个星期的变化，而又需要对变化做出最快最有效的响应。。

ebay的工程师说过，他们的架构设计从来都不能满足系统的增长，所以他们的系统永远都在推翻重做。请注意，不是ebay架构师的能力有问题，他们设计的架构总是建立旧版本的瓶颈上，希望通过新的架构带来突破，然而新架构带来的突破总是在很短的时间内就被新增需求淹没，于是他们不得不又使用新的架构
web开发，是个非常敏捷的过程，变化随时都在产生，用户需求千变万化，许多方面偶然性非常高，较之软件开发，希望用一个架构规划以后的所有设计，是不现实的

二，web架构生命周期：web architecture‘s life cycle

既然要杜绝过设计，又要保证一定的前瞻性，那么怎么才能找到其中的平衡呢？希望下面的web架构生命周期能够帮到你

所设计的架构需要在1－10倍的增长下，通过简单的增加硬件容量就能够胜任，而在5－10倍的增长期间，请着手下一个版本的架构设计，使之能承受下一个10倍间的增长

google之所以能够称霸，不完全是因为搜索技术和排序技术有多先进，其实包括baidu和yahoo，所使用的技术现在也已经大同小异，然而，google能在一个月内通过增加上万台服务器来达到足够系统容量的能力确是很难被复制的

三，缓存：Cache

空间换取时间，缓存永远计算机设计的重中之重，从cpu到io，到处都可以看到缓存的身影，web架构设计重，缓存设计必不可少，关于怎样设计合理的缓存，jbosscache的创始人，淘宝的创始人是这样说的：其实设计web缓存和企业级缓存是非常不同的，企业级缓存偏重于逻辑，而web缓存，简单快速为好。。

缓存带来的问题是什么？是程序的复杂度上升，因为数据散布在多个进程，所以同步就是一个麻烦的问题，加上集群，复杂度会进一步提高，在实际运用中，采用怎样的同步策略常常需要和业务绑定

老钱为搜狐设计的帖子设计了链表缓存，这样既可以满足灵活插入的需要，又能够快速阅读，而其他一些大型社区也经常采用类此的结构来优化帖子列表，memcache也是一个常常用到的工具

链接:钱宏武谈架构设计视频 http://211.100.26.82/CSDN_Live/140/qhw.flv

Cache的常用的策略是：让数据在内存中，而不是在比较耗时的磁盘上。从这个角度讲，mysql提供的heap引擎（存储方式）也是一个值得思考的方法,这种存储方法可以把数据存储在内存中,并且保留sql强大的查询能力,是不是一举两得呢?

我们这里只说到了读缓存，其实还有一种写缓存，在以内容为主的社区里比较少用到，因为这样的社区最主要需要解决的问题是读问题，但是在处理能力低于请求能力时，或者单个希望请求先被缓存形成块，然后批量处理时，写缓存就出现了，在交互性很强的社区设计里我们很容易找到这样的缓存

四，核心模块一定要自己开发：DIY your core module

这点我们是深有体会，钱宏武和云风也都有谈到，我们经常倾向于使用一些开源模块，如果不涉及核心模块，确实是可以的，如果涉及，那么就要小心了，因为当访问量达到一定的程度，这些模块往往都有这样那样的问题，当然我们可以把问题归结为对开源的模块不熟悉，但是不管怎样，核心出现问题的时候，不能完全掌握其代码是非常可怕的

五，合理选择数据存储方式：reasonable data storage

我们一定要使用数据库吗，不一定，雷鸣告诉我们搜索不一定需要数据库，云风告诉我们，游戏不一定需要数据库，那么什么时候我们才需要数据库呢，为什么不干脆用文件来代替他呢？
首先我们需要先承认，数据库也是对文件进行操作。我们需要数据库，主要是使用下面这几个功能，一个是数据存储，一个是数据检索，在关系数据库中，我们其实非常在乎数据库的复杂搜索的能力，看看一个统计用的tsql就知道了(不用仔细读,扫一眼就可以了)

select c.Class_name,d.Class_name_2,a.Creativity_Title,b.User_name,(select count(Id) from review where Reviewid=a.Id) as countNum from Creativity as a,User_info as b,class as c,class2 as d where a.user_id=b.id and a.Creativity_Class=c.Id and a.Creativity_Class_2=d.Id

select a.Id,max(c.Class_name),(max(d.Class_name_2),max(a.Creativity_Title),max(b.User_name),count(e.Id) as countNum from Creativity as a,User_info as b,class as c,class2 as d,review as e where a.user_id=b.id and a.Creativity_Class=c.Id and a.Creativity_Class_2=d.Id and a.Id=e.Reviewid group by a.Id ..............................................

我们可以看出需要数据库关联，排序的能力，这个能力在某些情况下非常重要，但是如果你的网站的常规操作，全是这样复杂的逻辑，那效率一定是非常低的，所以我们常常在数据库里加入许多冗余字段，来减小简单查询时关联等操作带来的压力，我们看看下面这张图，可以看到数据库的设计重心，和网站(指内容型社区)需要面对的问题实际是有一些偏差的

同样其他一些软件产品也遇到同样的问题所以具我了解，有许多特殊的运用都有自己设计的特殊数据存储结构与方法，比如有的大型服务程序采取树形数据存储结构，lucene使用文件来存储索引和文件

从另外一个角度上看，使用数据库，意味着数据和表现是完全分离的（这当然是经典的设计思路），也就是说当需要展示数据时，不得不需要一个转换的过程，也可以说是绑定的过程，当网站具备一定规模的时候，数据库往往成为效率的瓶颈，所以许多网站也采用直接书写静态文件的方法来避免读取操作时的绑定

这并不是说我们从今天起就可以把我们亲爱的数据库打入冷宫，而是我们在设计数据的持久化时，需要根据实际情况来选择存储方式，而数据库不过是其中一个选项

六，搞清楚谁是最重要的人：who's the most important guy

在用例需求分析的时候常常讲到涉众，就是和你的设计息息相关的人，在web中我们一定以为最重要的涉众莫过于用户了。，在一个传统的互动社区开发中，最重要的东西是内容，用户产生内容，所以用户就是上帝，至于内容挑选工具，不就是给坐我后面三排的妹妹们用的吗？凑或行了，实在有问题我就在数据里手动帮你加得了。。这大概是眼下许多小型甚至中型网站技术人员的普遍想法。钱宏武在他的讲座里谈到了这个问题：实际上网站每天产生的内容非常的多，普通人是不可能看完的，而编辑负责把精华的内容推荐到首页上，所以很多用户读到的内容其实都依赖于编辑的推荐，所以设计让编辑工作方便的工具也是非常重要，有时甚至是最重要的。

七，不要执着于文档：don't be crazy about document

web开发的文档重要吗？什么文档最重要？我的看法是web开发中交流>文档，

现在大的软件公司比较流行的做法是：
注重产品设计文档，在这种方法里，产品文档非常详尽，并且没有歧义，开发人员基于设计文档开发，测试人员基于设计文档制定测试方案，任何新人都可以通过阅读产品设计文档来了解项目的概况

而web项目从概念到实现的时间是非常短的，而且越短越好，并且由于变化迅速，要想写出完整的产品和需求文档是几乎不可能的，大多数情况是等你写出完备的文档，项目早就是另外一个样子，但是没有文档的问题是，如果团队发生变化，添加新成员怎样才能了解软件的结构和概念呢，一种是每个人都了解软件的整个结构，除非你的团队整体消失，否则任何一个人都能够担当培养新人的责任，这种face2face交流比文档有效率很多。

于是就有了前office开发者，现任yahoo中国某产品开发负责人的刘振飞所感觉到的落差，他说，我们的项目是吵出来的，我听完会心一笑

八，团队：team

不要专家团队，而要外科手术式的团队,你的团队里一定要有清道夫，需要有弓箭手，让他们和项目一起成长，才是项目负责人的最大成就

总结：

架构是一种权衡

web开发的特点是是：没有太复杂的技术难点，一切在于迅速的把握需求，其实这正式敏捷开发的要旨所在，一切都可以非常快速的建立，非常快速的重构，我们的开发工具，底层库和框架，包括搜索引擎和web文档提供的帮助，都提我们供给了敏捷的能力。

此外，相应的，最有效率的交流方式必须留给web开发，那就是face2face（面对面），不要太担心你的设计不能被完备的文档所保留下来，他们会以交流，代码和小卡片的方式保存下来

人的因素会更加重要，无论是对用户的需求，还是开发人员的素质。

« 2026年06月 »