: 多态

虫虫

我们中国人崇拜龙,所谓“龙生九种,九种各别”。哪九种?《西游记》里西海龙王对孙悟空说:“第一个小黄龙,见居淮渎;第二个小骊龙,见住济渎;第三个青背龙,占了江渎;第四个赤髯龙,镇守河渎;第五个徒劳龙,与佛祖司钟;第六个稳兽龙,与神官镇脊;第七个敬仲龙,与玉帝守擎天华表;第八个蜃龙,在大家兄处砥据太岳。此乃第九个鼍龙,因年幼无甚执事,自旧年才着他居黑水河养性,待成名,别迁调用,谁知他不遵吾旨,冲撞大圣也。”(注:鼍龙是文雅的说法,民间叫法是猪婆龙,也就是扬子鳄。)如果您冲着这九位说一声“Let’s go”,那场面可壮观了,有天上飞的,有水里游的,也有地上爬的。同样是“go”,“go”的具体形式却各不相同,这正是多态“一个接口,多种实现”的典型例子。

多态的实现方法很多,其中C++直接支持的方式有:通过关键字virtual提供虚函数进行迟后联编,以及通过模板(template)实现静态多态性,它们都各有用武之地。我们比较熟悉的是虚函数,这是建构类层次的重要手段,我们也已经分析过虚函数的原理[]。然而在有些情况下,虚函数的性能并不是最优,故VCL还提供了一种动态(dynamic)函数,用法和虚函数一模一样,只要把virtual换成DYNAMIC就可以了。VCL的帮助文件里说,动态函数跟虚拟函数相比,空间效率占优,时间效率不行,真的吗?其实现原理又是如何呢?我们又应该如何权衡这两者的使用呢?我们将从一个相当一般的角度来讨论这些问题。

虚函数的苦恼

如下类层次来自一个图形绘制程序的一部分。为了方便管理,界面与具体的图形设计分离。各种图形以动态连接库的方式提供,作为插件的形式。这样可以在不重新编译主程序的情况,增加或减少各种图形。


图1 Shape类层次

最初Shape的声明是

class Shape {
private:
	int x0, y0;
protected:
        Shape();
        virtual ~Shape();
public:
	int x() const;
	int y() const;
        virtual void draw(void *) = 0;
        virtual int move(int, int);
};
后来因为功能扩充,添加了两个虚函数。
class Shape {
private:
	int x0, y0;
protected:
        Shape();
        virtual ~Shape();
public:
	int x() const;
	int y() const;
	virtual int move(int, int);
        virtual void draw(void *) = 0;
        virtual void save(void *) const = 0;
        virtual void load(void *) = 0;
};
后来又作过一些修改,又添加了若干虚函数。问题就在于,虚函数一但增加,虚拟函数表VFT就会发生变化,这时候,主程序就必须重新编译。更糟糕的是,一旦版本升级,派生自不同版本Shape的图形绝对不可以混用[]。所以我们可以看到硬盘里充斥着mfc20.dll、mfc40.dll、mfc42.dll……却一个也不能删除,这就是MFC升级所带来的DLL垃圾。怎么办?
初步解决

我在网上问过这样的问题,得到的答复主要有:

  • 用COM;
  • 预先多写一些无用的虚函数,留出扩充空间。

其实上面的方法都能很好地解决这个问题。但是看来,也有一定局限性。COM不适合解决类层次过深的情况,预留的空间则是不折不扣的“鸡肋”。

追根究底,这个局限性是因为父类和子类的虚拟函数表VFT之间过强的关联性:子类的VFT的前面一部分必须与父类相同。而当父类和子类不在同一个DLL或EXE中的时候,这个要求是很难满足的。父类一旦改变,子类如果不重新编译,就将导致错误。解决的方法,当然就是取消父类和子类VFT之间的关联性。我设计了一个很笨的解决办法,但可以取消这个关联性,使虚函数保证始终只有2个。

#define Dynamic // Dynamic什么都不是,只是好看一点

struct point
{
	int x, y;
};

class dispatch_error{};

class Shape {
private:
	int x0, y0;
protected:
        Shape();
        virtual ~Shape();
	virtual void dispatch(int id, void* in, void* out);
	// in和out是函数的输入输出参数,id是每个函数唯一的标记符号,即代号
	// 实际运用中,id不一定是整数,也可以是128位UUID,或者字符串等等
public:
	int x() const;
	int y() const;
	Dynamic int move(int dx, int dy)
	{
		int r;
		point p = {dx, dy};
		dispatch(-1, &p, &r);
		return r;
	}
        Dynamic void draw(void *hdc)		{dispatch(-2, hdc, 0);}
        Dynamic void save(void* o) const	{dispatch(-3, o, 0);}
        Dynamic void load(void* i)		{dispatch(-4, i, 0);}
};

void Shape::dispatch(int id, void* in, void* out)
{
        switch(id)
        {
                case -1:
                        ...
                case -2:
                        ...
		...
                default:
                        throw(dispatch_error()); // 若函数不存在则抛出异常
        }
}
如果子类Triangle要改写Shape::draw,那么只需要
void Triangle::dispatch(int id, void* in, void* out)
{
        switch(id)
        {
                ...
                case -2:	// 改写Shape::draw
                        ...
		...
                default:
                        Shape::dispatch(id, in, out); //函数不存在则向父类找
        }
}
这样的“Dynamic函数”就解决了前面的问题,只有析构和dispatch这两个虚函数。父类和子类的VFT之间没有关联性,可以自由改动而不会互相影响。
评头论足

我们来对这种解决方案作了评价:的确解决了虚函数的问题,但是也付出了不小的代价:时间效率和可读性,由此也决定了该方案的应用面不广,一般用于

  • 虚函数很少或几乎不需改写的情况。这样有助于减少VFT的大小。至于运行速度则没有什么提高,毕竟VFT的访问速度是常数级[l_chong.htm#33" name=3>3];
  • 父类需要经常更新而子类不方便同步更新,对效率要求又不高的情况。一般的应用程序都可以使用。

从模式(Patterns)的角度来看,这种方法是典型的职责链(Chain of Responsibility)模式[]:调用请求从最低层子类开始一层层往上传递,直到被处理或者最后抛出异常。这种模式运用非常广泛,比如VCL消息映射[]和COM中IDispatch接口[],与上述解决方案的形式都非常相似。

这个解决方案还可以作进一步的完善,以更好地适用于单根结构的框架。比如单根结构的类库,如MFC和VCL,通过RTTI可以找到唯一的父类,那么可以分离数据(函数代号和指针)和代码(调配部分),以简化结构。解决的方法就是典型的表格驱动,有不少书[,]都用此来优化COM中IUnkown接口的QueryInterface。我们引入类DMT来储存函数的代号和指针。

#include 
using namespace std;

class DMT {
        char* const ptr;
        const DMT* const parent;
public:
        DMT(const DMT* const, const int, ...);
        ~DMT() {delete []ptr;}
        short size() const  {return *(short*)ptr;}
        const void* find(int) const;
};


图2 类DMT图解

需要特别注意的是DMT::ptr所分配的空间。在32位上,对于n个“Dynamic函数”,需要sizeof(short)字节储存n(红色部分),sizeof(void*)*n字节储存函数代号(黄色部分),以及sizeof(void*)*n字节储存函数指针(蓝色部分),一共是sizeof(short) + 2*n*sizeof(void*)字节。子类和父类的DMT可以通过链表形式连接起来。下面我们看看DMT::find和DMT::DMT的实现。

const void* DMT::find(int i) const
{
	const int* begin = (int*)(ptr + sizeof(short)), *p;
	for(p = begin; p < begin + size(); ++p)
		if(*(int*)p == i)
			return *(void**)(p+ size());
			// 找到对应的函数代号后,向前跳DMT::size()则是相应的函数指针
	return (parent)? parent->find(i): 0;
}

DMT::DMT(const DMT* const p, const int n, ...)
	: parent(p), ptr(new char[sizeof(short)+2*n*sizeof(void*)])
					// ptr分配的空间大小如前所述
{
	int* i = (int*)(ptr + 2), c;
	*(short*)ptr = n;		// 往头sizeof(short)字节写入n(红色部分)

	va_list ap;
	va_start(ap, n);

	for(c = 0; c < n; ++c)		// 往黄色部分写入函数代号
		*(i++) = va_arg(ap, int);

	typedef void (DMT::*temp_type)();
	temp_type temp;

	for(c = 0; c < n; ++c)		// 往蓝色部分写入函数指针
	{
		temp = va_arg(ap, temp_type);
		*(i++) = *(int*)&temp;
	}

	va_end(ap);
}
下面我们在Shape类层次中应用DMT类。
class Shape {
private: