C++: 面向高级对象编程(下)

转换函数

将本类型转换为其他类型

定义操作符类型名()即可将本类型变量转换为其他类型的函数

1
2
3
4
5
6
7
8
9
10
11
12
class Fraction {
public:
Fraction(int num, int den = 1): m_numerator(num), m_denominator(den) {}

operator double() const { // 重载类型转换运算符 double()
return (double)(m_numerator * 1.0 / m_denominator);
}

private:
int m_numerator; // 分子
int m_denominator; // 分母
};

这种类型转换有可能是隐式的,例如:

Fraction f(3, 5);
double d = f + 4;     // 隐式转换,调用 Fraction::operator double() 函数将f转换为 double 类型变量

对于语句f + 4,编译器可能会去寻找以下重载了运算符+的两个函数

  • Fraction::operator+(double)
  • operator+(Fraction, double)

若这两个函数均没找到,编译器就去寻找能否将Fraction类型转换为double类型,找到了类型转换函数Fraction::operator double(),发生了隐式转换

在上面例子中,若定义了重载运算符+的函数,就不会再发生隐式转换

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
class Fraction {
public:
Fraction(int num, int den = 1)
: m_numerator(num), m_denominator(den) {}

explicit operator double() const { // 重载类型转换运算符 double()
return (double) (m_numerator * 1.0 / m_denominator);
}

double operator+(double d) const { // 重载运算符 +
return (double) (m_numerator * 1.0 / m_denominator) + d;
}

private:
int m_numerator;
int m_denominator;
};

将其他类型转换为本类型

类似地,也有可能通过隐式调用构造函数将其他类型的变量转换为本类型,示例如下:

1
2
3
4
5
6
7
8
9
10
11
12
13
class Fraction {
public:
Fraction(int num, int den = 1)
: m_numerator(num), m_denominator(den) {}

Fraction operator+(const Fraction &f) const { // 重载运算符 +
return Fraction(m_numerator + f.m_numerator, m_denominator + f.m_denominator);
}

private:
int m_numerator;
int m_denominator;
}
Fraction f1(3, 5);
Fraction f2 = f1 + 4;    // 调用 Fraction 类构造函数将 4 转换为 Fraction 类型变量

在上面例子中,编译器找不到函数Fraction::operator+(int),就退而求其次,先隐式调用Fraction类的构造函数将4转换为Fraction类型变量,再调用Fraction::operator+(Fraction)函数实现+运算

使用explicit关键字避免隐式转换

使用explicit关键字可以避免函数被用于隐式类型转换

1
2
3
4
5
6
7
8
9
10
11
12
13
class Fraction {
public:
explicit Fraction(int num, int den = 1) // 避免隐式调用构造函数进行类型转换
: m_numerator(num), m_denominator(den) {}

explicit operator double() const { // 避免隐式调用成员函数进行类型转换
return (double) (m_numerator * 1.0 / m_denominator);
}

private:
int m_numerator;
int m_denominator;
};
Fraction f1(3, 5);
Fraction f2 = f1 + 4;    // 编译不通过: error: no match for operator+...
double d = f1 + 4;        // 编译不通过: error: no match for operator+...

使用explicit关键字修饰函数后,上述隐式类型转换将不会再发生

伪指针(pointer-like classes)和伪函数(function-like classes)

伪指针

伪指针(pointer-like classes)是指作用类似于指针的对象,实现方式是重载*->运算符.

标准库中的shared_ptr类是一个典型的伪指针类,代码如下:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
template<class T>
class shared_ptr {
public:
T& operator*() const { // 重载 * 运算符
return *px;
}

T *operator->() const { // 重载 -> 运算符
return px;
}
//...

private:
T *px;
// ...
};
int *px = new Foo;
shared_ptr<int> sp(px);

func(*sp);            // 语句1: 被解释为 func(*px)
sp -> method();        // 语句2: 被解释为 px -> method()

对于语句1,形式上解释得通,重载运算符*使得func(*sp)被编译器解释为func(*px)

对于语句2,形式上有瑕疵,重载运算符->使得sp ->被编译器解释为px,这样运算符->就被消耗掉了,只能理解为->运算符不会被消耗掉.

标准库中的迭代器_List_iterator也是一个伪指针类,代码如下:

1
2
3
4
5
6
7
8
9
10
11
template<class _Tp, class Ref, class Ptr>
struct _List_iterator {
_List_iterator& operator++() { ... }
_List_iterator operator++(int) { ... }
_List_iterator& operator--(){ ... }
_List_iterator operator--(int) { ... }
bool operator==(const _Self &__x) { ... }
bool operator!=(const _Self &__x) { ... }
Ref operator*() { ... }
Ptr operator->() { ... }
};

_List_iterator除了重载*->运算符之外,还重载了原生指针的其他运算符.

伪函数

伪函数(function-like classes)是指作用类似于函数的对象,实现方式是重载()运算符,标准库中的几个伪函数如下:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
template<class T>
struct identity {
const T &
operator()(const T &x) const { return x; }
};

template<class Pair>
struct select1st {
const typename Pair::first_type &
operator()(const Pair &x) const { return x.first; }
};

template<class Pair>
struct select2nd {
const typename Pair::second_type &
operator()(const Pair &x) const { return x.second; }
};

模板

类模板、函数模板和成员函数

  • 类模板实例化时需要指定具体类型:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
template<typename T>
class complex {
public:
complex(T r = 0, T i = 0)
: re(r), im(i)
{}

complex &operator+=(const complex &);

T real() const { return re; }
T imag() const { return im; }

private:
T re, im;
}
// 类模板实例化时需要指定具体类型
complex<double> c1(2.5, 1.5);
complex<int> c2(2, 6);
  • 函数模板在调用时编译器会进行参数推导(argument deduction),因此不需要指定具体类型:
1
2
3
4
template<class T>
inline const T &min(const T &a, const T &b) {
return b < a ? b : a;
}
// 函数模板实例化时不需要指定具体类型
min(3, 2);
min(complex(2, 3), complex(1, 5));
  • 成员模板用于指定成员函数的参数类型:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
template<class T1, class T2>
struct pair {
typedef T1 first_type;
typedef T1 second_type;

T1 first;
T2 second;

pair() : first(T1()), second(T2()) {}
pair(const T1 &a, const T2 &b) : first(a), second(b) {}

template<class U1, class U2>
pair(const pair<U1, U2> &p) :first(p.first), second(p.second) {}
}

这种结构通常用于实现子类到父类的转换.

模板.png

pair<Derived1, Derived2> p1;    // 使用子类构建对象
pair<Base1, Base2> p2(p1);        // 将子类对象应用到需要父类的参数上

模板的特化和偏特化

模板特化

模板特化用来部分针对某些特定参数类型执行操作:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
template<class Key>
struct hash {
// ...
};

template<>
struct hash<char> {
size_t operator()(char x) const { return x; }
};

template<>
struct hash<int> {
size_t operator()(char x) const { return x; }
};

template<>
struct hash<long> {
size_t operator()(char x) const { return x; }
};

上述代码实现针对charintlong这三个数据类型使用指定代码创建对象,其它数据类型使用默认的泛化操作创建对象.

模板偏特化

模板偏特化有两种形式:

  • 个数的偏: 指定部份参数类型
1
2
3
4
5
6
7
8
9
template<typename T, typename Alloc>
class vector{
// ...
};

template<typename Alloc>
class vector<bool, Alloc>{ // 指定了第一个参数类型
// ...
};
  • 范围的偏: 缩小参数类型的范围
1
2
3
4
5
6
7
8
9
10
11
12
template<typename T>
class C{
// 声明1...
};

template<typename T>
class C<T*>{ // 指定了参数类型为指针类型
// 声明2...
};

C<string> obj1; // 执行声明1
C<string*> obj2; // 执行声明2

模板模板参数

模板模板参数指的是,模板的参数也是一个模板

1
2
3
4
5
6
7
template<typename T, template<typename U> class Container>
class XCls {
private:
Container<T> c;
public:
// ...
};

在上面例子里,XCls的第二个模板参数template<typename U> class Container仍然是个模板,因此可以在类声明内使用Container<T> c语句对模板Container进行特化,使用方式如下:

XCls<string, list> mylst1;    // mylst1的成员变量c是一个list<string>

上面语句构造的mylst1变量的成员变量c是一个特化的类list<string>.仅从模板模板参数的语法来说,上面语句是正确的,但是实际上不能编译通过,因为list模板有2个模板参数,第二个模板参数通常会被省略,但在类声明体内不能省略其他模板参数,因此可以使用using语法达到目的:

template<typename T>
using LST = list<T, allocator<T>>

XCls<string, list> mylst2;    // mylst2的成员变量c是一个list<string>

这样就能够编译通过了,mylst2的成员变量c是一个特化的list.

下面这种情况不属于模板模板参数:

1
2
3
4
5
6
7
8
9
template<class T, class Sequence=deque<T>>
class stack {
friend bool operator== <>(const stack &, const stack &);
friend bool operator< <>(const stack &, const stack &);

protected:
Sequence c; // 底层容器
// ...
};

上面例子中stack类的第二模板参数class Sequence=deque<T>不再是一个模板,而是一个已经特化的类,在实现特化stack的时候需要同时特化class Sequence=deque<T>的模板参数.

stack<int> s1;                
stack<int, list<int>> s2;    // 特化第二模板参数时应传入特化的类而非模板

在上面的例子中s2在特化时第二模板参数被设为list<int>,是一个特化了的类,而非模板参数,实际上如果愿意的话,甚至可以将第二模板参数设为list<double>,与第一模板参数T不同,也能编译通过;而模板模板参数就不能这样了,模板模板参数的特化是在类声明体中进行的,类声明体里制定了使用第一模板参数来特化第二模板参数.

引用

声明引用(reference)时候必须赋初值,指定其代表某个变量,且之后不能再改变改引用的指向.
对引用调用=运算符同时改变引用和其指向变量的值,不改变引用的指向.

1
2
3
4
5
6
7
8
int x = 0;
int *p = &x;
int &r = x; // r代表x,现在r,x都是0

int x2 = 5;
r = x2; // r不能重新代表其他变量,现在r,x都是5

int &r2 = r; // 现在r2,r,x都是5(r2和r都代表x)

其内存结构如下所示:
引用的内存结构.png

引用的假象

虽然在实现上,几乎所有的编译器里引用的底层实现形式都是指针,但C++制造了以下两个假象,确保对于使用者来说引用和其指向的变相本身是一致的:

  • 引用对象和被指向的对象的大小相同.(sizeof(r)==sizeof(x))
  • 引用对象和被指向的对象地址相同.(&x==&r)

下面程序展示了这两点:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
typedef struct Stag { int a, b, c, d; } S;

int main(int argc, char **argv) {
double x = 0;
double *p = &x; // p指向x,p的值是x的地址
double &r = x; // r代表x,现在r,x都是0

cout << sizeof(x) << endl; // 8
cout << sizeof(p) << endl; // 4, 指针大小为4字节
cout << sizeof(r) << endl; // 8, 假象: r的大小和x相同,屏蔽了r底层的指针

cout << p << endl; // 0065FDFC, x的地址
cout << *p << endl; // 0
cout << x << endl; // 0
cout << r << endl; // 0
cout << &x << endl; // 0065FDFC
cout << &r << endl; // 0065FDFC, 假象: r的地址就是x的地址,屏蔽了r底层的指针

S s;
S &rs = s;
cout << sizeof(s) << endl; // 16
cout << sizeof(rs) << endl; // 16
cout << &s << endl; // 0065FDE8
cout << &rs << endl; // 0065FDE8

return 0;
}

引用的用途: 引用被用作美化的指针

在编写程序时,很少将变量类型声明为引用,引用一般用于声明参数类型(parameter type)和返回值类型(return type).

1
2
3
4
5
6
7
8
9
10
// 参数类型声明为引用,不影响函数体内使用变量的方式
void func1(Cls obj) { opj.xxx(); } // 值传递参数
void func2(Cls *Pobj) { pobj->XXX(); } // 指针传递参数,函数体内使用变量的方式需要修改
void func3(Cls &obj) { obj.xxx(); } // 引用传递参数,函数体内使用变量的方式与值传递相同

// 参数类型声明为引用,不影响参数传递的方式
Cls obj;
func1(obj); // 值传递参数
func2(&obj); // 指针传递参数,传递参数时需要对参数作出修改
func3(obj); // 引用传递参数,传递参数时不需对参数做出修改

值得注意的是,因为引用传递参数和值传递参数的用法相同,所以两个函数的函数签名(signature)相同,不能同时存在.

函数签名.png

有意思的是,指示常量成员函数的const也是函数签名的一部分,因此const和non-const的同名成员函数可以在同一类内共存.

对象模型

理解对象模型,才能真正理解多态和动态绑定.

成员函数和成员变量在内存中的分布

下面程序在内存中的布局如下所示:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
class A {
public:
virtual void vfunc1();
virtual void vfunc2();
void func1();
void func2();
private:
int m_data1;
int m_data2;
};

class B : public A {
public:
virtual void vfunc1();
void vfunc2();
private:
int m_data3;
};

class C : public B {
public:
virtual void vfunc1();
void vfunc2();
private:
int m_data1;
int m_data4;
};

其在内存中的布局如下图所示:

对象模型.png

先看成员变量部分: 对于成员变量来说,每个子类对象重都包含父类的成分,值得注意的是,C类的m_data1字段和父类A类的字段m_data1相同,这两个字段共存于C类的对象中.

再看函数的部分,每个含有虚函数的对象都包含一个特殊的指针vptr,指向存储函数指针的虚表vtbl.编译器根据vtbl表中存储的函数指针找到虚函数的具体实现.这种编译函数的方式被称为动态绑定.

静态绑定和动态绑定

  • 对于一般的非虚成员函数来说,其在内存中的地址是固定的,编译时只需将函数调用编译成call命令即可,这被称为静态绑定.

  • 对于虚成员函数,调用时根据虚表vtbl判断具体调用的实现函数,相当于先把函数调用翻译成(*(p->vptr)[n])(p),这被称为动态绑定.

静态绑定和动态绑定编译出的汇编代码如下所示:

非虚成员函数的静态绑定 虚函数的动态绑定
非虚函数的静态绑定.png 虚函数的动态绑定.png

虚函数触发动态绑定的条件是同时满足以下3个条件:

  • 必须是通过指针来调用函数.(实测,通过.运算符调用不会触发动态绑定)
  • 指针类型是对象的本身父类.
  • 调用的是虚函数.

常量成员函数

不改变成员变量的成员函数被称为常量成员函数,在函数体前需要有const修饰,在上一节课的笔记中可以看到,若常量成员函数不加以const修饰,常量对象就无法调用该函数.

指示常量成员函数的const被视为函数签名的一部分,也就是说constnon-const版本的同名成员函数可以同时存在.

两个版本的同名函数同时存在时,常量对象只能调用const版本的成员函数,非常量对象只能调用non-const版本的成员函数.

在STL的string类重载[]运算符时,就同时写了constnon-const版本的实现函数:

1
2
3
4
5
6
7
8
9
10
11
12
13
class template std::basic_string<...> {
// ...

charT operator[] (size_type pos) const { // 常量成员函数,只有常量对象才能调用该函数
// 不用考虑copy on write
// ...
}

reference operator[] (size_type pos) { // 非常量成员函数,只有非常量对象才能调用该函数
// 需要考虑copy on write
// ...
}
}

newdelete

区分new表达式和new运算符.我们一般程序中写的是new表达式

new表达式和delete表达式会被翻译成多条语句,其中用到了new运算符和delete运算符

new表达式的解析 delete表达式的解析
new表达式解析.png delete表达式解析.png

newdelete运算符

默认的newdelete运算符是通过mallocfree函数实现的,重载这四个函数会产生很大影响,因此一般不应重载这4个函数

new和delete运算符.png

重载newdelete运算符

可以在类定义中重载newdeletenew[]delete[]运算符,重载之后new语句创建该类别实例时会调用重载的new运算符.

若重载之后却仍要使用默认的new运算符,可以使用::new::delete语句.

重载new、delete运算符 重载new[]、delete[]运算符
重载new.png 重载new_array.png

下面例子演示了分别使用重载的newdelete运算符和原生newdelete运算符的程序运行结果,重载函数的实现如下所示:

重载new的实现.png

程序输出如下所示:

调用重载new、delete、new[]、delete[]运算符 调用默认new、delete、new[]、delete[]运算符
输出1.png 输出2.png

从上面程序的执行结果中,可以看出以下几点:

  • 含有虚函数的对象不含虚函数的对象的大小多出了4个字节,这4个字节存储虚函数指针vptr.
  • new运算符接收参数为对象所占字节数,new[]运算符接收参数为数组所占字节数加4,多出的4个字节用于存储数组长度.
  • new[]delete[]运算符会对数组中每个元素依次调用构造函数和析构函数.

重载多个版本newdelete运算符

  • 可以重载多个版本new运算符,前提是每个版本都必须有独特的参数列表,且第一个参数必须为size_t类型的,其余参数以new语句中指定的参数为初值.

例如类Foo重载new运算符的函数operator new(size_t, int, char)可以通过语句Foo *pf = new(300, 'c') Foo()调用,第一个括号内的参数为operator new的参数,第二个括号内的参数为构造函数的参数.

  • 也可以重载多个版本的delete运算符,但它们不会被delete语句调用.只有当new语句所调用的构造函数抛出异常时,才会调用对应的delete运算符,主要用来归还未能完全创建成功的对象所占用的内存.

下面例子展示多个重载版本的newdelete运算符

多个重载的new.png

可以看到,在实际程序运行时,构造函数抛出异常后是否调用对应参数的delete运算符与编译器版本有关,是一个比较微妙的事情.

STL的string类重载了new操作符以申请额外空间.

new申请额外空间.png