内存管理系列文章:
引言
苹果设备受欢迎的背后离不开iOS优秀的内存管理,不同场景,系统提供了不同的内存管理方案来节省内存和提高执行效率,大致有如下三种:
- TaggedPointer (对于一些小对象,比如说NSNumber,NSString等)
- NONPOINTER_ISA (不仅仅是指针)
- 散列表SideTables
TaggedPointer
为了节省内存和提高执行效率,苹果提出了Tagged Pointer的概念。对于 64 位程序,引入 Tagged Pointer 后,相关逻辑能减少一半的内存占用,苹果对于Tagged Pointer特点的介绍:
- Tagged Pointer专门用来存储小的对象,例如NSNumber和NSDate
- Tagged Pointer指针的值不再是地址了,而是真正的值。所以,实际上它不再是一个对象了,它只是一个披着对象皮的普通变量而已。所以,它的内存并不存储在堆中,也不需要 malloc 和 free。
- 在内存读取上有着 3 倍的效率,创建时比以前快 106 倍。
为什么会出现TaggedPointer
假设我们要存储一个 NSNumber 对象,其值是一个整数。正常情况下,如果这个整数只是一个 NSInteger 的普通变量,那么它所占用的内存是与 CPU 的位数有关,在 32 位 CPU 下占 4 个字节,在 64 位 CPU 下是占 8 个字节的。而指针类型的大小通常也是与 CPU 位数相关,一个指针所占用的内存在 32 位 CPU 下为 4 个字节,在 64 位 CPU 下也是 8 个字节。
所以一个普通的 iOS 程序,如果没有Tagged Pointer对象,从 32 位机器迁移到 64 位机器中后,虽然逻辑没有任何变化,但这种 NSNumber、NSDate 一类的对象所占用的内存会翻倍。如下图所示:
为了存储和访问一个 NSNumber 对象,我们需要在堆上为其分配内存,另外还要维护它的引用计数,管理它的生命期。这些都给程序增加了额外的逻辑,造成运行效率上的损失,所以需要一种解决方案(TaggedPointer)来节省内存和提高执行效率。
TaggedPointer的原理
为了改进上面提到的内存占用和效率问题,苹果提出了Tagged Pointer对象。由于 NSNumber、NSDate 一类的变量本身的值需要占用的内存大小常常不需要 8 个字节,拿整数来说,4 个字节所能表示的有符号整数就可以达到 20 多亿(注:2^31=2147483648,另外 1 位作为符号位),对于绝大多数情况都是可以处理的。
所以我们可以将一个对象的指针拆成两部分,一部分直接保存数据,另一部分作为特殊标记,表示这是一个特别的指针,不指向任何一个地址。所以,引入了Tagged Pointer对象之后,64 位 CPU 下 NSNumber 的内存图变成了以下这样:
方案对比: 当NSNumber、NSDate、NSString存值很小的情况下
- 在没有使用TaggedPointer之前:
- NSNumber等对象需要动态分配内存、维护引用计数等,NSNumber指针存储的是堆中NSNumber对象的地址值(需要创建OC对象)
- 使用TaggedPointer之后:
- NSNumber指针里面存储的数据变成了:Tag + Data,也就是将数据直接存储在了指针中(不需要创建OC对象)
- 当存值很大,指针不够存储数据时(超过64位),才会使用动态分配内存的方式来存储数据(创建OC对象)
- 消息调用时,objc_msgSend 能识别TaggedPointer,比如NSNumber的intValue方法,直接从指针提取数据,节省了以前的调用开销(而且这不是真的OC对象,根本就没有isa去找方法)
demo
int main(int argc, const char * argv[]) {
@autoreleasepool {
NSNumber *num1 = @3;
NSNumber *num2 = @4;
NSNumber *num3 = @5;
// 数值太大,64位不够放,得alloc生成个对象来保存
NSNumber *num4 = @(0xFFFFFFFFFFFFFFFF);
// 小数值的NSNumber对象,并不是alloc出来放在堆中的对象,只是一个单纯的指针,目标值是存放在指针的地址值中
NSLog(@"%p %p %p %p", num1, num2, num3, num4);
}
}
// 打印日志
2020-03-23 16:10:30.888204+0800 04-内存管理-Tagged Pointer[6079:225288] 0x2027be5cc632c957 0x2027be5cc632ce57 0x2027be5cc632cf57 0x100512050
说明: 猜测是iOS13之后底层多加了一层掩码,以前输出num1, num2, num3地址是0x327 0x427 0x527 ,直接可以从地址里面看到NSNumber的值
如何判定是否是TaggedPointer
判定规则:将某个对象和1进行位运算
- iOS平台的判定位为最高有效位(第64位)
- Mac平台的判定位为最低有效位(第1位)
判定为是【1】就是TaggedPointer,否则这就是分配到堆中的OC对象的内存地址(OC对象在内存中以16对齐,因此有效位肯定是0,16 = 0x10 = 0b00010000)。
BOOL isTaggedPointer(id pointer) {
return (long)(__bridge void *)pointer & (long)1; // Mac平台是最低有效位(第1位)
}
int main(int argc, const char * argv[]) {
@autoreleasepool {
NSNumber *num3 = @5;
NSNumber *num4 = @(0xFFFFFFFFFFFFFFFF);
NSLog(@"%d %d ", isTaggedPointer(num3), isTaggedPointer(num4));
}
}
// 打印日志
2020-03-23 16:10:30.888286+0800 04-内存管理-Tagged Pointer[6079:225288] 1 0
优点
TaggedPointer技术的好处:
1、 存值:直接把值存到指针中,不需要再新建一个OC对象来保存(额外多分配至少16个字节)— 省内存
2、 取值:直接从指针中把目标值抽取出来,不需要像OC对象那样,先从类对象的方法列表中查找再调用来获取那么麻烦 — 性能好、效率高
NONPOINTER_ISA
在arm64位下iOS操作系统,Objective-C对象的isa区域不再只是一个指针,在64位架构下的isa指针是64bit位,实际上33位就能够表示类对象(或元类对象)的地址,为了提供内存的利用率,在剩余的bit位当中添加了内存管理的数据内容
位域简介
有些数据在存储时并不需要占用一个完整的字节,只需要占用一个或几个二进制位就可以了。
正是基于这种考虑,C语言又提供了一种叫做位域的数据结构。在结构体定义时,我们可以指定某个成员变量所占用的二进制位数(Bit),这就是位域。
上个demo
struct {
char name : 1;
char number : 1;
char sex : 1;
} Person;
简单总结:
- “:1”代表只占1位的意思,这里声明的这3个成员就各占1bit,共3bit,所以这个结构体只需要用到3bit的内存,这样系统只需要分配1个字节就够用了(内存分配至少也得1个字节)
- 结构体定义的顺序,在内存里面对应的字节顺序是从右往左的
// 0b00000 0 0 0
↓ ↓ ↓
sex number name
共同体union简介
- union和struct区别
1、 内存占用方式:与结构体不同的是,共用体的所有成员占用同一段内存,修改一个成员会影响其余成员。但是结构体的各个成员会占不同的内存
2、 内存大小:结构体占用的内存大于等于所有成员占用的内存总和(成员之间可能存在缝隙),共用体占用的内存等于最长的成员占用的内存
- **union的使用 **
union {
int number; // 占4字节
float age; // 占8字节
} person; // 以最大的那一个成员的内存来分配,所以共同体占8字节
test.number = 3;
test.age = 20;
猜测下number的结果:
此时再次访问 test.number 就不再是3,而是20了,因为这两个成员共用一块内存,之前的3被覆盖了
- union的变体
union {
char content;
//【这个结构体纯属摆设】自始至终只操作content,不会用到这个结构体,不影响存储
struct {
char name : 1;
char number : 1;
char sex : 1;
};
}person
简单总结:
1、 union中的struct主要是为了提高可读性,用来说明content里面存放的是这3个成员信息,并且每一个成员占1位,描述性作用。
2、 外部操作的是content,不会对struct进行操作
isa结构
- arm64架构之前,isa是一个普通的指针,存储着Class、MetaClass对象的地址
- 从arm64架构之后,苹果对isa进行了优化,变成了一个公用体
# 只看arm64情况下
union isa_t {
Class cls;
uintptr_t bits;
struct {
uintptr_t nonpointer : 1; \
uintptr_t has_assoc : 1; \
uintptr_t has_cxx_dtor : 1; \
uintptr_t shiftcls : 33; /*MACH_VM_MAX_ADDRESS 0x1000000000*/ \
uintptr_t magic : 6; \
uintptr_t weakly_referenced : 1; \
uintptr_t deallocating : 1; \
uintptr_t has_sidetable_rc : 1; \
uintptr_t extra_rc : 19
};
};
字段含义解释
1、 nonpointer:0,代表普通的指针,存储着Class、Meta-Class对象的内存地址。 1,代表优化过,使用位域存储更多的信息
2、 has_assoc:是否有设置过关联对象,如果没有,释放时会更快
3、 has_cxx_dtor:是否有C++的析构函数(.cxx_destruct),如果没有,释放时会更快
4、 shiftcls:存储着Class、Meta-Class对象的内存地址信息
5、 magic: 用于在调试时分辨对象是否未完成初始化
6、 weakly_referenced:是否有被弱引用指向过,如果没有,释放时会更快
7、 deallocating:对象是否正在释放
8、 extra_rc:里面存储的值是引用计数器减1
9、 has_sidetable_rc:引用计数器是否过大无法存储在isa中,如果为1,那么引用计数会存储在一个叫SideTable的类的属性中。
但是如果 extar_rc不够存储的话,就需要将引用计数存入一个叫 Side Table 的数据结构中。
散列表(SideTables)
SideTables()实际是一个哈希表,我们可以通过对象指针,找到所对应的引用计数表或弱引用表位于哪个SideTable表中。也就是有多个sideTable表
思考:为什么不是一个大表,而是多个表?
回答:如果只有一张表,所有对象的引用计数都放到一张表中,则如果在修改某个对象的引用计数的时候,由于对象可能在不同线程中被操作,则需要对表进行加锁,这样一来,效率就会极地。
什么是哈希表
是根据关键码值(Key value)而直接进行访问的数据结构。也就是说,它通过把关键码值映射到表中一个位置来访问记录,以加快查找的速度,赋值和获取都避免了遍历,提高了效率
SideTable结构
底层源码结构如下:
struct SideTable {
spinlock_t slock;//自旋锁
RefcountMap refcnts;//引用计数表
weak_table_t weak_table;//弱引用表
}
可以看到SideTable是由三部分组成
Spinlock_t自旋锁
- 自旋锁来用来防止操作表结构时可能的竞态条件,适用于轻量访问。比如引用计数的修改
- Spinlock_t是“忙等”的锁,对SideTable加锁,避免数据错误
引用计数表RefcountMap
引用计数表也是一个hash表,通过hash函数找到指针对应的引用计数的位置。
弱引用表weak_table_t
弱引用表也是一个hash表,通过hash函数找到对象对应的弱引用数组
底层结构:
struct weak_table_t {
weak_entry_t *weak_entries;
size_t num_entries;
};
参考文章: