内存管理系列文章：

引言

苹果设备受欢迎的背后离不开iOS优秀的内存管理，不同场景，系统提供了不同的内存管理方案来节省内存和提高执行效率，大致有如下三种：

TaggedPointer （对于一些小对象，比如说NSNumber,NSString等）
NONPOINTER_ISA （不仅仅是指针）
散列表SideTables

TaggedPointer

为了节省内存和提高执行效率，苹果提出了Tagged Pointer的概念。对于 64 位程序，引入 Tagged Pointer 后，相关逻辑能减少一半的内存占用，苹果对于Tagged Pointer特点的介绍：

Tagged Pointer专门用来存储小的对象，例如NSNumber和NSDate
Tagged Pointer指针的值不再是地址了，而是真正的值。所以，实际上它不再是一个对象了，它只是一个披着对象皮的普通变量而已。所以，它的内存并不存储在堆中，也不需要 malloc 和 free。
在内存读取上有着 3 倍的效率，创建时比以前快 106 倍。

为什么会出现TaggedPointer

假设我们要存储一个 NSNumber 对象，其值是一个整数。正常情况下，如果这个整数只是一个 NSInteger 的普通变量，那么它所占用的内存是与 CPU 的位数有关，在 32 位 CPU 下占 4 个字节，在 64 位 CPU 下是占 8 个字节的。而指针类型的大小通常也是与 CPU 位数相关，一个指针所占用的内存在 32 位 CPU 下为 4 个字节，在 64 位 CPU 下也是 8 个字节。

所以一个普通的 iOS 程序，如果没有Tagged Pointer对象，从 32 位机器迁移到 64 位机器中后，虽然逻辑没有任何变化，但这种 NSNumber、NSDate 一类的对象所占用的内存会翻倍。如下图所示：

为了存储和访问一个 NSNumber 对象，我们需要在堆上为其分配内存，另外还要维护它的引用计数，管理它的生命期。这些都给程序增加了额外的逻辑，造成运行效率上的损失，所以需要一种解决方案（TaggedPointer）来节省内存和提高执行效率。

TaggedPointer的原理

为了改进上面提到的内存占用和效率问题，苹果提出了Tagged Pointer对象。由于 NSNumber、NSDate 一类的变量本身的值需要占用的内存大小常常不需要 8 个字节，拿整数来说，4 个字节所能表示的有符号整数就可以达到 20 多亿（注：2^31=2147483648，另外 1 位作为符号位)，对于绝大多数情况都是可以处理的。

所以我们可以将一个对象的指针拆成两部分，一部分直接保存数据，另一部分作为特殊标记，表示这是一个特别的指针，不指向任何一个地址。所以，引入了Tagged Pointer对象之后，64 位 CPU 下 NSNumber 的内存图变成了以下这样：

方案对比： 当NSNumber、NSDate、NSString存值很小的情况下

在没有使用TaggedPointer之前：
- NSNumber等对象需要动态分配内存、维护引用计数等，NSNumber指针存储的是堆中NSNumber对象的地址值（需要创建OC对象）
使用TaggedPointer之后：
- NSNumber指针里面存储的数据变成了：Tag + Data，也就是将数据直接存储在了指针中（不需要创建OC对象）
当存值很大，指针不够存储数据时（超过64位），才会使用动态分配内存的方式来存储数据（创建OC对象）
消息调用时，objc_msgSend 能识别TaggedPointer，比如NSNumber的intValue方法，直接从指针提取数据，节省了以前的调用开销（而且这不是真的OC对象，根本就没有isa去找方法）

demo

int main(int argc, const char * argv[]) {
    @autoreleasepool {
        NSNumber *num1 = @3;
        NSNumber *num2 = @4;
        NSNumber *num3 = @5;
        // 数值太大，64位不够放，得alloc生成个对象来保存
        NSNumber *num4 = @(0xFFFFFFFFFFFFFFFF); 
        // 小数值的NSNumber对象，并不是alloc出来放在堆中的对象，只是一个单纯的指针，目标值是存放在指针的地址值中
        NSLog(@"%p %p %p %p", num1, num2, num3, num4); 
        }
    }
// 打印日志
2020-03-23 16:10:30.888204+0800 04-内存管理-Tagged Pointer[6079:225288] 0x2027be5cc632c957 0x2027be5cc632ce57 0x2027be5cc632cf57 0x100512050

说明：猜测是iOS13之后底层多加了一层掩码，以前输出num1, num2, num3地址是0x327 0x427 0x527 ，直接可以从地址里面看到NSNumber的值

如何判定是否是TaggedPointer

判定规则：将某个对象和1进行位运算

iOS平台的判定位为最高有效位（第64位）
Mac平台的判定位为最低有效位（第1位）

判定为是【1】就是TaggedPointer，否则这就是分配到堆中的OC对象的内存地址（OC对象在内存中以16对齐，因此有效位肯定是0，16 = 0x10 = 0b00010000）。

BOOL isTaggedPointer(id pointer) {
    return (long)(__bridge void *)pointer & (long)1; // Mac平台是最低有效位（第1位）
 }
int main(int argc, const char * argv[]) {
   @autoreleasepool {
    NSNumber *num3 = @5;
    NSNumber *num4 = @(0xFFFFFFFFFFFFFFFF); 
    NSLog(@"%d %d ", isTaggedPointer(num3), isTaggedPointer(num4));
 }
}
// 打印日志
2020-03-23 16:10:30.888286+0800 04-内存管理-Tagged Pointer[6079:225288] 1 0

优点

TaggedPointer技术的好处：

1、存值：直接把值存到指针中，不需要再新建一个OC对象来保存（额外多分配至少16个字节）— 省内存
2、取值：直接从指针中把目标值抽取出来，不需要像OC对象那样，先从类对象的方法列表中查找再调用来获取那么麻烦 — 性能好、效率高

NONPOINTER_ISA

在arm64位下iOS操作系统，Objective-C对象的isa区域不再只是一个指针，在64位架构下的isa指针是64bit位，实际上33位就能够表示类对象（或元类对象）的地址，为了提供内存的利用率，在剩余的bit位当中添加了内存管理的数据内容

位域简介

有些数据在存储时并不需要占用一个完整的字节，只需要占用一个或几个二进制位就可以了。

正是基于这种考虑，C语言又提供了一种叫做位域的数据结构。在结构体定义时，我们可以指定某个成员变量所占用的二进制位数（Bit），这就是位域。

上个demo

struct {
        char name : 1;
        char number : 1;
        char sex : 1;
 } Person;

简单总结：

“:1”代表只占1位的意思，这里声明的这3个成员就各占1bit，共3bit,所以这个结构体只需要用到3bit的内存，这样系统只需要分配1个字节就够用了（内存分配至少也得1个字节）
结构体定义的顺序，在内存里面对应的字节顺序是从右往左的

// 0b00000 0    0    0
           ↓    ↓    ↓
          sex number name

共同体union简介

union和struct区别

1、内存占用方式：与结构体不同的是，共用体的所有成员占用同一段内存，修改一个成员会影响其余成员。但是结构体的各个成员会占不同的内存
2、内存大小：结构体占用的内存大于等于所有成员占用的内存总和（成员之间可能存在缝隙），共用体占用的内存等于最长的成员占用的内存

**union的使用 **

  union {
     int  number; // 占4字节
     float age;  // 占8字节
   } person; // 以最大的那一个成员的内存来分配，所以共同体占8字节

   test.number = 3;
   test.age = 20;

猜测下number的结果:

此时再次访问 test.number 就不再是3，而是20了，因为这两个成员共用一块内存，之前的3被覆盖了

union的变体

   union {
        char content;
        //【这个结构体纯属摆设】自始至终只操作content，不会用到这个结构体，不影响存储
        struct {  
             char name : 1;
             char number : 1;
             char sex : 1;
        };

    }person

简单总结：

1、 union中的struct主要是为了提高可读性，用来说明content里面存放的是这3个成员信息，并且每一个成员占1位，描述性作用。
2、外部操作的是content，不会对struct进行操作

isa结构

arm64架构之前，isa是一个普通的指针，存储着Class、MetaClass对象的地址
从arm64架构之后，苹果对isa进行了优化，变成了一个公用体

# 只看arm64情况下
union isa_t {
    Class cls;
    uintptr_t bits;
    struct {
      uintptr_t nonpointer        : 1;                                       \
      uintptr_t has_assoc         : 1;                                       \
      uintptr_t has_cxx_dtor      : 1;                                       \
      uintptr_t shiftcls          : 33; /*MACH_VM_MAX_ADDRESS 0x1000000000*/ \
      uintptr_t magic             : 6;                                       \
      uintptr_t weakly_referenced : 1;                                       \
      uintptr_t deallocating      : 1;                                       \
      uintptr_t has_sidetable_rc  : 1;                                       \
      uintptr_t extra_rc          : 19
    };
};

字段含义解释

1、 nonpointer：0，代表普通的指针，存储着Class、Meta-Class对象的内存地址。 1，代表优化过，使用位域存储更多的信息
2、 has_assoc：是否有设置过关联对象，如果没有，释放时会更快
3、 has_cxx_dtor：是否有C++的析构函数（.cxx_destruct），如果没有，释放时会更快
4、 shiftcls：存储着Class、Meta-Class对象的内存地址信息
5、 magic：用于在调试时分辨对象是否未完成初始化
6、 weakly_referenced：是否有被弱引用指向过，如果没有，释放时会更快
7、 deallocating：对象是否正在释放
8、 extra_rc：里面存储的值是引用计数器减1
9、 has_sidetable_rc：引用计数器是否过大无法存储在isa中，如果为1，那么引用计数会存储在一个叫SideTable的类的属性中。

但是如果 extar_rc不够存储的话，就需要将引用计数存入一个叫 Side Table 的数据结构中。

散列表(SideTables)

SideTables()实际是一个哈希表，我们可以通过对象指针，找到所对应的引用计数表或弱引用表位于哪个SideTable表中。也就是有多个sideTable表

思考：为什么不是一个大表，而是多个表？

回答：如果只有一张表，所有对象的引用计数都放到一张表中，则如果在修改某个对象的引用计数的时候，由于对象可能在不同线程中被操作，则需要对表进行加锁，这样一来，效率就会极地。

什么是哈希表

是根据关键码值(Key value)而直接进行访问的数据结构。也就是说，它通过把关键码值映射到表中一个位置来访问记录，以加快查找的速度，赋值和获取都避免了遍历，提高了效率

SideTable结构

底层源码结构如下：

struct SideTable {
    spinlock_t slock;//自旋锁
    RefcountMap refcnts;//引用计数表
    weak_table_t weak_table;//弱引用表
   }

可以看到SideTable是由三部分组成

Spinlock_t自旋锁

自旋锁来用来防止操作表结构时可能的竞态条件，适用于轻量访问。比如引用计数的修改
Spinlock_t是“忙等”的锁，对SideTable加锁，避免数据错误

引用计数表RefcountMap

引用计数表也是一个hash表，通过hash函数找到指针对应的引用计数的位置。

弱引用表weak_table_t

弱引用表也是一个hash表，通过hash函数找到对象对应的弱引用数组

底层结构：

struct weak_table_t {
    weak_entry_t *weak_entries;
    size_t    num_entries;
};

参考文章：

文章永久链接：https://tech.souyunku.com/31639

内存管理系列OC的内存管理方案

引言