【iOS】——weak底层原理

weak实现原理

weak是弱引用,所引用对象的计数器不会加一,并在引用对象被释放的时候自动被设置为nil。weak的本质其实是哈希表,用所引用的对象的地址作为key,用weak指针的地址集合作为value

这里所说的weak指针的地址集合是说所指对象指针的地址,也就是地址的地址。

weak的实现原理如下:

  • 初始化:runtime会调用objc_initWeak函数,初始化一个新的weak指针指向对象的地址。

  • 添加引用objc_initWeak函数会调用objc_storeWeak()函数, objc_storeWeak() 的作用是更新指针指向,创建对应的弱引用表。

  • 释放:调用clearDeallocating函数。clearDeallocating函数首先根据对象地址获取所有weak指针地址的数组,然后遍历这个数组把其中的数据设为nil,最后把这个entry从weak表中删除,清理对象的记录。

初始化

img

初始化一个weak变量时,runtime会调用 NSObject.mm 中的objc_initWeak函数:

  	NSObject *obj = [[NSObject alloc] init];
    id __weak obj1 = obj;

在这里插入图片描述

objc_initWeak方法

下面是objc_initWeak() 方法的源码:

// location指针obj1 , newObj原始对象obj
id objc_initWeak(id *location, id newObj) {
// 查看原始对象实例是否有效
// 无效对象直接导致指针释放
    if (!newObj) {
        *location = nil;
        return nil;
    }
    // 这里传递了三个 bool 数值
    // 使用 template 进行常量参数传递是为了优化性能
    return storeWeak<false/*old*/, true/*new*/, true/*crash*/>
    (location, (objc_object*)newObj);
}

该方法的两个参数locationnewObjlocation __weak指针的地址,存储指针的地址,即例子中obj1的地址,这样便可以在最后将其指向的对象置为nil。newObj :所引用的对象。即例子中的obj 。

objc_initWeak方法只是一个深层次函数调用的入口,在该方法内部调用了storeWeak 方法。下面我们来看下storeWeak 方法的实现代码。

storeWeak方法

源码如下:

// Template parameters.
// HaveOld:  true - 变量有值
//          false - 需要被及时清理,当前值可能为 nil
// HaveNew:  true - 需要被分配的新值,当前值可能为 nil
//          false - 不需要分配新值
// CrashIfDeallocating: true - 说明 newObj 已经释放或者 newObj 不支持弱引用,该过程需要暂停// 
enum HaveOld { DontHaveOld = false, DoHaveOld = true };
enum HaveNew { DontHaveNew = false, DoHaveNew = true };
enum CrashIfDeallocating {
    DontCrashIfDeallocating = false, DoCrashIfDeallocating = true
};

template <HaveOld haveOld, HaveNew haveNew,
          CrashIfDeallocating crashIfDeallocating>
static id
storeWeak(id *location, objc_object *newObj)
{
    assert(haveOld  ||  haveNew);
    if (!haveNew) assert(newObj == nil);
		//初始化previouslyInitializedClass 指针
    Class previouslyInitializedClass = nil;
    id oldObj;
    //1.创建新旧两个sidetable
    SideTable *oldTable;
    SideTable *newTable;

    // 获得新值和旧值的锁存位置(用地址作为唯一标示)
    // 通过地址来建立索引标志,防止桶重复
    // 下面指向的操作会改变旧值
 retry:
    if (haveOld) { // 如果weak ptr之前弱引用过一个obj,则将这个obj所对应的SideTable取出,赋值给oldTable
        oldObj = *location;
        oldTable = &SideTables()[oldObj];
    } else {
        oldTable = nil; // 如果weak ptr之前没有弱引用过一个obj,则oldTable = nil
    }
    if (haveNew) { // 如果weak ptr要weak引用一个新的obj,则将该obj对应的SideTable取出,赋值给newTable
        newTable = &SideTables()[newObj];
    } else {
        newTable = nil; // 如果weak ptr不需要引用一个新obj,则newTable = nil
    }
    
    // 加锁操作,防止多线程中竞争冲突
    SideTable::lockTwo<haveOld, haveNew>(oldTable, newTable);

    // location 应该与 oldObj 保持一致,如果不同,说明当前的 location 已经处理过 oldObj 可是又被其他线程所修改
    if (haveOld  &&  *location != oldObj) {
        SideTable::unlockTwo<haveOld, haveNew>(oldTable, newTable);
        goto retry;
    }

    // Prevent a deadlock between the weak reference machinery
    // and the +initialize machinery by ensuring that no
    // weakly-referenced object has an un-+initialized isa.
    if (haveNew  &&  newObj) {
        Class cls = newObj->getIsa();
        if (cls != previouslyInitializedClass  &&
            !((objc_class *)cls)->isInitialized())  // 如果cls还没有初始化,先初始化,再尝试设置weak
        {
            SideTable::unlockTwo<haveOld, haveNew>(oldTable, newTable);
            _class_initialize(_class_getNonMetaClass(cls, (id)newObj));

            // If this class is finished with +initialize then we're good.
            // If this class is still running +initialize on this thread
            // (i.e. +initialize called storeWeak on an instance of itself)
            // then we may proceed but it will appear initializing and
            // not yet initialized to the check above.
            // Instead set previouslyInitializedClass to recognize it on retry.
            previouslyInitializedClass = cls; // 这里记录一下previouslyInitializedClass, 防止改if分支再次进入

            goto retry; // 重新获取一遍newObj,这时的newObj应该已经初始化过了
        }
    }
		//2.清理旧值
    if (haveOld) {
        weak_unregister_no_lock(&oldTable->weak_table, oldObj, location); // 如果weak_ptr之前弱引用过别的对象oldObj,则调用weak_unregister_no_lock,在oldObj的weak_entry_t中移除该weak_ptr地址
    }
		//3.分配新值
    if (haveNew) { // 如果weak_ptr需要弱引用新的对象newObj
        // (1) 调用weak_register_no_lock方法,将weak ptr的地址记录到newObj对应的weak_entry_t中
        newObj = (objc_object *)
            weak_register_no_lock(&newTable->weak_table, (id)newObj, location,
                                  crashIfDeallocating);
        // weak_register_no_lock returns nil if weak store should be rejected
        
        // (2) 更新newObj的isa的weakly_referenced bit标志位
        // Set is-weakly-referenced bit in refcount table.
        if (newObj  &&  !newObj->isTaggedPointer()) {
            newObj->setWeaklyReferenced_nolock();
        }

        // Do not set *location anywhere else. That would introduce a race.
        // (3)*location 赋值,也就是将weak ptr直接指向了newObj。可以看到,这里并没有将newObj的引用计数+1
        *location = (id)newObj; // 将weak ptr指向object
    }
    else {
        // No new value. The storage is not changed.
    }
    
    // 解锁,其他线程可以访问oldTable, newTable了
    SideTable::unlockTwo<haveOld, haveNew>(oldTable, newTable);

    return (id)newObj; // 返回newObj,此时的newObj与刚传入时相比,weakly-referenced bit位置1
}

storeWeak方法实际上是接收了5个参数,分别是haveOldhaveNewcrashIfDeallocatinglocation

newobj

haveOldhaveNewcrashIfDeallocating这三个参数都是以模板的方式传入的,是三个bool类型的参数。 分别表示weak指针之前是否指向了一个弱引用weak指针是否需要指向一个新的引用若果被弱引用的对象正在析构,此时再弱引用该对象是否应该crash

  • 维护了oldTable newTable分别表示旧的引用弱表和新的弱引用表,它们都是SideTable的hash表。

  • 如果weak指针之前指向了一个弱引用,则会调用weak_unregister_no_lock 方法将旧的weak指针地址移除。

  • 如果weak指针需要指向一个新的引用,则会调用weak_register_no_lock 方法将新的weak指针地址添加到弱引用表中。

  • 调用setWeaklyReferenced_nolock 方法修改weak新引用的对象的bit标志位

那么这个方法中的重点也就是weak_unregister_no_lock weak_register_no_lock 这两个方法。而这两个方法都是操作的SideTable 这样一个结构的变量,那么我们需要先来了解下SideTable

Side Table

定义如下:

struct SideTable {
// 保证原子操作的自旋锁    
		spinlock_t slock;
// 引用计数的 hash 表
    RefcountMap refcnts;
// weak 引用全局 hash 表
    weak_table_t weak_table;
}

spinlock_t slock : 自旋锁,用于上锁/解锁 SideTable。

RefcountMap refcnts :用来存储OC对象的引用计数的 hash表(仅在未开启isa优化或在isa优化情况下isa_t的引用计数溢出时才会用到)。

weak_table_t weak_table : 存储对象弱引用指针的hash表。是OC中weak功能实现的核心数据结构。

weak_table_t

/**
   全局的弱引用表, 保存object作为key, weak_entry_t作为value
 * The global weak references table. Stores object ids as keys,
 * and weak_entry_t structs as their values.
 */
struct weak_table_t {
    // 保存了所有指向特地对象的 weak指针集合
    weak_entry_t *weak_entries;
    // weak_table_t中有多少个weak_entry_t
    size_t    num_entries;
    // weak_entry_t数组的count
    uintptr_t mask;
    // hash key 最大偏移值,
    // 采用了开放定制法解决hash冲突,超过max_hash_displacement说明weak_table_t中不存在要找的weak_entry_t
    uintptr_t max_hash_displacement;
};

weak_entries: hash数组,用来存储弱引用对象的相关信息weak_entry_t

num_entries: hash数组中的元素个数

mask:hash数组长度-1,会参与hash计算。(注意,这里是hash数组的长度,而不是元素个数。比如,数组长度可能是64,而元素个数仅存了2个)

max_hash_displacement:可能会发生的hash冲突的最大次数,用于判断是否出现了逻辑错误(hash表中的冲突次数绝不会超过改值)

weak_table_t是hash结构。使用不定类型对象的地址作为 key ,用 weak_entry_t 类型结构体对象作为 value 。 weak_entries 成员,从字面意思上看,即为弱引用表入口。

weak_entry_t

弱引用表的结构是一个hash结构的表,Key是所指对象的地址,Value是weak指针的地址(这个地址的值是所指对象的地址)数组

#define WEAK_INLINE_COUNT 4
#define REFERRERS_OUT_OF_LINE 2

struct weak_entry_t {
    DisguisedPtr<objc_object> referent; // 被弱引用的对象
    
    // 引用该对象的对象列表,联合。 引用个数小于4,用inline_referrers数组。 用个数大于4,用动态数组weak_referrer_t *referrers
    union {
        struct {
            weak_referrer_t *referrers;                      // 弱引用该对象的对象指针地址的hash数组
            uintptr_t        out_of_line_ness : 2;           // 是否使用动态hash数组标记位
            uintptr_t        num_refs : PTR_MINUS_2;         // hash数组中的元素个数
            uintptr_t        mask;                           // hash数组长度-1,会参与hash计算。(注意,这里是hash数组的长度,而不是元素个数。比如,数组长度可能是64,而元素个数仅存了2个)素个数)。
            uintptr_t        max_hash_displacement;          // 可能会发生的hash冲突的最大次数,用于判断是否出现了逻辑错误(hash表中的冲突次数绝不会超过改值),采用开放定址法
        };
        struct {
            // out_of_line_ness field is low bits of inline_referrers[1]
            weak_referrer_t  inline_referrers[WEAK_INLINE_COUNT];
        };
    };
		//判断是否使用了动态标记位,如果返回false说明使用了
    bool out_of_line() {
        return (out_of_line_ness == REFERRERS_OUT_OF_LINE);
    }

    weak_entry_t& operator=(const weak_entry_t& other) {
        memcpy(this, &other, sizeof(other));
        return *this;
    }

    weak_entry_t(objc_object *newReferent, objc_object **newReferrer)
        : referent(newReferent) // 构造方法,里面初始化了静态数组
    {
        inline_referrers[0] = newReferrer;
        for (int i = 1; i < WEAK_INLINE_COUNT; i++) {
            inline_referrers[i] = nil;
        }
    }
};

  • DisguisedPtr referent :是对泛型对象的指针做了一个封装,通过这个泛型类来解决内存泄漏的问题。

  • out_of_line:标志位。标志着weak_entry_t中是用数组保存还是hash表保存weak指针。

  • num_refs:引用数值。这里记录weak_entry_t表中weak指针的数量,

  • maskweak_entry_t->referrers数组的大小

  • max_hash_displacement:hash key 最大偏移值, 采用了开放定制法解决hash冲突,超过max_hash_displacement说明weak_entry_t中不存在要找的weak_entry_t。

在联合体的内部有定长数组inline_referrers[WEAK_INLINE_COUNT]和动态数组weak_referrer_t *referrers两种方式来存储弱引用对象的指针地址。通过out_of_line()这样一个函数方法来判断采用哪种存储方式。当弱引用该对象的指针数目小于等于WEAK_INLINE_COUNT时,使用定长数组。当超过WEAK_INLINE_COUNT时,会将定长数组中的元素转移到动态数组中,并之后都是用动态数组存储。

StripedMap 是一个模板类,在这个类中有一个 array 成员,用来存储 PaddedT 对象,并且其中对于 [] 符的重载定义中,会返回这个 PaddedT 的 value 成员,这个 value 就是我们传入的 T 泛型成员,也就是 SideTable 对象。在 array 的下标中,这里使用了 indexForPointer 方法通过位运算计算下标,实现了静态的 Hash Table。而在 weak_table 中,其成员 weak_entry 会将传入对象的地址加以封装起来,并且其中也有访问全局弱引用表的入口。

img

那么接下来看看这个弱引用表是怎么维护这些数据的。

添加

进行添加操作时如果weak指针之前弱引用过别的对象oldObj,则调用weak_unregister_no_lock,在oldObj的weak_entry_t中移除该weak指针的地址

接着调用 weak_register_no_lock将weak指针添加到指向的新的对象newobj的weak_entry_t中

weak_unregister_no_lock

void
weak_unregister_no_lock(weak_table_t *weak_table, id referent_id, 
                        id *referrer_id)
{
    objc_object *referent = (objc_object *)referent_id;
    objc_object **referrer = (objc_object **)referrer_id;

    weak_entry_t *entry;

    if (!referent) return;

    if ((entry = weak_entry_for_referent(weak_table, referent))) { // 查找到referent所对应的weak_entry_t
        remove_referrer(entry, referrer);  // 在referent所对应的weak_entry_t的hash数组中,移除referrer
       
        // 移除元素之后, 要检查一下weak_entry_t的hash数组是否已经空了
        bool empty = true;
        if (entry->out_of_line()  &&  entry->num_refs != 0) {
            empty = false;
        }
        else {
            for (size_t i = 0; i < WEAK_INLINE_COUNT; i++) {
                if (entry->inline_referrers[i]) {
                    empty = false; 
                    break;
                }
            }
        }

        if (empty) { // 如果weak_entry_t的hash数组已经空了,则需要将weak_entry_t从weak_table中移除
            weak_entry_remove(weak_table, entry);
        }
    }

该方法需要传入三个参数,它们代表的意义如下:

weak_tableweak_table_t 结构类型的全局的弱引用表。

referent_id:weak指针。

*referrer_id:weak指针地址。

  1. 首先,它会通过weak_entry_for_referent方法在weak_table中找出referent对应的weak_entry_t
  2. 如果找到的话,在通过remove_referrer方法在weak_entry_t中移除referrer
  3. 移除元素后,判断此时weak_entry_t中是否还有元素 (empty==true?)
  4. 如果此时weak_entry_t已经没有元素了,则需要将weak_entry_t从weak_table中移除

weak_register_no_lock

id 
weak_register_no_lock(weak_table_t *weak_table, id referent_id, 
                      id *referrer_id, bool crashIfDeallocating)
{
    objc_object *referent = (objc_object *)referent_id;
    objc_object **referrer = (objc_object **)referrer_id;

    // 如果referent为nil 或 referent 采用了TaggedPointer计数方式,直接返回,不做任何操作
    if (!referent  ||  referent->isTaggedPointer()) return referent_id;

    // 确保被引用的对象可用(没有在析构,同时应该支持weak引用)
    bool deallocating;
    if (!referent->ISA()->hasCustomRR()) {
        deallocating = referent->rootIsDeallocating();
    }
    else {
        BOOL (*allowsWeakReference)(objc_object *, SEL) = 
            (BOOL(*)(objc_object *, SEL))
            object_getMethodImplementation((id)referent, 
                                           SEL_allowsWeakReference);
        if ((IMP)allowsWeakReference == _objc_msgForward) {
            return nil;
        }
        deallocating =
            ! (*allowsWeakReference)(referent, SEL_allowsWeakReference);
    }
    // 正在析构的对象,不能够被弱引用
    if (deallocating) {
        if (crashIfDeallocating) {
            _objc_fatal("Cannot form weak reference to instance (%p) of "
                        "class %s. It is possible that this object was "
                        "over-released, or is in the process of deallocation.",
                        (void*)referent, object_getClassName((id)referent));
        } else {
            return nil;
        }
    }

    // now remember it and where it is being stored
    // 在 weak_table中找到referent对应的weak_entry,并将referrer加入到weak_entry中
    weak_entry_t *entry;
    if ((entry = weak_entry_for_referent(weak_table, referent))) { // 如果能找到weak_entry,则讲referrer插入到weak_entry中
        append_referrer(entry, referrer); 	// 将referrer插入到weak_entry_t的引用数组中
    } 
    else { // 如果找不到,就新建一个
        weak_entry_t new_entry(referent, referrer);  
        weak_grow_maybe(weak_table);
        weak_entry_insert(weak_table, &new_entry);
    }

    // Do not set *referrer. objc_storeWeak() requires that the 
    // value not change.

    return referent_id;
}

这个方法需要传入四个参数,它们代表的意义如下:

  • weak_tableweak_table_t 结构类型的全局的弱引用表。
  • referent_id:weak指针。
  • *referrer_id:weak指针地址。
  • crashIfDeallocating :若果被弱引用的对象正在析构,此时再弱引用该对象是否应该crash。
  1. 首先判断referent是否为nil或采用了TaggedPointer计数方式,如果是直接返回

  2. 接着判断对象是否正在析构,如果对象正在析构,则抛出异常

  3. 如果对象没有再析构且可以被weak引用,则调用weak_entry_for_referent 方法根据弱引用对象的地址从弱引用表中找到对应的weak_entry,如果能够找到则调用append_referrer 方法向其中插入weak指针地址。否则新建一个weak_entry。

weak_entry_for_referent

weak_entry_for_referent用来根据被引用的对象从weak表中查询弱引用条目(entry)。

static weak_entry_t *
weak_entry_for_referent(weak_table_t *weak_table, objc_object *referent)
{
    assert(referent);

    weak_entry_t *weak_entries = weak_table->weak_entries;

    if (!weak_entries) return nil;

    size_t begin = hash_pointer(referent) & weak_table->mask;  // 这里通过 & weak_table->mask的位操作,来确保index不会越界
    size_t index = begin;
    size_t hash_displacement = 0;
    while (weak_table->weak_entries[index].referent != referent) {
        index = (index+1) & weak_table->mask;
        if (index == begin) bad_weak_table(weak_table->weak_entries); // 触发bad weak table crash
        hash_displacement++;
        if (hash_displacement > weak_table->max_hash_displacement) { // 当hash冲突超过了可能的max hash 冲突时,说明元素没有在hash表中,返回nil 
            return nil;
        }
    }
    
    return &weak_table->weak_entries[index];
}

  1. 首先检查weak_table->weak_entries是否为空。如果为空,说明弱引用表尚未初始化或对象没有弱引用,直接返回nil
  2. 使用hash_pointer(referent)函数计算referent的哈希值,然后与weak_table->mask做位与运算,得到在数组中的初始索引。weak_table->mask是一个掩码,通常等于数组长度减一,确保索引在数组范围内。
  3. 从计算出的初始索引开始,遍历弱引用表,寻找referent的条目。
  4. 如果遍历回到初始索引,整个数组仍未找到referent,这通常表示错误,调用bad_weak_table函数处理此异常情况
  5. 如果偏移量hash_displacement超过weak_table->max_hash_displacement,这表明referent不在表中,或者存在严重的散列冲突,函数返回nil

append_referrer

添加被引用对象的弱引用指针的地址到weak_entry_t的指针集合中

static void append_referrer(weak_entry_t *entry, objc_object **new_referrer)
{
    if (! entry->out_of_line()) { // 如果weak_entry 尚未使用动态数组,走这里
        // Try to insert inline.
        for (size_t i = 0; i < WEAK_INLINE_COUNT; i++) {
            if (entry->inline_referrers[i] == nil) {
                entry->inline_referrers[i] = new_referrer;
                return;
            }
        }
        
        // 如果inline_referrers的位置已经存满了,则要转型为referrers,做动态数组。
        // Couldn't insert inline. Allocate out of line.
        weak_referrer_t *new_referrers = (weak_referrer_t *)
            calloc(WEAK_INLINE_COUNT, sizeof(weak_referrer_t));
        // This constructed table is invalid, but grow_refs_and_insert
        // will fix it and rehash it.
        for (size_t i = 0; i < WEAK_INLINE_COUNT; i++) {
            new_referrers[i] = entry->inline_referrers[I];
        }
        entry->referrers = new_referrers;
        entry->num_refs = WEAK_INLINE_COUNT;
        entry->out_of_line_ness = REFERRERS_OUT_OF_LINE;
        entry->mask = WEAK_INLINE_COUNT-1;
        entry->max_hash_displacement = 0;
    }

    // 对于动态数组的附加处理:
    assert(entry->out_of_line()); // 断言: 此时一定使用的动态数组

    if (entry->num_refs >= TABLE_SIZE(entry) * 3/4) { // 如果动态数组中元素个数大于或等于数组位置总空间的3/4,则扩展数组空间为当前长度的一倍
        return grow_refs_and_insert(entry, new_referrer); // 扩容,并插入
    }
    
    // 如果不需要扩容,直接插入到weak_entry中
    // 注意,weak_entry是一个哈希表,key:w_hash_pointer(new_referrer) value: new_referrer
    
    // 细心的人可能注意到了,这里weak_entry_t 的hash算法和 weak_table_t的hash算法是一样的,同时扩容/减容的算法也是一样的
    size_t begin = w_hash_pointer(new_referrer) & (entry->mask); // '& (entry->mask)' 确保了 begin的位置只能大于或等于 数组的长度
    size_t index = begin;  // 初始的hash index
    size_t hash_displacement = 0;  // 用于记录hash冲突的次数,也就是hash再位移的次数
    while (entry->referrers[index] != nil) {
        hash_displacement++;
        index = (index+1) & entry->mask;  // index + 1, 移到下一个位置,再试一次能否插入。(这里要考虑到entry->mask取值,一定是:0x111, 0x1111, 0x11111, ... ,因为数组每次都是*2增长,即8, 16, 32,对应动态数组空间长度-1的mask,也就是前面的取值。)
        if (index == begin) bad_weak_table(entry); // index == begin 意味着数组绕了一圈都没有找到合适位置,这时候一定是出了什么问题。
    }
    if (hash_displacement > entry->max_hash_displacement) { // 记录最大的hash冲突次数, max_hash_displacement意味着: 我们尝试至多max_hash_displacement次,肯定能够找到object对应的hash位置
        entry->max_hash_displacement = hash_displacement;
    }
    // 将ref存入hash数组,同时,更新元素个数num_refs
    weak_referrer_t &ref = entry->referrers[index];
    ref = new_referrer;
    entry->num_refs++;
}

  1. 首先确定是使用定长数组还是动态数组
  2. 如果是使用定长数组,则直接将weak指针地址添加到数组即可
  3. 如果定长数组已经满了,则需要将定长数组中的元素转存到动态数组中。
  4. 如果动态数组的元素个数达到动态数组大小的3/4则扩容再进插入到weak_entry,如果不需要扩容则直接插入到weak_entry
  5. 最后将ref存入hash数组,同时,更新元素个数num_refs

释放

当对象的引用计数为0时,此时就需要释放该对象,底层会调用_objc_rootDealloc方法对对象进行释放,而在_objc_rootDealloc方法里面会调用rootDealloc方法。

inline void
objc_object::rootDealloc()
{
    if (isTaggedPointer()) return;  // fixme necessary?

    if (fastpath(isa.nonpointer  &&  
                 !isa.weakly_referenced  &&  
                 !isa.has_assoc  &&  
                 !isa.has_cxx_dtor  &&  
                 !isa.has_sidetable_rc))
    {
        assert(!sidetable_present());
        free(this);
    } 
    else {
        object_dispose((id)this);
    }
}

  • 首先判断对象是否是Tagged Pointer,如果是则直接返回。

  • 如果对象是采用了优化的isa计数方式,且同时满足对象没有被weak引用!isa.weakly_referenced、没有关联对象!isa.has_assoc 、没有自定义的C++析构方法!isa.has_cxx_dtor、没有用到SideTable来引用计数!isa.has_sidetable_rc则直接快速释放

  • 如果不能满足2中的条件,则会调用object_dispose 方法。

object_dispose

object_dispose 方法很简单,主要是内部调用了clearDeallocating方法。

void *objc_destructInstance(id obj) 
{
    if (obj) {
        // Read all of the flags at once for performance.
        bool cxx = obj->hasCxxDtor();
        bool assoc = obj->hasAssociatedObjects();

        // This order is important.
        if (cxx) object_cxxDestruct(obj);
        if (assoc) _object_remove_assocations(obj);
        obj->clearDeallocating();
    }

    return obj;
}

clearDeallocating

inline void 
objc_object::clearDeallocating()
{
    if (slowpath(!isa.nonpointer)) {
        // Slow path for raw pointer isa.
        sidetable_clearDeallocating();
    }
    else if (slowpath(isa.weakly_referenced  ||  isa.has_sidetable_rc)) {
        // Slow path for non-pointer isa with weak refs and/or side table data.
        clearDeallocating_slow();
    }

    assert(!sidetable_present());
}

clearDeallocating中有两个分支,先判断对象是否采用了优化isa引用计数,如果没有的话则需要清理对象存储在SideTable中的引用计数数据。如果对象采用了优化isa引用计数,则判断是否有使用SideTable的辅助引用计数(isa.has_sidetable_rc)或者有weak引用(isa.weakly_referenced),符合这两种情况中一种的,调用clearDeallocating_slow 方法。

clearDeallocating_slow

NEVER_INLINE void
objc_object::clearDeallocating_slow()
{
    assert(isa.nonpointer  &&  (isa.weakly_referenced || isa.has_sidetable_rc));

    SideTable& table = SideTables()[this]; // 在全局的SideTables中,以this指针为key,找到对应的SideTable
    table.lock();
    if (isa.weakly_referenced) { // 如果obj被弱引用
        weak_clear_no_lock(&table.weak_table, (id)this); // 在SideTable的weak_table中对this进行清理工作
    }
    if (isa.has_sidetable_rc) { // 如果采用了SideTable做引用计数
        table.refcnts.erase(this); // 在SideTable的引用计数中移除this
    }
    table.unlock();
}

在该方法中调用了weak_clear_no_lock来做weak_table的清理工作

weak_clear_no_lock

void 
weak_clear_no_lock(weak_table_t *weak_table, id referent_id) 
{
    objc_object *referent = (objc_object *)referent_id;

    weak_entry_t *entry = weak_entry_for_referent(weak_table, referent); // 找到referent在weak_table中对应的weak_entry_t
    if (entry == nil) {
        /// XXX shouldn't happen, but does with mismatched CF/objc
        //printf("XXX no entry for clear deallocating %p\n", referent);
        return;
    }

    // zero out references
    weak_referrer_t *referrers;
    size_t count;
    
    // 找出weak引用referent的weak 指针地址数组以及数组长度
    if (entry->out_of_line()) {
        referrers = entry->referrers;
        count = TABLE_SIZE(entry);
    } 
    else {
        referrers = entry->inline_referrers;
        count = WEAK_INLINE_COUNT;
    }
    
    for (size_t i = 0; i < count; ++i) {
        objc_object **referrer = referrers[i]; // 取出每个weak ptr的地址
        if (referrer) {
            if (*referrer == referent) { // 如果weak ptr确实weak引用了referent,则将weak ptr设置为nil,这也就是为什么weak 指针会自动设置为nil的原因
                *referrer = nil;
            }
            else if (*referrer) { // 如果所存储的weak ptr没有weak 引用referent,这可能是由于runtime代码的逻辑错误引起的,报错
                _objc_inform("__weak variable at %p holds %p instead of %p. "
                             "This is probably incorrect use of "
                             "objc_storeWeak() and objc_loadWeak(). "
                             "Break on objc_weak_error to debug.\n", 
                             referrer, (void*)*referrer, (void*)referent);
                objc_weak_error();
            }
        }
    }
    
    weak_entry_remove(weak_table, entry); // 由于referent要被释放了,因此referent的weak_entry_t也要移除出weak_table
}

  1. 首先,通过调用weak_entry_for_referent函数来查找referent在弱引用表(weak_table)中的weak 指针地址数组以及数组长度
  2. 接着判断该数组是定长数组还是动态数组
  3. 如果是定长数组所有的弱引用信息都存储在weak_entry_t结构内的inline_referrers数组中;
  4. 如果是动态数组,信息则存储在一个独立的动态数组referrers中。
  5. 接着遍历所有存储的弱引用地址,如果weak指针确实weak引用了referent,则将weak ptr设置为nil
  6. 如果weak指针没有weak引用了referent,但是却不是nil,这可能表明有一些逻辑错误,抛出异常
  7. 由于referent要被释放了,因此referent的weak_entry_t也要移除出weak_table

总结

  • weak的本质其实是哈希表,用所引用的对象的地址作为key,用weak指针的地址集合作为value
  • weak的实现原理如下:
    • 初始化:runtime会调用objc_initWeak方法(这是接口方法最值调用storeWeak),初始化一个新的weak指针指向对象的地址。

    • 添加引用objc_initWeak函数会调用objc_storeWeak()函数, objc_storeWeak() 的作用是更新指针指向,创建对应的弱引用表。

    • 释放:调用clearDeallocating函数(也是接口函数,最终调用weak_clear_no_lock)。weak_clear_no_lock函数首先根据对象地址获取所有weak指针地址的数组,然后遍历这个数组把其中的数据设为nil,最后把这个entry从weak表中删除,清理对象的记录。

  • SideTable、weak_table_t、weak_entry_t这样三个结构,它们之间的关系如下图所示:

在这里插入图片描述

<think>好的,我现在需要解释一下C++中的weak_ptr是如何实现的。首先,我得回想一下自己之前学过的智能指针相关知识。weak_ptr通常和shared_ptr一起使用,用来解决循环引用的问题。那么,它的实现原理是怎样的呢? 我记得shared_ptr使用引用计数来管理对象的生命周期,每当一个shared_ptr被复制时,引用计数会增加,销毁时减少,当计数归零时,对象被释放。而weak_ptr不增加引用计数,所以它不会影响对象的生命周期。但weak_ptr怎么知道对象是否还存在呢? 可能的实现方式是,shared_ptr和weak_ptr共享一个控制块,这个控制块里除了保存强引用计数,还有一个弱引用计数。强引用计数归零时,对象会被销毁,但控制块本身可能还存在,直到弱引用计数也归零。这样,当weak_ptr要升级为shared_ptr时,可以检查强引用计数是否大于零,如果存在,就创建一个新的shared_ptr,增加强引用计数。 那控制块的结构应该是什么样的?可能包含两个计数器:一个用于强引用(shared_ptr的数量),另一个用于弱引用(weak_ptr的数量)。当强引用变为零时,对象被删除,但控制块本身直到弱引用也变为零时才释放。此外,控制块可能还保存着原始指针,或者已经销毁的对象的指针,但需要确保访问的安全性。 当创建weak_ptr时,它会指向同一个控制块,并增加弱引用计数。当weak_ptr被销毁时,减少弱引用计数。当使用weak_ptr的lock()方法时,会尝试增加强引用计数,但只有在强引用计数不为零的情况下才会成功,否则返回一个空的shared_ptr。 可能还会有一个问题,如果多个weak_ptr同时尝试升级为shared_ptr,是否存在竞争条件?这里可能需要原子操作来保证线程安全,确保引用计数的增减是原子的,避免数据竞争。 此外,weak_ptr本身不拥有对象的所有权,所以它不能直接访问对象,必须转换为shared_ptr才能使用。这通过lock()方法实现,返回一个shared_ptr,如果对象还存在,就有效,否则为空。 总结一下,weak_ptr的实现依赖于与shared_ptr共享的控制块,其中包含强引用和弱引用计数。弱引用计数控制控制块的生命周期,而强引用计数控制对象本身的生命周期。当需要升级时,检查强引用计数,确保线程安全的情况下进行操作。这样既解决了循环引用的问题,又保证了资源的安全管理。</think>--- **weak_ptr 实现原理** `weak_ptr` 是C++智能指针体系中用于**观测共享资源、避免循环引用**的关键组件,其核心实现依赖于与 `shared_ptr` **共享的控制块**和**双重引用计数机制**。 --- ### 一、底层结构:控制块(Control Block) ![控制块结构](https://upload.cc/i1/2024/05/15/S6fZcN.png) 每个 `shared_ptr` 管理的对象关联一个**隐藏的控制块**,包含: 1. **强引用计数(Strong Ref Count)**:`shared_ptr` 的引用数,归零时销毁对象 2. **弱引用计数(Weak Ref Count)**:`weak_ptr` 的引用数,归零时销毁控制块 3. **原始对象指针**(可能为悬空指针,需配合引用计数使用) 4. **自定义删除器与分配器**(若存在) --- ### 二、关键操作实现 #### 1. **构造 weak_ptr** ```cpp // 从 shared_ptr 构造 weak_ptr template<typename T> weak_ptr<T>::weak_ptr(const shared_ptr<T>& sp) { if (sp.ctrl_block) { ctrl_block = sp.ctrl_block; ++ctrl_block->weak_count; // 原子递增弱引用 } } ``` #### 2. **升级为 shared_ptr(lock())** ```cpp shared_ptr<T> weak_ptr<T>::lock() const { shared_ptr<T> result; if (ctrl_block) { // 原子操作:强引用>0时递增 if (atomic_inc_if_nonzero(ctrl_block->strong_count)) { result.ctrl_block = ctrl_block; result.ptr = ctrl_block->ptr; } } return result; } ``` #### 3. **析构 weak_ptr** ```cpp weak_ptr<T>::~weak_ptr() { if (ctrl_block) { if (--ctrl_block->weak_count == 0) { // 原子递减 delete ctrl_block; // 释放控制块 } } } ``` --- ### 三、生命周期管理流程 1. **对象销毁条件** - 当最后一个 `shared_ptr` 析构时: $$ \text{强引用} \xrightarrow{归零} \text{调用析构函数} $$ $$ \text{但控制块保留至弱引用归零} $$ 2. **控制块销毁条件** - 当最后一个 `weak_ptr` 析构时: $$ \text{弱引用} \xrightarrow{归零} \text{释放控制块内存} $$ --- ### 四、线程安全实现 - **所有引用计数修改** 使用原子操作(如 `std::atomic<int>`) 示例伪代码: ```cpp // 原子递增(仅当强引用>0时) bool atomic_inc_if_nonzero(atomic_int& count) { int old = count.load(); while (old != 0) { if (count.compare_exchange_weak(old, old+1)) return true; } return false; } ``` --- ### 五、典型应用场景 ```cpp class B; // 前向声明 class A { public: shared_ptr<B> b_ptr; }; class B { public: weak_ptr<A> a_weak_ptr; // 使用 weak_ptr 打破循环 }; // 使用示例 auto a = make_shared<A>(); auto b = make_shared<B>(); a->b_ptr = b; b->a_weak_ptr = a; // 不会增加A的强引用计数 ``` --- ### 六、与裸指针的性能对比 | 操作 | `weak_ptr`/`shared_ptr` | 裸指针 | |---------------------|-----------------------------|------------------| | 内存开销 | 额外控制块(约16-32字节) | 无 | | 安全检查成本 | 原子操作(纳秒级) | 无 | | 悬空指针风险 | 通过 `lock()` 自动检测 | 需手动管理 | --- ### 七、实现差异(C++11 vs C++17) | 特性 | C++11 | C++17 增强 | |---------------------|-------------------------|--------------------------| | 线程安全 | 基础原子操作 | 新增 `weak_from_this` | | 控制块优化 | 可能分离存储 | 更紧凑的内存布局 | | 异常安全 | 基本保证 | 强化 noexcept 声明 | --- **总结**:`weak_ptr` 通过**共享控制块+双重原子计数**的机制,在保证线程安全的前提下,实现了对共享资源的无主观察,是解决循环引用问题的核心工具。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值