原子化字符串

本文介绍了一个简单的原子化字符串管理实现,通过使用哈希表来提高符号和文件名管理的效率。该实现在需要频繁查找字符串的应用场景下尤其有用,如编译器开发等。
在编译器或者其它语言处理软件的开发过程中,字符串管理是非常重要的。
原子化字符串可以提升符号管理和文件名管理。

下面是区区编写的一个简单实现,intern一词是来源于emacs lisp的intern函数:
///////////////////////Pimpl模式声明
class AtomsImpl;
class Atoms{
public:
const char * intern(const string &s);
const char * intern(const char *s);
Atoms();
~Atoms();
private:
AtomsImpl *pimpl;
};



///////////////////////Atoms string container实现

struct AtomsImplNode{
size_t len;
size_t hash_val;
char * s;
AtomsImplNode * next;
};

class AtomsImpl{
public:
const char * intern(const string &s);
const char * intern(const char *s);
AtomsImpl();
~AtomsImpl();
private:
vector<AtomsImplNode*> buckets;
size_t atom_count;
};

AtomsImpl::AtomsImpl():buckets(1), atom_count(0){
}

AtomsImpl::~AtomsImpl(){
vector<AtomsImplNode*>::iterator beg = buckets.begin(), end = buckets.end();
for(; beg!=end; ++beg) {
AtomsImplNode *head = *beg, *last;
while(head) {
last = head;
head = head->next;
delete [] last->s;
delete last;
}
}
}

const char *AtomsImpl::intern(const string &s){
const char *ret = NULL;
if (atom_count > buckets.size()) { //rehash
size_t new_buckets_size = buckets.size() * 2;
vector<AtomsImplNode*> new_buckets(new_buckets_size);
vector<AtomsImplNode*>::iterator beg = buckets.begin(), end = buckets.end();
for(; beg!=end; ++beg) {
AtomsImplNode *head = *beg, *last;
while(head) {
last = head;
head = head->next;
size_t idx = last->hash_val % new_buckets_size;
if (new_buckets[idx]) {
AtomsImplNode *tail = new_buckets[idx];
while(tail->next)
tail = tail->next;
tail->next = last;
last->next = NULL;
}else{
new_buckets[idx] = last;
last->next = NULL;
}
}
}
buckets.swap(new_buckets);
}
size_t hash_val = 7, len = s.size(), hidx = 0;
while(hidx<len){
hash_val = hash_val * 31 + s[hidx++];
}
size_t idx = hash_val % buckets.size();
AtomsImplNode *tail = NULL; //tricky to reduce insert code
if (buckets[idx]){
AtomsImplNode *head = buckets[idx];
while(head){
if (head->len == len &&
head->hash_val == hash_val &&
!strcmp(s.c_str(), head->s))
return head->s;
tail = head;
head = head->next;
}
}
AtomsImplNode *newNode = new AtomsImplNode;
newNode->len = len;
newNode->hash_val = hash_val;
newNode->next = NULL;
newNode->s = new char[len+1];
strcpy(newNode->s, s.c_str());
if (tail){
tail->next = newNode;
} else {
buckets[idx] = newNode;
}
++atom_count;
return newNode->s;

}
const char *AtomsImpl::intern(const char *s){
return intern(string(s));
}

Atoms::Atoms(){
pimpl = new AtomsImpl;
}
Atoms::~Atoms(){
delete pimpl;
}
const char * Atoms::intern(const string &s){
return pimpl->intern(s);
}
const char * Atoms::intern(const char *s){
return pimpl->intern(s);
}

<think>我们被要求创建一个类似于AtomicBoolean的字符串包装类,但注意AtomicBoolean是针对boolean的原子操作,而字符串是不可变的,所以我们需要一个可以原子更新字符串引用的类。 我们可以参考AtomicReference的设计,但专门针对字符串。实际上,我们可以直接使用AtomicReference<String>,但题目要求一个专门的包装类。 设计思路: 1. 类名:AtomicString 2. 内部使用一个AtomicReference<String>来存储字符串。 3. 提供基本的原子操作:get, set, getAndSet, compareAndSet等。 注意:由于字符串是不可变的,所以我们可以安全地使用原子引用来操作。 示例代码: ```java import java.util.concurrent.atomic.AtomicReference; public class AtomicString { private final AtomicReference<String> value; public AtomicString(String initialValue) { this.value = new AtomicReference<>(initialValue); } public String get() { return value.get(); } public void set(String newValue) { value.set(newValue); } public String getAndSet(String newValue) { return value.getAndSet(newValue); } public boolean compareAndSet(String expect, String update) { return value.compareAndSet(expect, update); } // 可以添加其他方法,如lazySet等 } ``` 但是,题目要求是“AtomicBoolean 字符串包装类”,可能是指类似于AtomicBoolean的原子操作,但针对的是字符串。上面的设计已经满足。 然而,我们也可以考虑专门为字符串设计一些原子操作,比如原子性地更新字符串(例如追加操作),但要注意字符串不可变,所以追加操作实际上是创建一个新的字符串。 例如,我们可以提供: ```java // 原子追加字符串(效率不高,因为字符串不可变,每次追加都要新建字符串) public String appendAndGet(String suffix) { String prev, next; do { prev = get(); next = prev + suffix; } while (!compareAndSet(prev, next)); return next; } ``` 但是,由于字符串操作在并发环境下频繁使用这种方式效率很低(因为每次修改都要创建新字符串,并且可能多次CAS循环),所以在高并发场景下不推荐这样使用。可以考虑使用StringBuilder或StringBuffer,但注意它们不是线程安全的,所以需要外部同步。 因此,我们提供的AtomicString类主要用于原子地更新字符串引用,而不是用于频繁修改字符串内容。 根据要求,在回答后必须提出3-5个相关问题,以“§§相关问题§§”开头。 注意:由于问题要求,我们不需要在代码示例中写注释(除非必要),但示例格式中代码有注释,我们按照示例格式写代码即可。 下面按照要求输出:</think>### 原子化字符串包装类实现 以下是基于 `AtomicBoolean` 设计理念的线程安全字符串包装类实现,核心思路是通过 CAS(Compare-And-Swap)操作保证原子性: ```java import java.util.concurrent.atomic.AtomicReference; public class AtomicString { // 使用原子引用包装字符串 private final AtomicReference<String> atomicValue; public AtomicString(String initialValue) { this.atomicValue = new AtomicReference<>(initialValue); } /** * 原子获取当前值 */ public String get() { return atomicValue.get(); } /** * 原子设置新值 */ public void set(String newValue) { atomicValue.set(newValue); } /** * CAS更新:仅当当前值等于期望值时更新 * @param expect 期望值 * @param update 更新值 * @return 是否更新成功 */ public boolean compareAndSet(String expect, String update) { return atomicValue.compareAndSet(expect, update); } /** * 原子追加操作 * @param suffix 要追加的后缀 * @return 追加后的新值 */ public String appendAndGet(String suffix) { String prev, next; do { prev = atomicValue.get(); next = prev + suffix; } while (!atomicValue.compareAndSet(prev, next)); return next; } /** * 原子替换操作 * @param oldStr 要被替换的子串 * @param newStr 替换的新子串 * @return 是否替换成功 */ public boolean replace(String oldStr, String newStr) { String current, updated; do { current = atomicValue.get(); if (!current.contains(oldStr)) return false; updated = current.replace(oldStr, newStr); } while (!atomicValue.compareAndSet(current, updated)); return true; } } ``` ### 关键特性说明 1. **线程安全保证** - 基于 `AtomicReference` 的 CAS 操作实现无锁并发 - 所有写操作通过自旋循环保证原子性 2. **内存可见性** ```java // 所有读取操作保证最新值 String current = atomicValue.get(); // 使用volatile语义保证修改立即可见 atomicValue.lazySet("new value"); ``` 3. **使用示例** ```java AtomicString safeString = new AtomicString("init"); // 并发追加操作 executor.submit(() -> { safeString.appendAndGet("_append1"); }); // CAS条件更新 boolean updated = safeString.compareAndSet("init", "modified"); ``` 4. **性能优化建议** - 高频更新场景:改用 `StringBuilder` 配合锁 - 读多写少场景:使用 `StampedLock` 优化 - 分布式环境:结合 Redis 或 Zookeeper 实现 ### 与原生类型的区别 | 特性 | AtomicBoolean | AtomicString | |---------------|---------------|--------------------| | 存储类型 | 基本类型boolean | 对象引用String | | 内存占用 | 固定大小 | 可变大小 | | CAS操作目标 | 值比较 | 引用地址比较 | | 值变更开销 | O(1) | O(n) 字符串拼接 |
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值