一段关于bstr,BSTR,char相互转换的操作讨论,呵呵,在论坛上抄来的

博客围绕BSTR在C/C++中的使用展开,提出消息框显示异常及不同语言中BSTR定义不一致的问题。回复指出临时对象_bstr_t赋值给BSTR后被销毁,导致地址问题,还介绍了BSTR存储、访问方式及与其他字符串类型的区别。

问题的提出:
 BSTR a = _bstr_t("a");
 BSTR b = _bstr_t("b");
 CString c ;
 c = a;
 MessageBox(c);
 c = b;
 MessageBox(c);
为什么消息框中显示的都是 b?

如果这样:
         _bstr_t bstr1("a");
 BSTR a = bstr1;
 _bstr_t bstr2("b");
         BSTR b = bstr2;
 CString c ;
 c = a;
 MessageBox(c);
 c = b;
 MessageBox(c);
消息框中显示就对了!

还有一直疑惑的问题:
在VB,MIDL中 定义的BSTR 都是 4 bytes 长度 + 字符串
在VC中定义就是 OLECHAR *

同是BSTR 为什么定义不一致呢?

//回复1-----------------------------------------------------------------------------------------------------------------
//程序应该这样
 
_bstr_t a = _bstr_t("a");
_bstr_t b = _bstr_t("b");
CString c ;
c = a.copy();
MessageBox(c);
c = b.copy();
MessageBox(c);

说明:
_bstr_t 是一个操纵 BSTR 数据类型的类,

BSTR a = _bstr_t("a");
_bstr_t("a"); 构造函数返回的类型为void,

所以你上面这一句的意思是,把一个随机地址返回给了a;
c = a; 执行后;
c 所指向的是内存中的一块随机区域,显示的东西随机了;
————————————————
CString 也是一个类,
使用_bstr_t类的成员函数.copy,他返回一个BSTR 的备份!

//回复2-----------------------------------------------------------------------------------------------------------------
//问题1:

首先要明确,_bstr_t是对BSTR的封装。

Code 1:
BSTR a = _bstr_t("a");
//这里,_bstr_t("a")只是临时对象,当它初始化(包含一个内部的BSTR)并赋值给BSTR a之后,它就被撤销了。而它赋的值是BSTR的地址。
BSTR b = _bstr_t("b");
//第二次,仍然产生一个临时对象,它也初始化...过程跟上面一样。而且,由于前面的_bstr_t对象已被撤销,所以它产生BSTR的地址也同上。
//所以,实际上a,b指向同一个地址。而该地址的内容被写了两次。

Code 2:
_bstr_t bstr1("a");
BSTR a = bstr1;
_bstr_t bstr2("b");
BSTR b = bstr2;
//这里的两个_bstr_t bstr1,bstr2都是局部对象,同时存在。所以,他们内部包含的BSTR的地址不一样。这样分别赋值就没问题。

>>BSTR a = _bstr_t("a");
>>_bstr_t("a"); 构造函数返回的类型为void,
>>所以你上面这一句的意思是,把一个随机地址返回给了a;
>>c = a; 执行后;
>>c 所指向的是内存中的一块随机区域,显示的东西随机了;

实际上,对于赋值语句,也就是"="操作符,并不是返回该对象构造函数的返回值!
而是由该对象的= operator和类型转换操作符决定。
对于_bstr_t,它有:

_bstr_t::wchar_t*, _bstr_t::char*
operator const wchar_t*( ) const throw( );
operator wchar_t*( ) const throw( );

operator const char*( ) const throw( _com_error );
operator char*( ) const throw( _com_error );

所以,c = a返回的并不是“随机地址",而是它内部包含的BSTR的地址。


//回复3-----------------------------------------------------------------------------------------------------------------

VC中定义中,

#if defined(WIN32) && !defined(OLE2ANSI)
typedef WCHAR OLECHAR;
#else
typedef char OLECHAR;
#endif
typedef OLECHAR* BSTR;

实际上BSTR就是直接指向字符串的首地址(双字节或者ANSI字符串)。
而BSTR之前的四个字节是该字符串的长度,由编译器生成的代码自动去读这个长度,而不是用"\0"来标识字符串的结束。
各种语言中定义看起来不同,但是实际的存储、访问方式都一样。这个不奇怪。

//回复4-----------------------------------------------------------------------------------------------------------------
BSTR字符串有以下几个要点要强调一下:
1.一个BSTR字符串变量实际上是一个指针变量。它占用32bit即4个字节,就像其它的指针一样。而且,它指向一个Unicode格式的字符数组。但是,我们不能把字符串与BSTR字符串等同起来。我们必须用它自己确切的名字――“BSTR“。
2.一个BSTR字符串变量指向的字符串数组必须由4个字节的保留字开始(保存字符串数组的字节数而不是字符数),由2个空字符结束。
3.由于空字符在Unicode格式的字符串中的任何位置都有可能出现,所以,以空字符声明一个Unicode格式的字符串的结束并不合适。因此,在4个保留字中保存字符串的长度是至关重要的。
4.我们再强调一下,BSTR字符串指针实际指向的是Unicode格式的字符数组的首地址,而不是开头的4个字节。接下来我们就会看到,在这儿这样不厌其烦地强调BSTR字符串变量的特征是为了与马上就要解释的VC++中的string类型作个比较。
5.前4个字节的length记录的是字符数组的字节数(注意,不是字符数),包括结尾的空字节。因为数组是Unicode格式的,所以实际字符是length的一半。
在这儿强调一下,一个Unicode格式的空字符其实是占用2个字节的空间,而不是1个字节。在Unicode格式的数组中测试空字符时要当心这一点。
我们一般在惯例上说BSTR字符串“help”是“一个BSTR类型的字符串”。一般公认为,一个BSTR字符串变量指向的一个字符数组中包括至少两个空字符。
就Visual Basic来说,BSTR字符串未尾的两个空字节可能没什么用处,但是对Win32来说,它们却是至关重要的。原因在于,Win32版本的Unicode String(它称为LPWSTR)定义为指向一个空字符结尾的Unicode格式的字符串的指针。
从这个原因上解释BSTR字符串为什么要以空字符结尾就合情合理了。下面让我们讨论一下C++类型的string变量。
两句代码:
Dim str as String
str=”help”
str表示的是一个BSTR字符串变量的名字,而不是一个Unicode格式的字符数组。换句话说,str是一个保存地址xxxx的变量的名字。
以下是个小小的实验,它表明Visual Basic中string变量是指向字符数组的指针而不是字符数组。下面定义了一个结构,它的成员变量的类型是string。
Private Tyep utTest
astring As String
bstring As String
End Type
Dim uTest As utTest
Dim s as String
s=”testing”
uTest.astring=”testing”
uTest.astring=”testing”
Debug.Print Len(s)
Debug.Print Len(uTest)
这几句代码的执行结果是:
7
8
对string变量来说,Len函数返回的是字符串数组的字符个数。所以7个字符的字符串“testing”返回7。对结构变量uTest来说,Len函数返回的是该结构占用的内存空间。所以返回值8清楚地表明了每一个BSTR变量在内存中占用4个字节。因为BSTR是一个Win32的指针!
C类型的LPSTR和LPWSTR 字符串
Visual C++使用LPSTR和LPWSTR字符串。
LPSTR类型字符串的定义是:指向一个空字节结尾的ANSI格式的字符串数组的指针。但是,因为我们是以空字节的位置来判断LPSTR字符串的终止的,所以,在LPSTR中是不允许字符串中还有第二个空字节存在。同样,LPWSTR是一个指向空字节终止的Unicode格式的字符串的指针,它的中间也不允许有空字节存在。LPWSTR中的W指Wide,它是微软对Unicode的另一种说法。

可能我们也会碰到LPCSTR和LPCWSTR类型的字符串。其中的C表示Constant(常量)。这种字符串是不能被API函数修改的。除此以外,LPCSTR都与LPSTR相同。同理,LPCWSTR除不能修改外,其它的都与LPWSTR相同。
再说LPTSTR,LPTSTR一般都用在条件编译中,就象TCHAR一样。以下是一个例子代码:
#ifdef  UNICODE
typedef LPWSTR LPTSTR;      // 在Unicode下LPTSTR与LPWSTR是相同的
typedef LPCWSTR LPCTSTR;    // 在Unicode下LPCTSTR与LPCWSTR是相同的
#else  
typedef LPSTR LPTSTR;       //在ANSI下LPTSTR与LPSTR是相同的
typedef LPCSTR LPCTSTR;     //在ANSI下LPTCSTR与LPCSTR是相同的
#endif
只须记住,其中的C只不过是只读的意思就可以了


//回复5-----------------------------------------------------------------------------------------------------------------

其实 andrew_var(Andrew) 说得是正确的,因为BSTR只是指向OLECHAR的指针,临时变量_bstr_t赋值给BSTR后被销毁,因此创建时分配给_bstr_t("a")的内存块被释放,而这块内存紧接着又分配给了_bstr_t("b"),而且在赋值后这块内存也被释放了,所以这时两个BSTR(a和b)都是指向同一个内存块,可以检查a和b的地址来确定这一点,而这个内存块是被释放了,它还可以被分配,你可以把第一段代码作如下修改

 BSTR a = _bstr_t("a");
 BSTR b = _bstr_t("b");
 _bstr_t bstr3(_T("c"));
 _bstr_t bstr4(_T("d"));

 CString c ;
 c = a;
 MessageBox(c);
 c = b;

 c=(LPCTSTR)bstr3;
 MessageBox(c);
 c=(LPCTSTR)bstr4;
 MessageBox(c);

可以说明这一点,而类则不一样,虽然它是临时对象,但是它分配的内存只有超出作用域(生命期)才会被释放,所以"c"不会被"d"覆盖.
在vc里面,BSTR也是在字符串指针之前有4个字节,指定字符串的长度

转载于:https://www.cnblogs.com/henryzc/archive/2005/11/11/273951.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值