C++标准中,wchar_t是宽字符类型,每个wchar_t类型占2个字节,16位宽。汉字的表示就要用到wchar_t 。char,我们都知道,占一个字节,8位宽。其实知道了这个以后,要在wchar_t 和 char两种类型之间转换就不难实现了。
wchar_t 转换为char 的代码如下:
有如下的wchar_t和char变量
wchar_t w_cn = '中';
char c_cn[2] = {'0'} ;
char *C2W(wchar_t w_cn , char c_cn[2])
{
//following code convert wchar to char
c_cn[0] = w_cn >> 8 ;
c_cn[1] = w_cn ;
c_cn[2] = '/0';
return c_cn ;
}
其中需要注意的是一个16位的wchar_t需要用两个8位的char来存储之。我们可以发现另外一个问题,wchar_t的高位字节应该存储在char数组的低位字节。(这里没有仔细研究了,觉得怪怪的)。
这是完成了wchar_t到char的转化,char到wchar_t的转换类似。
C++中,你要想这样:cout<<w_cn<<endl;打印wchar_t,那是不行的。why?我想是wchar_t类型没有重载<<运算符吧。要显示,我的方法是
string cn(c_cn);
cout<<cn<<endl;
这样就能正确的打印wchar_t字符了。是不是感觉好像做了好多事,但是完成的却是很简单的事情?呵呵,其实我也有同感,但是没有办法。更简单的办法,当然是直接用API(我一个是懒的去找了,二一个自己动手转换有些东西看的更清楚咯),但是这样的转换更灵活,在实际中应该会用到的。
有了以上的基础,下面给出wchar_t字符串到char字符串的转换代码:
char *W2C(const wchar_t *pw , char *pc)
{
//cout<<*pw<<endl; //这样是不能正确显示的,你可以试试看显示的是什么
*pc++ = *pw >> 8 ;
*pc = *pw ;
return 0 ;
}
char *wstr2cstr(const wchar_t *pwstr , char *pcstr, size_t len)
{
char *ptemp = pcstr ;
if(pwstr!=NULL && pcstr!=NULL)
{
size_t wstr_len = wcslen(pwstr) ;
len = (len > wstr_len ) ? wstr_len : len ;
while( len -- > 0)
{
W2C(pwstr , pcstr);
pwstr++ ;
pcstr +=2 ; //和我们开始说的一样+2,不是+1
}
*pcstr = '/0';
return ptemp ;
}
return 0 ;
}
上面就是代码,测试:
int main(int arg , char *argv[])
{
wchar_t pwstr[] = {'我' , '是' , '中' , '国' , '人'};
char *pcstr = (char *)new char[2 * wcslen(pwstr)+1] ;
memset(pcstr , 0 , 2 * wcslen(pwstr)+1 );
wstr2cstr(pwstr , pcstr , wcslen(pwstr)) ;
str.assign (pcstr);
cout<<str<<endl;
delete []pcstr ;
}
相关推荐
使用C++,实现char与wchar_t互转,w2c,c2w分别实现wchar_t到char的转换和char到wchar_t的转换
wchar_t c++ wchar_t处理和socket资料 c++ wchar_t处理和socket资料
char 转wchar_t 及wchar_t转char的实现函数及原理说明
关于char,_wchar_t,_TCHAR,__T(),L,宏__T、TEXT,_TEXT、L.
VC++中的char,wchar_t,TCHAR,主要讲解char,wchar_t,TCHAR的用法及区别,适合初学者了解相关内容
实现char wchar_t 之间的转换程序
wchar_t*类型转换为char*类型
cgo.wchar 帮助在cgo中使用wchars。 例子 go.hid库中的示例: func ( dev * Device ... wchar_t )( ws . Pointer ()), 100 ) if res != 0 { return "" , dev . lastError () } // get WcharString as Go string
详细介绍了VC++中的char wchar_T和TCHAR的含义及区别,对于想了解各种编码的初学者有着较大用处
CString、LPCTSTR、LPTSTR、TCHAR、WCHAR、string、wchar_t、char解析 CString、LPCTSTR、LPTSTR、TCHAR、WCHAR、string、wchar_t、char解析 CString、LPCTSTR、LPTSTR、TCHAR、WCHAR、string、wchar_t、char解析
UNICODE:wchar_t是Unicode字符的数据类型,它实际定义在里: typedef unsigned short wchar_t; 另外,在头文件中有这样的定义:typedef wchar_t WCHAR; 所以WCHAR实际就是wchar_t wchar_t 可用字符串处理函数:...
代码如下: #ifndef USE_H_ #define USE_H_ #include #include #include using namespace std; class CUser { public: CUser();... char* WcharToChar(const wchar_t* wp); char* StringToChar
很好的东西,新手操作必知的数据转化方法》
其中char和string之间、wchar_t和wstring之间的转换较为简单,代码在vs2010下测试通过。 代码如下:#include <iostream>#include <string>#include <tchar>#include using namespace std; //Converting a WChar ...
详细的介绍了char wchar TCHAR的联系和区别,非常适合初学者了解
关于char, wchar_t, TCHAR, _T(),L,宏 _T、TEXT,_TEXT、L
1. TinyXml函数调用接口的字符型参数,仅支持`窄字符`格式(char*),不兼容`宽字符`格式(wchar_t*)。 2. TinyXml函数提供的Xml内容解析功能,仅支持以ANSI编码和UTF8编码的Xml字符串,也即`多字节编码`。 3. Tiny...
前提说明:在Android NDK中,一个wchar_t是4个字节,也就是说Android NDK下,unicode字符是采用ucs4的,而在windows系统下,unicode是采用ucs2,即每个unicode字符是占用两个字节的,可以用sizeof()函数来证明上面...