C++中怎么读取UTF-8编码的文件

2025-02-01 17:03:21
推荐回答(3个)
回答1:

1.windows上 默认使用的是 GBK,所以处理UTF8稍微麻烦点,甚至都不能直接显示utf8.
2.任何文件都是二进制数据。
3.将文件读取到的字节数组 byte[] C++里面实际上是 unsigned char[]类型,使用windows api里面的一个函数进行转换,转换成unicode 也就是 wchar_t的字符数组 —— MultiByteToWideChar
4.对于wchar_t的字符,可以直接显示,也可以直接使用,因为基本上所有操作系统都支持这种编码。
5.如果需要使用GBK的字符编码数组,那么使用上面函数的另一个兄弟函数——WideCharToMultiByte

提示:Windows MFC里面的字符串 CStringA CAtlStringA 这些都是基于GBK的
如果用CStringA保存UTF8的编码,直接输出会乱码,所以避免混淆,应该使用std::string 保存 utf8
std::wstring保存 unicode。而CStringA只在调用系统API的时候临时使用而已,而不作为长久数据保存于系统中。

回答2:

和正常文件读取方式一致,读出来转码下就好了。

回答3:

该怎么读取怎么读取,主要还是文字显示的时候编码选择的问题