From mboxrd@z Thu Jan 1 00:00:00 1970 Return-Path: Message-ID: <44901EBB.4040703@altlinux.ru> Date: Wed, 14 Jun 2006 18:35:39 +0400 From: Anriy Stepanov User-Agent: Thunderbird 1.5.0.2 (X11/20060502) MIME-Version: 1.0 To: devel@lists.altlinux.org Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit Subject: [devel] =?utf-8?b?Y29kZWN2dCArIFVURi04IC0g0L3QtSDRgNCw0LHQvtGC?= =?utf-8?b?0LDQtdGCINC/0YDQtdC+0LHRgNCw0LfQvtCy0LDQvdC40LUu?= X-BeenThere: devel@lists.altlinux.org X-Mailman-Version: 2.1.7 Precedence: list Reply-To: ALT Devel discussion list List-Id: ALT Devel discussion list List-Unsubscribe: , List-Archive: List-Post: List-Help: List-Subscribe: , X-List-Received-Date: Wed, 14 Jun 2006 06:33:11 -0000 Archived-At: List-Archive: List-Post: Написал програмку для тестирования: #include #include #include #include #include #include using namespace std; int main() { setlocale(LC_ALL, ""); locale const loc = locale(""); // System locale (ru_RU.UTF-8) typedef codecvt_base::result res; typedef codecvt my_codecvt; // internal, external, state locale const new_locale(loc, new my_codecvt); // locale with codecvt facet const my_codecvt& cdcvt = use_facet(new_locale); mbstate_t state; res r; const char *in_next = 0; wchar_t *out_next = 0; string s("Строка!"); // string s("String!"); const int bytes = s.length(); const int symbols = 7; wstring ws(L'.', symbols); cout << "Bytes: " << bytes << endl; cout << "Symbols: " << symbols << endl; r = cdcvt.in(state, s.c_str(), s.c_str()+s.size(), in_next, &ws[0], &ws[0] + ws.size(), out_next); cout << "Encoding result: "; cout << (r == codecvt_base::ok ? "Succes!" : "Fail!") << endl; cout << "Was: " << s << endl; wcout << "Is: " << ws << endl; return 0; } Если роскоментировать string s("String!"); то все работает как надо. Создаестся строка с wide char. И результат: Bytes: 7 Symbols: 7 Encoding result: Succes! Was: String! Is: String! Т.е. преобразование работает. Но если раскоментировать string s("Строка!"); то оно не может преобразовать multi byte symbols в wide chars.... Результат выполнения: Bytes: 13 Symbols: 7 Encoding result: Fail! Was: Строка! Is: Вот. локаль UTF-8 Почему оно не может string c multi bytes characters (где один символ занимает несколько байт, но не каждый) UTF-8 перенести в whar_t ?