From mboxrd@z Thu Jan  1 00:00:00 1970
Return-Path: <stanv@altlinux.ru>
Message-ID: <44901EBB.4040703@altlinux.ru>
Date: Wed, 14 Jun 2006 18:35:39 +0400
From: Anriy Stepanov <stanv@altlinux.ru>
User-Agent: Thunderbird 1.5.0.2 (X11/20060502)
MIME-Version: 1.0
To: devel@lists.altlinux.org
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit
Subject: [devel] =?utf-8?b?Y29kZWN2dCArIFVURi04IC0g0L3QtSDRgNCw0LHQvtGC?=
 =?utf-8?b?0LDQtdGCINC/0YDQtdC+0LHRgNCw0LfQvtCy0LDQvdC40LUu?=
X-BeenThere: devel@lists.altlinux.org
X-Mailman-Version: 2.1.7
Precedence: list
Reply-To: ALT Devel discussion list <devel@lists.altlinux.org>
List-Id: ALT Devel discussion list <devel.lists.altlinux.org>
List-Unsubscribe: <https://lists.altlinux.org/mailman/listinfo/devel>,
	<mailto:devel-request@lists.altlinux.org?subject=unsubscribe>
List-Archive: <http://lists.altlinux.org/pipermail/devel>
List-Post: <mailto:devel@lists.altlinux.org>
List-Help: <mailto:devel-request@lists.altlinux.org?subject=help>
List-Subscribe: <https://lists.altlinux.org/mailman/listinfo/devel>,
	<mailto:devel-request@lists.altlinux.org?subject=subscribe>
X-List-Received-Date: Wed, 14 Jun 2006 06:33:11 -0000
Archived-At: <http://lore.altlinux.org/devel/44901EBB.4040703@altlinux.ru/>
List-Archive: <http://lore.altlinux.org/devel/>
List-Post: <mailto:devel@altlinux.org>

Написал програмку для тестирования:

#include <iostream>
#include <locale>
#include <clocale>
#include <string>
#include <limits>
#include <climits>

using namespace std;

int main()
{
         setlocale(LC_ALL, "");
locale const loc = locale(""); // System locale (ru_RU.UTF-8)

typedef codecvt_base::result res;
typedef codecvt<wchar_t, char, mbstate_t> my_codecvt; // internal,
external, state
locale const new_locale(loc, new my_codecvt); // locale with codecvt facet
const my_codecvt& cdcvt = use_facet<my_codecvt>(new_locale);
mbstate_t state;
res r;

const char *in_next = 0;
wchar_t *out_next = 0;

string s("Строка!");
// string s("String!");
const int bytes = s.length();
const int symbols = 7;

wstring ws(L'.', symbols);
cout << "Bytes: " << bytes << endl;
cout << "Symbols: " << symbols << endl;

r = cdcvt.in(state, s.c_str(), s.c_str()+s.size(), in_next,
&ws[0], &ws[0] + ws.size(), out_next);

cout << "Encoding result: ";
cout << (r == codecvt_base::ok ? "Succes!" : "Fail!") << endl;
 
cout << "Was: " << s << endl;  
wcout << "Is: " << ws << endl;

return 0;
}

Если роскоментировать string s("String!"); то все работает как надо.
Создаестся строка с wide char.
И результат:
Bytes: 7
Symbols: 7
Encoding result: Succes!
Was: String!
Is: String!
Т.е. преобразование работает.

Но если раскоментировать string s("Строка!"); то оно не может
преобразовать multi byte symbols в wide chars....

Результат выполнения:
Bytes: 13
Symbols: 7
Encoding result: Fail!
Was: Строка!
Is:

Вот.

локаль UTF-8

Почему оно не может string c multi bytes characters (где один символ
занимает несколько байт, но не каждый) UTF-8 перенести в whar_t ?