Utf-8

Перекодировка CP1251->Unicode->Utf-8

Задачу можно разбить на две части
1. Перекодировка CP1251 в Unicode
2. Unicode->Utf-8 (про Utf-8 довольно неплохо написано в википедии)

Unicode (во всяком случае 16), на каждый символ выделяется два байта - первый указатель на таблицу, второй на символ в этой таблице, для кодировки русских букв CP-1251 используется следующая таблица перекодировки (для символов больше 127)

unsigned short win_cp1251[128]=
{ 0x0402, 0x0403, 0x201A, 0x0453, 0x201E, 0x2026, 0x2020, 0x2021,
0x20AC, 0x2030, 0x0409, 0x2039, 0x040A, 0x040C, 0x040B, 0x040F,

RSS-материал