Annotation of embedaddon/php/ext/mbstring/libmbfl/mbfl/mbfilter.c, revision 1.1

1.1     ! misho       1: /*
        !             2:  * charset=UTF-8
        !             3:  * vim600: encoding=utf-8
        !             4:  */
        !             5: 
        !             6: /*
        !             7:  * "streamable kanji code filter and converter"
        !             8:  *
        !             9:  * Copyright (c) 1998,1999,2000,2001 HappySize, Inc. All rights reserved.
        !            10:  *
        !            11:  * This software is released under the GNU Lesser General Public License.
        !            12:  * (Version 2.1, February 1999)
        !            13:  * Please read the following detail of the licence (in japanese).
        !            14:  *
        !            15:  * ◆使用許諾条件◆
        !            16:  *
        !            17:  * このソフトウェアは株式会社ハッピーサイズによって開発されました。株式会社ハッ
        !            18:  * ピーサイズは、著作権法および万国著作権条約の定めにより、このソフトウェアに関
        !            19:  * するすべての権利を留保する権利を持ち、ここに行使します。株式会社ハッピーサイ
        !            20:  * ズは以下に明記した条件に従って、このソフトウェアを使用する排他的ではない権利
        !            21:  * をお客様に許諾します。何人たりとも、以下の条件に反してこのソフトウェアを使用
        !            22:  * することはできません。
        !            23:  *
        !            24:  * このソフトウェアを「GNU Lesser General Public License (Version 2.1, February
        !            25:  * 1999)」に示された条件で使用することを、全ての方に許諾します。「GNU Lesser
        !            26:  * General Public License」を満たさない使用には、株式会社ハッピーサイズから書面
        !            27:  * による許諾を得る必要があります。
        !            28:  *
        !            29:  * 「GNU Lesser General Public License」の全文は以下のウェブページから取得でき
        !            30:  * ます。「GNU Lesser General Public License」とは、これまでLibrary General
        !            31:  * Public Licenseと呼ばれていたものです。
        !            32:  *     http://www.gnu.org/ --- GNUウェブサイト
        !            33:  *     http://www.gnu.org/copyleft/lesser.html --- ライセンス文面
        !            34:  * このライセンスの内容がわからない方、守れない方には使用を許諾しません。
        !            35:  *
        !            36:  * しかしながら、当社とGNUプロジェクトとの特定の関係を示唆または主張するもので
        !            37:  * はありません。
        !            38:  *
        !            39:  * ◆保証内容◆
        !            40:  *
        !            41:  * このソフトウェアは、期待された動作・機能・性能を持つことを目標として設計され
        !            42:  * 開発されていますが、これを保証するものではありません。このソフトウェアは「こ
        !            43:  * のまま」の状態で提供されており、たとえばこのソフトウェアの有用性ないし特定の
        !            44:  * 目的に合致することといった、何らかの保証内容が、明示されたり暗黙に示されてい
        !            45:  * る場合であっても、その保証は無効です。このソフトウェアを使用した結果ないし使
        !            46:  * 用しなかった結果によって、直接あるいは間接に受けた身体的な傷害、財産上の損害
        !            47:  * 、データの損失あるいはその他の全ての損害については、その損害の可能性が使用者
        !            48:  * 、当社あるいは第三者によって警告されていた場合であっても、当社はその損害の賠
        !            49:  * 償および補填を行いません。この規定は他の全ての、書面上または書面に無い保証・
        !            50:  * 契約・規定に優先します。
        !            51:  *
        !            52:  * ◆著作権者の連絡先および使用条件についての問い合わせ先◆
        !            53:  *
        !            54:  * 〒102-0073
        !            55:  * 東京都千代田区九段北1-13-5日本地所第一ビル4F
        !            56:  * 株式会社ハッピーサイズ
        !            57:  * Phone: 03-3512-3655, Fax: 03-3512-3656
        !            58:  * Email: sales@happysize.co.jp
        !            59:  * Web: http://happysize.com/
        !            60:  *
        !            61:  * ◆著者◆
        !            62:  *
        !            63:  * 金本 茂 <sgk@happysize.co.jp>
        !            64:  *
        !            65:  * ◆履歴◆
        !            66:  *
        !            67:  * 1998/11/10 sgk implementation in C++
        !            68:  * 1999/4/25  sgk Cで書きなおし。
        !            69:  * 1999/4/26  sgk 入力フィルタを実装。漢字コードを推定しながらフィルタを追加。
        !            70:  * 1999/6/??      Unicodeサポート。
        !            71:  * 1999/6/22  sgk ライセンスをLGPLに変更。
        !            72:  *
        !            73:  */
        !            74: 
        !            75: /* 
        !            76:  * Unicode support
        !            77:  *
        !            78:  * Portions copyright (c) 1999,2000,2001 by the PHP3 internationalization team.
        !            79:  * All rights reserved.
        !            80:  *
        !            81:  */
        !            82: 
        !            83: 
        !            84: #ifdef HAVE_CONFIG_H
        !            85: #include "config.h"
        !            86: #endif
        !            87: 
        !            88: #include <stddef.h>
        !            89: 
        !            90: #ifdef HAVE_STRING_H
        !            91: #include <string.h>
        !            92: #endif
        !            93: 
        !            94: #ifdef HAVE_STRINGS_H
        !            95: #include <strings.h>
        !            96: #endif
        !            97: 
        !            98: #ifdef HAVE_STDDEF_H
        !            99: #include <stddef.h>
        !           100: #endif
        !           101: 
        !           102: #include "mbfilter.h"
        !           103: #include "mbfl_filter_output.h"
        !           104: #include "mbfilter_pass.h"
        !           105: #include "filters/mbfilter_tl_jisx0201_jisx0208.h"
        !           106: 
        !           107: #include "eaw_table.h"
        !           108: 
        !           109: /* hex character table "0123456789ABCDEF" */
        !           110: static char mbfl_hexchar_table[] = {
        !           111:        0x30,0x31,0x32,0x33,0x34,0x35,0x36,0x37,0x38,0x39,0x41,0x42,0x43,0x44,0x45,0x46
        !           112: };
        !           113: 
        !           114: 
        !           115: 
        !           116: /*
        !           117:  * encoding filter
        !           118:  */
        !           119: #define CK(statement)  do { if ((statement) < 0) return (-1); } while (0)
        !           120: 
        !           121: 
        !           122: /*
        !           123:  *  buffering converter
        !           124:  */
        !           125: mbfl_buffer_converter *
        !           126: mbfl_buffer_converter_new(
        !           127:     enum mbfl_no_encoding from,
        !           128:     enum mbfl_no_encoding to,
        !           129:     int buf_initsz)
        !           130: {
        !           131:        mbfl_buffer_converter *convd;
        !           132: 
        !           133:        /* allocate */
        !           134:        convd = (mbfl_buffer_converter*)mbfl_malloc(sizeof (mbfl_buffer_converter));
        !           135:        if (convd == NULL) {
        !           136:                return NULL;
        !           137:        }
        !           138: 
        !           139:        /* initialize */
        !           140:        convd->from = mbfl_no2encoding(from);
        !           141:        convd->to = mbfl_no2encoding(to);
        !           142:        if (convd->from == NULL) {
        !           143:                convd->from = &mbfl_encoding_pass;
        !           144:        }
        !           145:        if (convd->to == NULL) {
        !           146:                convd->to = &mbfl_encoding_pass;
        !           147:        }
        !           148: 
        !           149:        /* create convert filter */
        !           150:        convd->filter1 = NULL;
        !           151:        convd->filter2 = NULL;
        !           152:        if (mbfl_convert_filter_get_vtbl(convd->from->no_encoding, convd->to->no_encoding) != NULL) {
        !           153:                convd->filter1 = mbfl_convert_filter_new(convd->from->no_encoding, convd->to->no_encoding, mbfl_memory_device_output, NULL, &convd->device);
        !           154:        } else {
        !           155:                convd->filter2 = mbfl_convert_filter_new(mbfl_no_encoding_wchar, convd->to->no_encoding, mbfl_memory_device_output, NULL, &convd->device);
        !           156:                if (convd->filter2 != NULL) {
        !           157:                        convd->filter1 = mbfl_convert_filter_new(convd->from->no_encoding,
        !           158:                                        mbfl_no_encoding_wchar,
        !           159:                                        (int (*)(int, void*))convd->filter2->filter_function,
        !           160:                                        (int (*)(void*))convd->filter2->filter_flush,
        !           161:                                        convd->filter2);
        !           162:                        if (convd->filter1 == NULL) {
        !           163:                                mbfl_convert_filter_delete(convd->filter2);
        !           164:                        }
        !           165:                }
        !           166:        }
        !           167:        if (convd->filter1 == NULL) {
        !           168:                return NULL;
        !           169:        }
        !           170: 
        !           171:        mbfl_memory_device_init(&convd->device, buf_initsz, buf_initsz/4);
        !           172: 
        !           173:        return convd;
        !           174: }
        !           175: 
        !           176: void
        !           177: mbfl_buffer_converter_delete(mbfl_buffer_converter *convd)
        !           178: {
        !           179:        if (convd != NULL) {
        !           180:                if (convd->filter1) {
        !           181:                        mbfl_convert_filter_delete(convd->filter1);
        !           182:                }
        !           183:                if (convd->filter2) {
        !           184:                        mbfl_convert_filter_delete(convd->filter2);
        !           185:                }
        !           186:                mbfl_memory_device_clear(&convd->device);
        !           187:                mbfl_free((void*)convd);
        !           188:        }
        !           189: }
        !           190: 
        !           191: void
        !           192: mbfl_buffer_converter_reset(mbfl_buffer_converter *convd)
        !           193: {
        !           194:        mbfl_memory_device_reset(&convd->device);
        !           195: }
        !           196: 
        !           197: int
        !           198: mbfl_buffer_converter_illegal_mode(mbfl_buffer_converter *convd, int mode)
        !           199: {
        !           200:        if (convd != NULL) {
        !           201:                if (convd->filter2 != NULL) {
        !           202:                        convd->filter2->illegal_mode = mode;
        !           203:                } else if (convd->filter1 != NULL) {
        !           204:                        convd->filter1->illegal_mode = mode;
        !           205:                } else {
        !           206:                        return 0;
        !           207:                }
        !           208:        }
        !           209: 
        !           210:        return 1;
        !           211: }
        !           212: 
        !           213: int
        !           214: mbfl_buffer_converter_illegal_substchar(mbfl_buffer_converter *convd, int substchar)
        !           215: {
        !           216:        if (convd != NULL) {
        !           217:                if (convd->filter2 != NULL) {
        !           218:                        convd->filter2->illegal_substchar = substchar;
        !           219:                } else if (convd->filter1 != NULL) {
        !           220:                        convd->filter1->illegal_substchar = substchar;
        !           221:                } else {
        !           222:                        return 0;
        !           223:                }
        !           224:        }
        !           225: 
        !           226:        return 1;
        !           227: }
        !           228: 
        !           229: int
        !           230: mbfl_buffer_converter_strncat(mbfl_buffer_converter *convd, const unsigned char *p, int n)
        !           231: {
        !           232:        mbfl_convert_filter *filter;
        !           233:        int (*filter_function)(int c, mbfl_convert_filter *filter);
        !           234: 
        !           235:        if (convd != NULL && p != NULL) {
        !           236:                filter = convd->filter1;
        !           237:                if (filter != NULL) {
        !           238:                        filter_function = filter->filter_function;
        !           239:                        while (n > 0) {
        !           240:                                if ((*filter_function)(*p++, filter) < 0) {
        !           241:                                        break;
        !           242:                                }
        !           243:                                n--;
        !           244:                        }
        !           245:                }
        !           246:        }
        !           247: 
        !           248:        return n;
        !           249: }
        !           250: 
        !           251: int
        !           252: mbfl_buffer_converter_feed(mbfl_buffer_converter *convd, mbfl_string *string)
        !           253: {
        !           254:        int n;
        !           255:        unsigned char *p;
        !           256:        mbfl_convert_filter *filter;
        !           257:        int (*filter_function)(int c, mbfl_convert_filter *filter);
        !           258: 
        !           259:        if (convd == NULL || string == NULL) {
        !           260:                return -1;
        !           261:        }
        !           262:        mbfl_memory_device_realloc(&convd->device, convd->device.pos + string->len, string->len/4);
        !           263:        /* feed data */
        !           264:        n = string->len;
        !           265:        p = string->val;
        !           266:        filter = convd->filter1;
        !           267:        if (filter != NULL) {
        !           268:                filter_function = filter->filter_function;
        !           269:                while (n > 0) {
        !           270:                        if ((*filter_function)(*p++, filter) < 0) {
        !           271:                                return -1;
        !           272:                        }
        !           273:                        n--;
        !           274:                }
        !           275:        }
        !           276: 
        !           277:        return 0;
        !           278: }
        !           279: 
        !           280: int
        !           281: mbfl_buffer_converter_flush(mbfl_buffer_converter *convd)
        !           282: {
        !           283:        if (convd == NULL) {
        !           284:                return -1;
        !           285:        }
        !           286: 
        !           287:        if (convd->filter1 != NULL) {
        !           288:                mbfl_convert_filter_flush(convd->filter1);
        !           289:        }
        !           290:        if (convd->filter2 != NULL) {
        !           291:                mbfl_convert_filter_flush(convd->filter2);
        !           292:        }
        !           293: 
        !           294:        return 0;
        !           295: }
        !           296: 
        !           297: mbfl_string *
        !           298: mbfl_buffer_converter_getbuffer(mbfl_buffer_converter *convd, mbfl_string *result)
        !           299: {
        !           300:        if (convd != NULL && result != NULL && convd->device.buffer != NULL) {
        !           301:                result->no_encoding = convd->to->no_encoding;
        !           302:                result->val = convd->device.buffer;
        !           303:                result->len = convd->device.pos;
        !           304:        } else {
        !           305:                result = NULL;
        !           306:        }
        !           307: 
        !           308:        return result;
        !           309: }
        !           310: 
        !           311: mbfl_string *
        !           312: mbfl_buffer_converter_result(mbfl_buffer_converter *convd, mbfl_string *result)
        !           313: {
        !           314:        if (convd == NULL || result == NULL) {
        !           315:                return NULL;
        !           316:        }
        !           317:        result->no_encoding = convd->to->no_encoding;
        !           318:        return mbfl_memory_device_result(&convd->device, result);
        !           319: }
        !           320: 
        !           321: mbfl_string *
        !           322: mbfl_buffer_converter_feed_result(mbfl_buffer_converter *convd, mbfl_string *string, 
        !           323:                                  mbfl_string *result)
        !           324: {
        !           325:        if (convd == NULL || string == NULL || result == NULL) {
        !           326:                return NULL;
        !           327:        }
        !           328:        mbfl_buffer_converter_feed(convd, string);
        !           329:        if (convd->filter1 != NULL) {
        !           330:                mbfl_convert_filter_flush(convd->filter1);
        !           331:        }
        !           332:        if (convd->filter2 != NULL) {
        !           333:                mbfl_convert_filter_flush(convd->filter2);
        !           334:        }
        !           335:        result->no_encoding = convd->to->no_encoding;
        !           336:        return mbfl_memory_device_result(&convd->device, result);
        !           337: }
        !           338: 
        !           339: int mbfl_buffer_illegalchars(mbfl_buffer_converter *convd)
        !           340: {
        !           341:        int num_illegalchars = 0;
        !           342: 
        !           343:        if (convd == NULL) {
        !           344:                return 0;
        !           345:        }
        !           346: 
        !           347:        if (convd->filter1 != NULL) {
        !           348:                num_illegalchars += convd->filter1->num_illegalchar;
        !           349:        }
        !           350: 
        !           351:        if (convd->filter2 != NULL) {
        !           352:                num_illegalchars += convd->filter2->num_illegalchar;
        !           353:        }
        !           354: 
        !           355:        return (num_illegalchars);
        !           356: }
        !           357: 
        !           358: /*
        !           359:  * encoding detector
        !           360:  */
        !           361: mbfl_encoding_detector *
        !           362: mbfl_encoding_detector_new(enum mbfl_no_encoding *elist, int elistsz, int strict)
        !           363: {
        !           364:        mbfl_encoding_detector *identd;
        !           365: 
        !           366:        int i, num;
        !           367:        mbfl_identify_filter *filter;
        !           368: 
        !           369:        if (elist == NULL || elistsz <= 0) {
        !           370:                return NULL;
        !           371:        }
        !           372: 
        !           373:        /* allocate */
        !           374:        identd = (mbfl_encoding_detector*)mbfl_malloc(sizeof(mbfl_encoding_detector));
        !           375:        if (identd == NULL) {
        !           376:                return NULL;
        !           377:        }
        !           378:        identd->filter_list = (mbfl_identify_filter **)mbfl_calloc(elistsz, sizeof(mbfl_identify_filter *));
        !           379:        if (identd->filter_list == NULL) {
        !           380:                mbfl_free(identd);
        !           381:                return NULL;
        !           382:        }
        !           383: 
        !           384:        /* create filters */
        !           385:        i = 0;
        !           386:        num = 0;
        !           387:        while (i < elistsz) {
        !           388:                filter = mbfl_identify_filter_new(elist[i]);
        !           389:                if (filter != NULL) {
        !           390:                        identd->filter_list[num] = filter;
        !           391:                        num++;
        !           392:                }
        !           393:                i++;
        !           394:        }
        !           395:        identd->filter_list_size = num;
        !           396: 
        !           397:        /* set strict flag */
        !           398:        identd->strict = strict;
        !           399: 
        !           400:        return identd;
        !           401: }
        !           402: 
        !           403: void
        !           404: mbfl_encoding_detector_delete(mbfl_encoding_detector *identd)
        !           405: {
        !           406:        int i;
        !           407: 
        !           408:        if (identd != NULL) {
        !           409:                if (identd->filter_list != NULL) {
        !           410:                        i = identd->filter_list_size;
        !           411:                        while (i > 0) {
        !           412:                                i--;
        !           413:                                mbfl_identify_filter_delete(identd->filter_list[i]);
        !           414:                        }
        !           415:                        mbfl_free((void *)identd->filter_list);
        !           416:                }
        !           417:                mbfl_free((void *)identd);
        !           418:        }
        !           419: }
        !           420: 
        !           421: int
        !           422: mbfl_encoding_detector_feed(mbfl_encoding_detector *identd, mbfl_string *string)
        !           423: {
        !           424:        int i, n, num, bad, res;
        !           425:        unsigned char *p;
        !           426:        mbfl_identify_filter *filter;
        !           427: 
        !           428:        res = 0;
        !           429:        /* feed data */
        !           430:        if (identd != NULL && string != NULL && string->val != NULL) {
        !           431:                num = identd->filter_list_size;
        !           432:                n = string->len;
        !           433:                p = string->val;
        !           434:                bad = 0;
        !           435:                while (n > 0) {
        !           436:                        for (i = 0; i < num; i++) {
        !           437:                                filter = identd->filter_list[i];
        !           438:                                if (!filter->flag) {
        !           439:                                        (*filter->filter_function)(*p, filter);
        !           440:                                        if (filter->flag) {
        !           441:                                                bad++;
        !           442:                                        }
        !           443:                                }
        !           444:                        }
        !           445:                        if ((num - 1) <= bad) {
        !           446:                                res = 1;
        !           447:                                break;
        !           448:                        }
        !           449:                        p++;
        !           450:                        n--;
        !           451:                }
        !           452:        }
        !           453: 
        !           454:        return res;
        !           455: }
        !           456: 
        !           457: enum mbfl_no_encoding mbfl_encoding_detector_judge(mbfl_encoding_detector *identd)
        !           458: {
        !           459:        mbfl_identify_filter *filter;
        !           460:        enum mbfl_no_encoding encoding;
        !           461:        int n;
        !           462: 
        !           463:        /* judge */
        !           464:        encoding = mbfl_no_encoding_invalid;
        !           465:        if (identd != NULL) {
        !           466:                n = identd->filter_list_size - 1;
        !           467:                while (n >= 0) {
        !           468:                        filter = identd->filter_list[n];
        !           469:                        if (!filter->flag) {
        !           470:                                if (!identd->strict || !filter->status) {
        !           471:                                        encoding = filter->encoding->no_encoding;
        !           472:                                }
        !           473:                        }
        !           474:                        n--;
        !           475:                }
        !           476:  
        !           477:                /* fallback judge */
        !           478:                if (encoding == mbfl_no_encoding_invalid) {
        !           479:                        n = identd->filter_list_size - 1;
        !           480:                        while (n >= 0) {
        !           481:                                filter = identd->filter_list[n];
        !           482:                                if (!filter->flag) {
        !           483:                                        encoding = filter->encoding->no_encoding;
        !           484:                                }
        !           485:                                n--;
        !           486:                        }
        !           487:                }
        !           488:        }
        !           489: 
        !           490:        return encoding;
        !           491: }
        !           492: 
        !           493: 
        !           494: /*
        !           495:  * encoding converter
        !           496:  */
        !           497: mbfl_string *
        !           498: mbfl_convert_encoding(
        !           499:     mbfl_string *string,
        !           500:     mbfl_string *result,
        !           501:     enum mbfl_no_encoding toenc)
        !           502: {
        !           503:        int n;
        !           504:        unsigned char *p;
        !           505:        const mbfl_encoding *encoding;
        !           506:        mbfl_memory_device device;
        !           507:        mbfl_convert_filter *filter1;
        !           508:        mbfl_convert_filter *filter2;
        !           509: 
        !           510:        /* initialize */
        !           511:        encoding = mbfl_no2encoding(toenc);
        !           512:        if (encoding == NULL || string == NULL || result == NULL) {
        !           513:                return NULL;
        !           514:        }
        !           515: 
        !           516:        filter1 = NULL;
        !           517:        filter2 = NULL;
        !           518:        if (mbfl_convert_filter_get_vtbl(string->no_encoding, toenc) != NULL) {
        !           519:                filter1 = mbfl_convert_filter_new(string->no_encoding, toenc, mbfl_memory_device_output, 0, &device);
        !           520:        } else {
        !           521:                filter2 = mbfl_convert_filter_new(mbfl_no_encoding_wchar, toenc, mbfl_memory_device_output, 0, &device);
        !           522:                if (filter2 != NULL) {
        !           523:                        filter1 = mbfl_convert_filter_new(string->no_encoding, mbfl_no_encoding_wchar, (int (*)(int, void*))filter2->filter_function, NULL, filter2);
        !           524:                        if (filter1 == NULL) {
        !           525:                                mbfl_convert_filter_delete(filter2);
        !           526:                        }
        !           527:                }
        !           528:        }
        !           529:        if (filter1 == NULL) {
        !           530:                return NULL;
        !           531:        }
        !           532: 
        !           533:        if (filter2 != NULL) {
        !           534:                filter2->illegal_mode = MBFL_OUTPUTFILTER_ILLEGAL_MODE_CHAR;
        !           535:                filter2->illegal_substchar = 0x3f;              /* '?' */
        !           536:        }
        !           537: 
        !           538:        mbfl_memory_device_init(&device, string->len, (string->len >> 2) + 8);
        !           539: 
        !           540:        /* feed data */
        !           541:        n = string->len;
        !           542:        p = string->val;
        !           543:        if (p != NULL) {
        !           544:                while (n > 0) {
        !           545:                        if ((*filter1->filter_function)(*p++, filter1) < 0) {
        !           546:                                break;
        !           547:                        }
        !           548:                        n--;
        !           549:                }
        !           550:        }
        !           551: 
        !           552:        mbfl_convert_filter_flush(filter1);
        !           553:        mbfl_convert_filter_delete(filter1);
        !           554:        if (filter2 != NULL) {
        !           555:                mbfl_convert_filter_flush(filter2);
        !           556:                mbfl_convert_filter_delete(filter2);
        !           557:        }
        !           558: 
        !           559:        return mbfl_memory_device_result(&device, result);
        !           560: }
        !           561: 
        !           562: 
        !           563: /*
        !           564:  * identify encoding
        !           565:  */
        !           566: const mbfl_encoding *
        !           567: mbfl_identify_encoding(mbfl_string *string, enum mbfl_no_encoding *elist, int elistsz, int strict)
        !           568: {
        !           569:        int i, n, num, bad;
        !           570:        unsigned char *p;
        !           571:        mbfl_identify_filter *flist, *filter;
        !           572:        const mbfl_encoding *encoding;
        !           573: 
        !           574:        /* flist is an array of mbfl_identify_filter instances */
        !           575:        flist = (mbfl_identify_filter *)mbfl_calloc(elistsz, sizeof(mbfl_identify_filter));
        !           576:        if (flist == NULL) {
        !           577:                return NULL;
        !           578:        }
        !           579: 
        !           580:        num = 0;
        !           581:        if (elist != NULL) {
        !           582:                for (i = 0; i < elistsz; i++) {
        !           583:                        if (!mbfl_identify_filter_init(&flist[num], elist[i])) {
        !           584:                                num++;
        !           585:                        }
        !           586:                }
        !           587:        }
        !           588: 
        !           589:        /* feed data */
        !           590:        n = string->len;
        !           591:        p = string->val;
        !           592: 
        !           593:        if (p != NULL) {
        !           594:                bad = 0;
        !           595:                while (n > 0) {
        !           596:                        for (i = 0; i < num; i++) {
        !           597:                                filter = &flist[i];
        !           598:                                if (!filter->flag) {
        !           599:                                        (*filter->filter_function)(*p, filter);
        !           600:                                        if (filter->flag) {
        !           601:                                                bad++;
        !           602:                                        }
        !           603:                                }
        !           604:                        }
        !           605:                        if ((num - 1) <= bad && !strict) {
        !           606:                                break;
        !           607:                        }
        !           608:                        p++;
        !           609:                        n--;
        !           610:                }
        !           611:        }
        !           612: 
        !           613:        /* judge */
        !           614:        encoding = NULL;
        !           615: 
        !           616:        for (i = 0; i < num; i++) {
        !           617:                filter = &flist[i];
        !           618:                if (!filter->flag) {
        !           619:                        if (strict && filter->status) {
        !           620:                                continue;
        !           621:                        }
        !           622:                        encoding = filter->encoding;
        !           623:                        break;
        !           624:                }
        !           625:        }
        !           626: 
        !           627:        /* fall-back judge */
        !           628:        if (!encoding) {
        !           629:                for (i = 0; i < num; i++) {
        !           630:                        filter = &flist[i];
        !           631:                        if (!filter->flag && (!strict || !filter->status)) {
        !           632:                                encoding = filter->encoding;
        !           633:                                break;
        !           634:                        }
        !           635:                }
        !           636:        }
        !           637:  
        !           638:        /* cleanup */
        !           639:        /* dtors should be called in reverse order */
        !           640:        i = num; while (--i >= 0) {
        !           641:                mbfl_identify_filter_cleanup(&flist[i]);
        !           642:        }
        !           643: 
        !           644:        mbfl_free((void *)flist);
        !           645: 
        !           646:        return encoding;
        !           647: }
        !           648: 
        !           649: const char*
        !           650: mbfl_identify_encoding_name(mbfl_string *string, enum mbfl_no_encoding *elist, int elistsz, int strict)
        !           651: {
        !           652:        const mbfl_encoding *encoding;
        !           653: 
        !           654:        encoding = mbfl_identify_encoding(string, elist, elistsz, strict);
        !           655:        if (encoding != NULL &&
        !           656:            encoding->no_encoding > mbfl_no_encoding_charset_min &&
        !           657:            encoding->no_encoding < mbfl_no_encoding_charset_max) {
        !           658:                return encoding->name;
        !           659:        } else {
        !           660:                return NULL;
        !           661:        }
        !           662: }
        !           663: 
        !           664: enum mbfl_no_encoding
        !           665: mbfl_identify_encoding_no(mbfl_string *string, enum mbfl_no_encoding *elist, int elistsz, int strict)
        !           666: {
        !           667:        const mbfl_encoding *encoding;
        !           668: 
        !           669:        encoding = mbfl_identify_encoding(string, elist, elistsz, strict);
        !           670:        if (encoding != NULL &&
        !           671:            encoding->no_encoding > mbfl_no_encoding_charset_min &&
        !           672:            encoding->no_encoding < mbfl_no_encoding_charset_max) {
        !           673:                return encoding->no_encoding;
        !           674:        } else {
        !           675:                return mbfl_no_encoding_invalid;
        !           676:        }
        !           677: }
        !           678: 
        !           679: 
        !           680: /*
        !           681:  *  strlen
        !           682:  */
        !           683: static int
        !           684: filter_count_output(int c, void *data)
        !           685: {
        !           686:        (*(int *)data)++;
        !           687:        return c;
        !           688: }
        !           689: 
        !           690: int
        !           691: mbfl_strlen(mbfl_string *string)
        !           692: {
        !           693:        int len, n, m, k;
        !           694:        unsigned char *p;
        !           695:        const unsigned char *mbtab;
        !           696:        const mbfl_encoding *encoding;
        !           697: 
        !           698:        encoding = mbfl_no2encoding(string->no_encoding);
        !           699:        if (encoding == NULL || string == NULL) {
        !           700:                return -1;
        !           701:        }
        !           702: 
        !           703:        len = 0;
        !           704:        if (encoding->flag & MBFL_ENCTYPE_SBCS) {
        !           705:                len = string->len;
        !           706:        } else if (encoding->flag & (MBFL_ENCTYPE_WCS2BE | MBFL_ENCTYPE_WCS2LE)) {
        !           707:                len = string->len/2;
        !           708:        } else if (encoding->flag & (MBFL_ENCTYPE_WCS4BE | MBFL_ENCTYPE_WCS4LE)) {
        !           709:                len = string->len/4;
        !           710:        } else if (encoding->mblen_table != NULL) {
        !           711:                mbtab = encoding->mblen_table;
        !           712:                n = 0;
        !           713:                p = string->val;
        !           714:                k = string->len;
        !           715:                /* count */
        !           716:                if (p != NULL) {
        !           717:                        while (n < k) {
        !           718:                                m = mbtab[*p];
        !           719:                                n += m;
        !           720:                                p += m;
        !           721:                                len++;
        !           722:                        };
        !           723:                }
        !           724:        } else {
        !           725:                /* wchar filter */
        !           726:                mbfl_convert_filter *filter = mbfl_convert_filter_new(
        !           727:                  string->no_encoding, 
        !           728:                  mbfl_no_encoding_wchar,
        !           729:                  filter_count_output, 0, &len);
        !           730:                if (filter == NULL) {
        !           731:                        return -1;
        !           732:                }
        !           733:                /* count */
        !           734:                n = string->len;
        !           735:                p = string->val;
        !           736:                if (p != NULL) {
        !           737:                        while (n > 0) {
        !           738:                                (*filter->filter_function)(*p++, filter);
        !           739:                                n--;
        !           740:                        }
        !           741:                }
        !           742:                mbfl_convert_filter_delete(filter);
        !           743:        }
        !           744: 
        !           745:        return len;
        !           746: }
        !           747: 
        !           748:  
        !           749: /*
        !           750:  *  strpos
        !           751:  */
        !           752: struct collector_strpos_data {
        !           753:        mbfl_convert_filter *next_filter;
        !           754:        mbfl_wchar_device needle;
        !           755:        int needle_len;
        !           756:        int start;
        !           757:        int output;
        !           758:        int found_pos;
        !           759:        int needle_pos;
        !           760:        int matched_pos;
        !           761: };
        !           762: 
        !           763: static int
        !           764: collector_strpos(int c, void* data)
        !           765: {
        !           766:        int *p, *h, *m, n;
        !           767:        struct collector_strpos_data *pc = (struct collector_strpos_data*)data;
        !           768: 
        !           769:        if (pc->output >= pc->start) {
        !           770:                if (c == (int)pc->needle.buffer[pc->needle_pos]) {
        !           771:                        if (pc->needle_pos == 0) {
        !           772:                                pc->found_pos = pc->output;                     /* found position */
        !           773:                        }
        !           774:                        pc->needle_pos++;                                               /* needle pointer */
        !           775:                        if (pc->needle_pos >= pc->needle_len) {
        !           776:                                pc->matched_pos = pc->found_pos;        /* matched position */
        !           777:                                pc->needle_pos--;
        !           778:                                goto retry;
        !           779:                        }
        !           780:                } else if (pc->needle_pos != 0) {
        !           781: retry:
        !           782:                        h = (int *)pc->needle.buffer;
        !           783:                        h++;
        !           784:                        for (;;) {
        !           785:                                pc->found_pos++;
        !           786:                                p = h;
        !           787:                                m = (int *)pc->needle.buffer;
        !           788:                                n = pc->needle_pos - 1;
        !           789:                                while (n > 0 && *p == *m) {
        !           790:                                        n--;
        !           791:                                        p++;
        !           792:                                        m++;
        !           793:                                }
        !           794:                                if (n <= 0) {
        !           795:                                        if (*m != c) {
        !           796:                                                pc->needle_pos = 0;
        !           797:                                        }
        !           798:                                        break;
        !           799:                                } else {
        !           800:                                        h++;
        !           801:                                        pc->needle_pos--;
        !           802:                                }
        !           803:                        }
        !           804:                }
        !           805:        }
        !           806: 
        !           807:        pc->output++;
        !           808:        return c;
        !           809: }
        !           810: 
        !           811: /*
        !           812:  *     oddlen
        !           813:  */
        !           814: int 
        !           815: mbfl_oddlen(mbfl_string *string)
        !           816: {
        !           817:        int len, n, m, k;
        !           818:        unsigned char *p;
        !           819:        const unsigned char *mbtab;
        !           820:        const mbfl_encoding *encoding;
        !           821: 
        !           822: 
        !           823:        if (string == NULL) {
        !           824:                return -1;
        !           825:        }
        !           826:        encoding = mbfl_no2encoding(string->no_encoding);
        !           827:        if (encoding == NULL) {
        !           828:                return -1;
        !           829:        }
        !           830: 
        !           831:        len = 0;
        !           832:        if (encoding->flag & MBFL_ENCTYPE_SBCS) {
        !           833:                return 0;
        !           834:        } else if (encoding->flag & (MBFL_ENCTYPE_WCS2BE | MBFL_ENCTYPE_WCS2LE)) {
        !           835:                return len % 2;
        !           836:        } else if (encoding->flag & (MBFL_ENCTYPE_WCS4BE | MBFL_ENCTYPE_WCS4LE)) {
        !           837:                return len % 4;
        !           838:        } else if (encoding->mblen_table != NULL) {
        !           839:                mbtab = encoding->mblen_table;
        !           840:                n = 0;
        !           841:                p = string->val;
        !           842:                k = string->len;
        !           843:                /* count */
        !           844:                if (p != NULL) {
        !           845:                        while (n < k) {
        !           846:                                m = mbtab[*p];
        !           847:                                n += m;
        !           848:                                p += m;
        !           849:                        };
        !           850:                }
        !           851:                return n-k;
        !           852:        } else {
        !           853:                /* how can i do ? */
        !           854:                return 0;
        !           855:        }
        !           856:        /* NOT REACHED */
        !           857: }
        !           858: 
        !           859: int
        !           860: mbfl_strpos(
        !           861:     mbfl_string *haystack,
        !           862:     mbfl_string *needle,
        !           863:     int offset,
        !           864:     int reverse)
        !           865: {
        !           866:        int result;
        !           867:        mbfl_string _haystack_u8, _needle_u8;
        !           868:        const mbfl_string *haystack_u8, *needle_u8;
        !           869:        const unsigned char *u8_tbl;
        !           870: 
        !           871:        if (haystack == NULL || haystack->val == NULL || needle == NULL || needle->val == NULL) {
        !           872:                return -8;
        !           873:        }
        !           874: 
        !           875:        {
        !           876:                const mbfl_encoding *u8_enc;
        !           877:                u8_enc = mbfl_no2encoding(mbfl_no_encoding_utf8);
        !           878:                if (u8_enc == NULL || u8_enc->mblen_table == NULL) {
        !           879:                        return -8;
        !           880:                }
        !           881:                u8_tbl = u8_enc->mblen_table;
        !           882:        }
        !           883: 
        !           884:        if (haystack->no_encoding != mbfl_no_encoding_utf8) {
        !           885:                mbfl_string_init(&_haystack_u8);
        !           886:                haystack_u8 = mbfl_convert_encoding(haystack, &_haystack_u8, mbfl_no_encoding_utf8);
        !           887:                if (haystack_u8 == NULL) {
        !           888:                        result = -4;
        !           889:                        goto out;
        !           890:                }
        !           891:        } else {
        !           892:                haystack_u8 = haystack;
        !           893:        }
        !           894: 
        !           895:        if (needle->no_encoding != mbfl_no_encoding_utf8) {
        !           896:                mbfl_string_init(&_needle_u8);
        !           897:                needle_u8 = mbfl_convert_encoding(needle, &_needle_u8, mbfl_no_encoding_utf8);
        !           898:                if (needle_u8 == NULL) {
        !           899:                        result = -4;
        !           900:                        goto out;
        !           901:                }
        !           902:        } else {
        !           903:                needle_u8 = needle;
        !           904:        }
        !           905: 
        !           906:        if (needle_u8->len < 1) {
        !           907:                result = -8;
        !           908:                goto out;
        !           909:        }
        !           910: 
        !           911:        result = -1;
        !           912:        if (haystack_u8->len < needle_u8->len) {
        !           913:                goto out;
        !           914:        }
        !           915: 
        !           916:        if (!reverse) {
        !           917:                unsigned int jtbl[1 << (sizeof(unsigned char) * 8)];
        !           918:                unsigned int needle_u8_len = needle_u8->len;
        !           919:                unsigned int i;
        !           920:                const unsigned char *p, *q, *e;
        !           921:                const unsigned char *haystack_u8_val = haystack_u8->val,
        !           922:                                    *needle_u8_val = needle_u8->val;
        !           923:                for (i = 0; i < sizeof(jtbl) / sizeof(*jtbl); ++i) {
        !           924:                        jtbl[i] = needle_u8_len + 1;
        !           925:                }
        !           926:                for (i = 0; i < needle_u8_len - 1; ++i) {
        !           927:                        jtbl[needle_u8_val[i]] = needle_u8_len - i;
        !           928:                }
        !           929:                e = haystack_u8_val + haystack_u8->len;
        !           930:                p = haystack_u8_val;
        !           931:                while (--offset >= 0) {
        !           932:                        if (p >= e) {
        !           933:                                result = -16;
        !           934:                                goto out;
        !           935:                        }
        !           936:                        p += u8_tbl[*p];
        !           937:                }
        !           938:                p += needle_u8_len;
        !           939:                if (p > e) {
        !           940:                        goto out;
        !           941:                }
        !           942:                while (p <= e) {
        !           943:                        const unsigned char *pv = p;
        !           944:                        q = needle_u8_val + needle_u8_len;
        !           945:                        for (;;) {
        !           946:                                if (q == needle_u8_val) {
        !           947:                                        result = 0;
        !           948:                                        while (p > haystack_u8_val) {
        !           949:                                                unsigned char c = *--p;
        !           950:                                                if (c < 0x80) {
        !           951:                                                        ++result;
        !           952:                                                } else if ((c & 0xc0) != 0x80) {
        !           953:                                                        ++result;
        !           954:                                                }       
        !           955:                                        }
        !           956:                                        goto out;
        !           957:                                }
        !           958:                                if (*--q != *--p) {
        !           959:                                        break;
        !           960:                                }
        !           961:                        }
        !           962:                        p += jtbl[*p];
        !           963:                        if (p <= pv) {
        !           964:                                p = pv + 1;
        !           965:                        }
        !           966:                }
        !           967:        } else {
        !           968:                unsigned int jtbl[1 << (sizeof(unsigned char) * 8)];
        !           969:                unsigned int needle_u8_len = needle_u8->len, needle_len = 0;
        !           970:                unsigned int i;
        !           971:                const unsigned char *p, *e, *q, *qe;
        !           972:                const unsigned char *haystack_u8_val = haystack_u8->val,
        !           973:                                    *needle_u8_val = needle_u8->val;
        !           974:                for (i = 0; i < sizeof(jtbl) / sizeof(*jtbl); ++i) {
        !           975:                        jtbl[i] = needle_u8_len;
        !           976:                }
        !           977:                for (i = needle_u8_len - 1; i > 0; --i) {
        !           978:                        unsigned char c = needle_u8_val[i];
        !           979:                        jtbl[c] = i;
        !           980:                        if (c < 0x80) {
        !           981:                                ++needle_len;
        !           982:                        } else if ((c & 0xc0) != 0x80) {
        !           983:                                ++needle_len;
        !           984:                        }
        !           985:                }
        !           986:                {
        !           987:                        unsigned char c = needle_u8_val[0];
        !           988:                        if (c < 0x80) {
        !           989:                                ++needle_len;
        !           990:                        } else if ((c & 0xc0) != 0x80) {
        !           991:                                ++needle_len;
        !           992:                        }
        !           993:                }
        !           994:                e = haystack_u8_val;
        !           995:                p = e + haystack_u8->len;
        !           996:                qe = needle_u8_val + needle_u8_len;
        !           997:                if (offset < 0) {
        !           998:                        if (-offset > needle_len) {
        !           999:                                offset += needle_len; 
        !          1000:                                while (offset < 0) {
        !          1001:                                        unsigned char c;
        !          1002:                                        if (p <= e) {
        !          1003:                                                result = -16;
        !          1004:                                                goto out;
        !          1005:                                        }
        !          1006:                                        c = *(--p);
        !          1007:                                        if (c < 0x80) {
        !          1008:                                                ++offset;
        !          1009:                                        } else if ((c & 0xc0) != 0x80) {
        !          1010:                                                ++offset;
        !          1011:                                        }
        !          1012:                                }
        !          1013:                        }
        !          1014:                } else {
        !          1015:                        const unsigned char *ee = haystack_u8_val + haystack_u8->len;
        !          1016:                        while (--offset >= 0) {
        !          1017:                                if (e >= ee) {
        !          1018:                                        result = -16;
        !          1019:                                        goto out;
        !          1020:                                }
        !          1021:                                e += u8_tbl[*e];
        !          1022:                        }
        !          1023:                }
        !          1024:                if (p < e + needle_u8_len) {
        !          1025:                        goto out;
        !          1026:                }
        !          1027:                p -= needle_u8_len;
        !          1028:                while (p >= e) {
        !          1029:                        const unsigned char *pv = p;
        !          1030:                        q = needle_u8_val;
        !          1031:                        for (;;) {
        !          1032:                                if (q == qe) {
        !          1033:                                        result = 0;
        !          1034:                                        p -= needle_u8_len;
        !          1035:                                        while (p > haystack_u8_val) {
        !          1036:                                                unsigned char c = *--p;
        !          1037:                                                if (c < 0x80) {
        !          1038:                                                        ++result;
        !          1039:                                                } else if ((c & 0xc0) != 0x80) {
        !          1040:                                                        ++result;
        !          1041:                                                }       
        !          1042:                                        }
        !          1043:                                        goto out;
        !          1044:                                }
        !          1045:                                if (*q != *p) {
        !          1046:                                        break;
        !          1047:                                }
        !          1048:                                ++p, ++q;
        !          1049:                        }
        !          1050:                        p -= jtbl[*p];
        !          1051:                        if (p >= pv) {
        !          1052:                                p = pv - 1;
        !          1053:                        }
        !          1054:                }
        !          1055:        }
        !          1056: out:
        !          1057:        if (haystack_u8 == &_haystack_u8) {
        !          1058:                mbfl_string_clear(&_haystack_u8);
        !          1059:        }
        !          1060:        if (needle_u8 == &_needle_u8) {
        !          1061:                mbfl_string_clear(&_needle_u8);
        !          1062:        }
        !          1063:        return result;
        !          1064: }
        !          1065: 
        !          1066: /*
        !          1067:  *  substr_count
        !          1068:  */
        !          1069: 
        !          1070: int
        !          1071: mbfl_substr_count(
        !          1072:     mbfl_string *haystack,
        !          1073:     mbfl_string *needle
        !          1074:    )
        !          1075: {
        !          1076:        int n, result = 0;
        !          1077:        unsigned char *p;
        !          1078:        mbfl_convert_filter *filter;
        !          1079:        struct collector_strpos_data pc;
        !          1080: 
        !          1081:        if (haystack == NULL || needle == NULL) {
        !          1082:                return -8;
        !          1083:        }
        !          1084:        /* needle is converted into wchar */
        !          1085:        mbfl_wchar_device_init(&pc.needle);
        !          1086:        filter = mbfl_convert_filter_new(
        !          1087:          needle->no_encoding,
        !          1088:          mbfl_no_encoding_wchar,
        !          1089:          mbfl_wchar_device_output, 0, &pc.needle);
        !          1090:        if (filter == NULL) {
        !          1091:                return -4;
        !          1092:        }
        !          1093:        p = needle->val;
        !          1094:        n = needle->len;
        !          1095:        if (p != NULL) {
        !          1096:                while (n > 0) {
        !          1097:                        if ((*filter->filter_function)(*p++, filter) < 0) {
        !          1098:                                break;
        !          1099:                        }
        !          1100:                        n--;
        !          1101:                }
        !          1102:        }
        !          1103:        mbfl_convert_filter_flush(filter);
        !          1104:        mbfl_convert_filter_delete(filter);
        !          1105:        pc.needle_len = pc.needle.pos;
        !          1106:        if (pc.needle.buffer == NULL) {
        !          1107:                return -4;
        !          1108:        }
        !          1109:        if (pc.needle_len <= 0) {
        !          1110:                mbfl_wchar_device_clear(&pc.needle);
        !          1111:                return -2;
        !          1112:        }
        !          1113:        /* initialize filter and collector data */
        !          1114:        filter = mbfl_convert_filter_new(
        !          1115:          haystack->no_encoding,
        !          1116:          mbfl_no_encoding_wchar,
        !          1117:          collector_strpos, 0, &pc);
        !          1118:        if (filter == NULL) {
        !          1119:                mbfl_wchar_device_clear(&pc.needle);
        !          1120:                return -4;
        !          1121:        }
        !          1122:        pc.start = 0;
        !          1123:        pc.output = 0;
        !          1124:        pc.needle_pos = 0;
        !          1125:        pc.found_pos = 0;
        !          1126:        pc.matched_pos = -1;
        !          1127: 
        !          1128:        /* feed data */
        !          1129:        p = haystack->val;
        !          1130:        n = haystack->len;
        !          1131:        if (p != NULL) {
        !          1132:                while (n > 0) {
        !          1133:                        if ((*filter->filter_function)(*p++, filter) < 0) {
        !          1134:                                pc.matched_pos = -4;
        !          1135:                                break;
        !          1136:                        }
        !          1137:                        if (pc.matched_pos >= 0) {
        !          1138:                                ++result;
        !          1139:                                pc.matched_pos = -1;
        !          1140:                                pc.needle_pos = 0;
        !          1141:                        }
        !          1142:                        n--;
        !          1143:                }
        !          1144:        }
        !          1145:        mbfl_convert_filter_flush(filter);
        !          1146:        mbfl_convert_filter_delete(filter);
        !          1147:        mbfl_wchar_device_clear(&pc.needle);
        !          1148: 
        !          1149:        return result;
        !          1150: }
        !          1151: 
        !          1152: /*
        !          1153:  *  substr
        !          1154:  */
        !          1155: struct collector_substr_data {
        !          1156:        mbfl_convert_filter *next_filter;
        !          1157:        int start;
        !          1158:        int stop;
        !          1159:        int output;
        !          1160: };
        !          1161: 
        !          1162: static int
        !          1163: collector_substr(int c, void* data)
        !          1164: {
        !          1165:        struct collector_substr_data *pc = (struct collector_substr_data*)data;
        !          1166: 
        !          1167:        if (pc->output >= pc->stop) {
        !          1168:                return -1;
        !          1169:        }
        !          1170: 
        !          1171:        if (pc->output >= pc->start) {
        !          1172:                (*pc->next_filter->filter_function)(c, pc->next_filter);
        !          1173:        }
        !          1174: 
        !          1175:        pc->output++;
        !          1176: 
        !          1177:        return c;
        !          1178: }
        !          1179: 
        !          1180: mbfl_string *
        !          1181: mbfl_substr(
        !          1182:     mbfl_string *string,
        !          1183:     mbfl_string *result,
        !          1184:     int from,
        !          1185:     int length)
        !          1186: {
        !          1187:        const mbfl_encoding *encoding;
        !          1188:        int n, m, k, len, start, end;
        !          1189:        unsigned char *p, *w;
        !          1190:        const unsigned char *mbtab;
        !          1191: 
        !          1192:        encoding = mbfl_no2encoding(string->no_encoding);
        !          1193:        if (encoding == NULL || string == NULL || result == NULL) {
        !          1194:                return NULL;
        !          1195:        }
        !          1196:        mbfl_string_init(result);
        !          1197:        result->no_language = string->no_language;
        !          1198:        result->no_encoding = string->no_encoding;
        !          1199: 
        !          1200:        if ((encoding->flag & (MBFL_ENCTYPE_SBCS | MBFL_ENCTYPE_WCS2BE | MBFL_ENCTYPE_WCS2LE | MBFL_ENCTYPE_WCS4BE | MBFL_ENCTYPE_WCS4LE)) ||
        !          1201:           encoding->mblen_table != NULL) {
        !          1202:                len = string->len;
        !          1203:                start = from;
        !          1204:                end = from + length;
        !          1205:                if (encoding->flag & (MBFL_ENCTYPE_WCS2BE | MBFL_ENCTYPE_WCS2LE)) {
        !          1206:                        start *= 2;
        !          1207:                        end = start + length*2;
        !          1208:                } else if (encoding->flag & (MBFL_ENCTYPE_WCS4BE | MBFL_ENCTYPE_WCS4LE)) {
        !          1209:                        start *= 4;
        !          1210:                        end = start + length*4;
        !          1211:                } else if (encoding->mblen_table != NULL) {
        !          1212:                        mbtab = encoding->mblen_table;
        !          1213:                        start = 0;
        !          1214:                        end = 0;
        !          1215:                        n = 0;
        !          1216:                        k = 0;
        !          1217:                        p = string->val;
        !          1218:                        if (p != NULL) {
        !          1219:                                /* search start position */
        !          1220:                                while (k <= from) {
        !          1221:                                        start = n;
        !          1222:                                        if (n >= len) {
        !          1223:                                                break;
        !          1224:                                        }
        !          1225:                                        m = mbtab[*p];
        !          1226:                                        n += m;
        !          1227:                                        p += m;
        !          1228:                                        k++;
        !          1229:                                }
        !          1230:                                /* detect end position */
        !          1231:                                k = 0;
        !          1232:                                end = start;
        !          1233:                                while (k < length) {
        !          1234:                                        end = n;
        !          1235:                                        if (n >= len) {
        !          1236:                                                break;
        !          1237:                                        }
        !          1238:                                        m = mbtab[*p];
        !          1239:                                        n += m;
        !          1240:                                        p += m;
        !          1241:                                        k++;
        !          1242:                                }
        !          1243:                        }
        !          1244:                }
        !          1245: 
        !          1246:                if (start > len) {
        !          1247:                        start = len;
        !          1248:                }
        !          1249:                if (start < 0) {
        !          1250:                        start = 0;
        !          1251:                }
        !          1252:                if (end > len) {
        !          1253:                        end = len;
        !          1254:                }
        !          1255:                if (end < 0) {
        !          1256:                        end = 0;
        !          1257:                }
        !          1258:                if (start > end) {
        !          1259:                        start = end;
        !          1260:                }
        !          1261: 
        !          1262:                /* allocate memory and copy */
        !          1263:                n = end - start;
        !          1264:                result->len = 0;
        !          1265:                result->val = w = (unsigned char*)mbfl_malloc((n + 8)*sizeof(unsigned char));
        !          1266:                if (w != NULL) {
        !          1267:                        p = string->val;
        !          1268:                        if (p != NULL) {
        !          1269:                                p += start;
        !          1270:                                result->len = n;
        !          1271:                                while (n > 0) {
        !          1272:                                        *w++ = *p++;
        !          1273:                                        n--;
        !          1274:                                }
        !          1275:                        }
        !          1276:                        *w++ = '\0';
        !          1277:                        *w++ = '\0';
        !          1278:                        *w++ = '\0';
        !          1279:                        *w = '\0';
        !          1280:                } else {
        !          1281:                        result = NULL;
        !          1282:                }
        !          1283:        } else {
        !          1284:                mbfl_memory_device device;
        !          1285:                struct collector_substr_data pc;
        !          1286:                mbfl_convert_filter *decoder;
        !          1287:                mbfl_convert_filter *encoder;
        !          1288: 
        !          1289:                mbfl_memory_device_init(&device, length + 1, 0);
        !          1290:                mbfl_string_init(result);
        !          1291:                result->no_language = string->no_language;
        !          1292:                result->no_encoding = string->no_encoding;
        !          1293:                /* output code filter */
        !          1294:                decoder = mbfl_convert_filter_new(
        !          1295:                    mbfl_no_encoding_wchar,
        !          1296:                    string->no_encoding,
        !          1297:                    mbfl_memory_device_output, 0, &device);
        !          1298:                /* wchar filter */
        !          1299:                encoder = mbfl_convert_filter_new(
        !          1300:                    string->no_encoding,
        !          1301:                    mbfl_no_encoding_wchar,
        !          1302:                    collector_substr, 0, &pc);
        !          1303:                if (decoder == NULL || encoder == NULL) {
        !          1304:                        mbfl_convert_filter_delete(encoder);
        !          1305:                        mbfl_convert_filter_delete(decoder);
        !          1306:                        return NULL;
        !          1307:                }
        !          1308:                pc.next_filter = decoder;
        !          1309:                pc.start = from;
        !          1310:                pc.stop = from + length;
        !          1311:                pc.output = 0;
        !          1312: 
        !          1313:                /* feed data */
        !          1314:                p = string->val;
        !          1315:                n = string->len;
        !          1316:                if (p != NULL) {
        !          1317:                        while (n > 0) {
        !          1318:                                if ((*encoder->filter_function)(*p++, encoder) < 0) {
        !          1319:                                        break;
        !          1320:                                }
        !          1321:                                n--;
        !          1322:                        }
        !          1323:                }
        !          1324: 
        !          1325:                mbfl_convert_filter_flush(encoder);
        !          1326:                mbfl_convert_filter_flush(decoder);
        !          1327:                result = mbfl_memory_device_result(&device, result);
        !          1328:                mbfl_convert_filter_delete(encoder);
        !          1329:                mbfl_convert_filter_delete(decoder);
        !          1330:        }
        !          1331: 
        !          1332:        return result;
        !          1333: }
        !          1334: 
        !          1335: /*
        !          1336:  *  strcut
        !          1337:  */
        !          1338: mbfl_string *
        !          1339: mbfl_strcut(
        !          1340:     mbfl_string *string,
        !          1341:     mbfl_string *result,
        !          1342:     int from,
        !          1343:     int length)
        !          1344: {
        !          1345:        const mbfl_encoding *encoding;
        !          1346:        mbfl_memory_device device;
        !          1347: 
        !          1348:        /* validate the parameters */
        !          1349:        if (string == NULL || string->val == NULL || result == NULL) {
        !          1350:                return NULL;
        !          1351:        }
        !          1352: 
        !          1353:        if (from < 0 || length < 0) {
        !          1354:                return NULL;
        !          1355:        }
        !          1356: 
        !          1357:        if (from >= string->len) {
        !          1358:                from = string->len;
        !          1359:        }
        !          1360: 
        !          1361:        encoding = mbfl_no2encoding(string->no_encoding);
        !          1362:        if (encoding == NULL) {
        !          1363:                return NULL;
        !          1364:        }
        !          1365: 
        !          1366:        mbfl_string_init(result);
        !          1367:        result->no_language = string->no_language;
        !          1368:        result->no_encoding = string->no_encoding;
        !          1369: 
        !          1370:        if ((encoding->flag & (MBFL_ENCTYPE_SBCS
        !          1371:                                | MBFL_ENCTYPE_WCS2BE
        !          1372:                                | MBFL_ENCTYPE_WCS2LE
        !          1373:                                | MBFL_ENCTYPE_WCS4BE
        !          1374:                                | MBFL_ENCTYPE_WCS4LE))
        !          1375:                        || encoding->mblen_table != NULL) {
        !          1376:                const unsigned char *start = NULL;
        !          1377:                const unsigned char *end = NULL;
        !          1378:                unsigned char *w;
        !          1379:                unsigned int sz;
        !          1380: 
        !          1381:                if (encoding->flag & (MBFL_ENCTYPE_WCS2BE | MBFL_ENCTYPE_WCS2LE)) {
        !          1382:                        from &= -2;
        !          1383: 
        !          1384:                        if (from + length >= string->len) {
        !          1385:                                length = string->len - from;
        !          1386:                        }
        !          1387: 
        !          1388:                        start = string->val + from;
        !          1389:                        end   = start + (length & -2);
        !          1390:                } else if (encoding->flag & (MBFL_ENCTYPE_WCS4BE | MBFL_ENCTYPE_WCS4LE)) {
        !          1391:                        from &= -4;
        !          1392: 
        !          1393:                        if (from + length >= string->len) {
        !          1394:                                length = string->len - from;
        !          1395:                        }
        !          1396: 
        !          1397:                        start = string->val + from;
        !          1398:                        end   = start + (length & -4);
        !          1399:                } else if ((encoding->flag & MBFL_ENCTYPE_SBCS)) {
        !          1400:                        if (from + length >= string->len) {
        !          1401:                                length = string->len - from;
        !          1402:                        }
        !          1403: 
        !          1404:                        start = string->val + from;
        !          1405:                        end = start + length;
        !          1406:                } else if (encoding->mblen_table != NULL) {
        !          1407:                        const unsigned char *mbtab = encoding->mblen_table;
        !          1408:                        const unsigned char *p, *q;
        !          1409:                        int m;
        !          1410: 
        !          1411:                        /* search start position */
        !          1412:                        for (m = 0, p = string->val, q = p + from;
        !          1413:                                        p < q; p += (m = mbtab[*p]));
        !          1414: 
        !          1415:                        if (p > q) {
        !          1416:                                p -= m;
        !          1417:                        }
        !          1418: 
        !          1419:                        start = p;
        !          1420: 
        !          1421:                        /* search end position */
        !          1422:                        if ((start - string->val) + length >= (int)string->len) {
        !          1423:                                end = string->val + string->len;
        !          1424:                        } else {
        !          1425:                                for (q = p + length; p < q; p += (m = mbtab[*p]));
        !          1426: 
        !          1427:                                if (p > q) {
        !          1428:                                        p -= m;
        !          1429:                                }
        !          1430:                                end = p;
        !          1431:                        }
        !          1432:                } else {
        !          1433:                        /* never reached */
        !          1434:                        return NULL;
        !          1435:                }
        !          1436: 
        !          1437:                /* allocate memory and copy string */
        !          1438:                sz = end - start;
        !          1439:                if ((w = (unsigned char*)mbfl_calloc(sz + 8,
        !          1440:                                sizeof(unsigned char))) == NULL) {
        !          1441:                        return NULL;
        !          1442:                }
        !          1443: 
        !          1444:                memcpy(w, start, sz);
        !          1445:                w[sz] = '\0';
        !          1446:                w[sz + 1] = '\0';
        !          1447:                w[sz + 2] = '\0';
        !          1448:                w[sz + 3] = '\0';
        !          1449: 
        !          1450:                result->val = w;
        !          1451:                result->len = sz;
        !          1452:        } else {
        !          1453:                mbfl_convert_filter *encoder     = NULL;
        !          1454:                mbfl_convert_filter *decoder     = NULL;
        !          1455:                const unsigned char *p, *q, *r;
        !          1456:                struct {
        !          1457:                        mbfl_convert_filter encoder;
        !          1458:                        mbfl_convert_filter decoder;
        !          1459:                        const unsigned char *p;
        !          1460:                        int pos;
        !          1461:                } bk, _bk;
        !          1462: 
        !          1463:                /* output code filter */
        !          1464:                if (!(decoder = mbfl_convert_filter_new(
        !          1465:                                mbfl_no_encoding_wchar,
        !          1466:                                string->no_encoding,
        !          1467:                                mbfl_memory_device_output, 0, &device))) {
        !          1468:                        return NULL;
        !          1469:                }
        !          1470: 
        !          1471:                /* wchar filter */
        !          1472:                if (!(encoder = mbfl_convert_filter_new(
        !          1473:                                string->no_encoding,
        !          1474:                                mbfl_no_encoding_wchar,
        !          1475:                                mbfl_filter_output_null,
        !          1476:                                NULL, NULL))) {
        !          1477:                        mbfl_convert_filter_delete(decoder);
        !          1478:                        return NULL;
        !          1479:                }
        !          1480: 
        !          1481:                mbfl_memory_device_init(&device, length + 8, 0);
        !          1482: 
        !          1483:                p = string->val;
        !          1484: 
        !          1485:                /* search start position */
        !          1486:                for (q = string->val + from; p < q; p++) {
        !          1487:                        (*encoder->filter_function)(*p, encoder);
        !          1488:                }
        !          1489: 
        !          1490:                /* switch the drain direction */
        !          1491:                encoder->output_function = (int(*)(int,void *))decoder->filter_function;
        !          1492:                encoder->flush_function = (int(*)(void *))decoder->filter_flush;
        !          1493:                encoder->data = decoder;
        !          1494: 
        !          1495:                q = string->val + string->len;
        !          1496: 
        !          1497:                /* save the encoder, decoder state and the pointer */
        !          1498:                mbfl_convert_filter_copy(decoder, &_bk.decoder);
        !          1499:                mbfl_convert_filter_copy(encoder, &_bk.encoder);
        !          1500:                _bk.p = p;
        !          1501:                _bk.pos = device.pos;
        !          1502: 
        !          1503:                if (length > q - p) {
        !          1504:                        length = q - p;
        !          1505:                }
        !          1506: 
        !          1507:                if (length >= 20) {
        !          1508:                        /* output a little shorter than "length" */
        !          1509:                        /* XXX: the constant "20" was determined purely on the heuristics. */
        !          1510:                        for (r = p + length - 20; p < r; p++) {
        !          1511:                                (*encoder->filter_function)(*p, encoder);
        !          1512:                        }
        !          1513: 
        !          1514:                        /* if the offset of the resulting string exceeds the length,
        !          1515:                         * then restore the state */
        !          1516:                        if (device.pos > length) {
        !          1517:                                p = _bk.p;
        !          1518:                                device.pos = _bk.pos;
        !          1519:                                decoder->filter_dtor(decoder);
        !          1520:                                encoder->filter_dtor(encoder);
        !          1521:                                mbfl_convert_filter_copy(&_bk.decoder, decoder);
        !          1522:                                mbfl_convert_filter_copy(&_bk.encoder, encoder);
        !          1523:                                bk = _bk;
        !          1524:                        } else {
        !          1525:                                /* save the encoder, decoder state and the pointer */
        !          1526:                                mbfl_convert_filter_copy(decoder, &bk.decoder);
        !          1527:                                mbfl_convert_filter_copy(encoder, &bk.encoder);
        !          1528:                                bk.p = p;
        !          1529:                                bk.pos = device.pos;
        !          1530: 
        !          1531:                                /* flush the stream */
        !          1532:                                (*encoder->filter_flush)(encoder);
        !          1533: 
        !          1534:                                /* if the offset of the resulting string exceeds the length,
        !          1535:                                 * then restore the state */
        !          1536:                                if (device.pos > length) {
        !          1537:                                        bk.decoder.filter_dtor(&bk.decoder);
        !          1538:                                        bk.encoder.filter_dtor(&bk.encoder);
        !          1539: 
        !          1540:                                        p = _bk.p;
        !          1541:                                        device.pos = _bk.pos;
        !          1542:                                        decoder->filter_dtor(decoder);
        !          1543:                                        encoder->filter_dtor(encoder);
        !          1544:                                        mbfl_convert_filter_copy(&_bk.decoder, decoder);
        !          1545:                                        mbfl_convert_filter_copy(&_bk.encoder, encoder);
        !          1546:                                        bk = _bk;
        !          1547:                                } else {
        !          1548:                                        _bk.decoder.filter_dtor(&_bk.decoder);
        !          1549:                                        _bk.encoder.filter_dtor(&_bk.encoder);
        !          1550: 
        !          1551:                                        p = bk.p;
        !          1552:                                        device.pos = bk.pos;
        !          1553:                                        decoder->filter_dtor(decoder);
        !          1554:                                        encoder->filter_dtor(encoder);
        !          1555:                                        mbfl_convert_filter_copy(&bk.decoder, decoder);
        !          1556:                                        mbfl_convert_filter_copy(&bk.encoder, encoder);
        !          1557:                                }
        !          1558:                        }
        !          1559:                } else {
        !          1560:                        bk = _bk;
        !          1561:                }
        !          1562: 
        !          1563:                /* detect end position */
        !          1564:                while (p < q) {
        !          1565:                        (*encoder->filter_function)(*p, encoder);
        !          1566: 
        !          1567:                        if (device.pos > length) {
        !          1568:                                /* restore filter */
        !          1569:                                p = bk.p;
        !          1570:                                device.pos = bk.pos;
        !          1571:                                decoder->filter_dtor(decoder);
        !          1572:                                encoder->filter_dtor(encoder);
        !          1573:                                mbfl_convert_filter_copy(&bk.decoder, decoder);
        !          1574:                                mbfl_convert_filter_copy(&bk.encoder, encoder);
        !          1575:                                break;
        !          1576:                        }
        !          1577: 
        !          1578:                        p++;
        !          1579: 
        !          1580:                        /* backup current state */
        !          1581:                        mbfl_convert_filter_copy(decoder, &_bk.decoder);
        !          1582:                        mbfl_convert_filter_copy(encoder, &_bk.encoder);
        !          1583:                        _bk.pos = device.pos;
        !          1584:                        _bk.p = p;
        !          1585: 
        !          1586:                        (*encoder->filter_flush)(encoder);
        !          1587: 
        !          1588:                        if (device.pos > length) {
        !          1589:                                _bk.decoder.filter_dtor(&_bk.decoder);
        !          1590:                                _bk.encoder.filter_dtor(&_bk.encoder);
        !          1591: 
        !          1592:                                /* restore filter */
        !          1593:                                p = bk.p;
        !          1594:                                device.pos = bk.pos;
        !          1595:                                decoder->filter_dtor(decoder);
        !          1596:                                encoder->filter_dtor(encoder);
        !          1597:                                mbfl_convert_filter_copy(&bk.decoder, decoder);
        !          1598:                                mbfl_convert_filter_copy(&bk.encoder, encoder);
        !          1599:                                break;
        !          1600:                        }
        !          1601: 
        !          1602:                        bk.decoder.filter_dtor(&bk.decoder);
        !          1603:                        bk.encoder.filter_dtor(&bk.encoder);
        !          1604: 
        !          1605:                        p = _bk.p;
        !          1606:                        device.pos = _bk.pos;
        !          1607:                        decoder->filter_dtor(decoder);
        !          1608:                        encoder->filter_dtor(encoder);
        !          1609:                        mbfl_convert_filter_copy(&_bk.decoder, decoder);
        !          1610:                        mbfl_convert_filter_copy(&_bk.encoder, encoder);
        !          1611: 
        !          1612:                        bk = _bk;
        !          1613:                }
        !          1614: 
        !          1615:                (*encoder->filter_flush)(encoder);
        !          1616: 
        !          1617:                bk.decoder.filter_dtor(&bk.decoder);
        !          1618:                bk.encoder.filter_dtor(&bk.encoder);
        !          1619: 
        !          1620:                result = mbfl_memory_device_result(&device, result);
        !          1621: 
        !          1622:                mbfl_convert_filter_delete(encoder);
        !          1623:                mbfl_convert_filter_delete(decoder);
        !          1624:        }
        !          1625: 
        !          1626:        return result;
        !          1627: }
        !          1628: 
        !          1629: 
        !          1630: /*
        !          1631:  *  strwidth
        !          1632:  */
        !          1633: static int is_fullwidth(int c)
        !          1634: {
        !          1635:        int i;
        !          1636: 
        !          1637:        if (c < mbfl_eaw_table[0].begin) {
        !          1638:                return 0;
        !          1639:        }
        !          1640: 
        !          1641:        for (i = 0; i < sizeof(mbfl_eaw_table) / sizeof(mbfl_eaw_table[0]); i++) {
        !          1642:                if (mbfl_eaw_table[i].begin <= c && c <= mbfl_eaw_table[i].end) {
        !          1643:                        return 1;
        !          1644:                }
        !          1645:        }
        !          1646: 
        !          1647:        return 0;
        !          1648: }
        !          1649: 
        !          1650: static int
        !          1651: filter_count_width(int c, void* data)
        !          1652: {
        !          1653:        (*(int *)data) += (is_fullwidth(c) ? 2: 1);
        !          1654:        return c;
        !          1655: }
        !          1656: 
        !          1657: int
        !          1658: mbfl_strwidth(mbfl_string *string)
        !          1659: {
        !          1660:        int len, n;
        !          1661:        unsigned char *p;
        !          1662:        mbfl_convert_filter *filter;
        !          1663: 
        !          1664:        len = 0;
        !          1665:        if (string->len > 0 && string->val != NULL) {
        !          1666:                /* wchar filter */
        !          1667:                filter = mbfl_convert_filter_new(
        !          1668:                    string->no_encoding,
        !          1669:                    mbfl_no_encoding_wchar,
        !          1670:                    filter_count_width, 0, &len);
        !          1671:                if (filter == NULL) {
        !          1672:                        mbfl_convert_filter_delete(filter);
        !          1673:                        return -1;
        !          1674:                }
        !          1675: 
        !          1676:                /* feed data */
        !          1677:                p = string->val;
        !          1678:                n = string->len;
        !          1679:                while (n > 0) {
        !          1680:                        (*filter->filter_function)(*p++, filter);
        !          1681:                        n--;
        !          1682:                }
        !          1683: 
        !          1684:                mbfl_convert_filter_flush(filter);
        !          1685:                mbfl_convert_filter_delete(filter);
        !          1686:        }
        !          1687: 
        !          1688:        return len;
        !          1689: }
        !          1690: 
        !          1691: 
        !          1692: /*
        !          1693:  *  strimwidth
        !          1694:  */
        !          1695: struct collector_strimwidth_data {
        !          1696:        mbfl_convert_filter *decoder;
        !          1697:        mbfl_convert_filter *decoder_backup;
        !          1698:        mbfl_memory_device device;
        !          1699:        int from;
        !          1700:        int width;
        !          1701:        int outwidth;
        !          1702:        int outchar;
        !          1703:        int status;
        !          1704:        int endpos;
        !          1705: };
        !          1706: 
        !          1707: static int
        !          1708: collector_strimwidth(int c, void* data)
        !          1709: {
        !          1710:        struct collector_strimwidth_data *pc = (struct collector_strimwidth_data*)data;
        !          1711: 
        !          1712:        switch (pc->status) {
        !          1713:        case 10:
        !          1714:                (*pc->decoder->filter_function)(c, pc->decoder);
        !          1715:                break;
        !          1716:        default:
        !          1717:                if (pc->outchar >= pc->from) {
        !          1718:                        pc->outwidth += (is_fullwidth(c) ? 2: 1);
        !          1719: 
        !          1720:                        if (pc->outwidth > pc->width) {
        !          1721:                                if (pc->status == 0) {
        !          1722:                                        pc->endpos = pc->device.pos;
        !          1723:                                        mbfl_convert_filter_copy(pc->decoder, pc->decoder_backup);
        !          1724:                                }
        !          1725:                                pc->status++;
        !          1726:                                (*pc->decoder->filter_function)(c, pc->decoder);
        !          1727:                                c = -1;
        !          1728:                        } else {
        !          1729:                                (*pc->decoder->filter_function)(c, pc->decoder);
        !          1730:                        }
        !          1731:                }
        !          1732:                pc->outchar++;
        !          1733:                break;
        !          1734:        }
        !          1735: 
        !          1736:        return c;
        !          1737: }
        !          1738: 
        !          1739: mbfl_string *
        !          1740: mbfl_strimwidth(
        !          1741:     mbfl_string *string,
        !          1742:     mbfl_string *marker,
        !          1743:     mbfl_string *result,
        !          1744:     int from,
        !          1745:     int width)
        !          1746: {
        !          1747:        struct collector_strimwidth_data pc;
        !          1748:        mbfl_convert_filter *encoder;
        !          1749:        int n, mkwidth;
        !          1750:        unsigned char *p;
        !          1751: 
        !          1752:        if (string == NULL || result == NULL) {
        !          1753:                return NULL;
        !          1754:        }
        !          1755:        mbfl_string_init(result);
        !          1756:        result->no_language = string->no_language;
        !          1757:        result->no_encoding = string->no_encoding;
        !          1758:        mbfl_memory_device_init(&pc.device, width, 0);
        !          1759: 
        !          1760:        /* output code filter */
        !          1761:        pc.decoder = mbfl_convert_filter_new(
        !          1762:            mbfl_no_encoding_wchar,
        !          1763:            string->no_encoding,
        !          1764:            mbfl_memory_device_output, 0, &pc.device);
        !          1765:        pc.decoder_backup = mbfl_convert_filter_new(
        !          1766:            mbfl_no_encoding_wchar,
        !          1767:            string->no_encoding,
        !          1768:            mbfl_memory_device_output, 0, &pc.device);
        !          1769:        /* wchar filter */
        !          1770:        encoder = mbfl_convert_filter_new(
        !          1771:            string->no_encoding,
        !          1772:            mbfl_no_encoding_wchar,
        !          1773:            collector_strimwidth, 0, &pc);
        !          1774:        if (pc.decoder == NULL || pc.decoder_backup == NULL || encoder == NULL) {
        !          1775:                mbfl_convert_filter_delete(encoder);
        !          1776:                mbfl_convert_filter_delete(pc.decoder);
        !          1777:                mbfl_convert_filter_delete(pc.decoder_backup);
        !          1778:                return NULL;
        !          1779:        }
        !          1780:        mkwidth = 0;
        !          1781:        if (marker) {
        !          1782:                mkwidth = mbfl_strwidth(marker);
        !          1783:        }
        !          1784:        pc.from = from;
        !          1785:        pc.width = width - mkwidth;
        !          1786:        pc.outwidth = 0;
        !          1787:        pc.outchar = 0;
        !          1788:        pc.status = 0;
        !          1789:        pc.endpos = 0;
        !          1790: 
        !          1791:        /* feed data */
        !          1792:        p = string->val;
        !          1793:        n = string->len;
        !          1794:        if (p != NULL) {
        !          1795:                while (n > 0) {
        !          1796:                        n--;
        !          1797:                        if ((*encoder->filter_function)(*p++, encoder) < 0) {
        !          1798:                                break;
        !          1799:                        }
        !          1800:                }
        !          1801:                mbfl_convert_filter_flush(encoder);
        !          1802:                if (pc.status != 0 && mkwidth > 0) {
        !          1803:                        pc.width += mkwidth;
        !          1804:                        while (n > 0) {
        !          1805:                                if ((*encoder->filter_function)(*p++, encoder) < 0) {
        !          1806:                                        break;
        !          1807:                                }
        !          1808:                                n--;
        !          1809:                        }
        !          1810:                        mbfl_convert_filter_flush(encoder);
        !          1811:                        if (pc.status != 1) {
        !          1812:                                pc.status = 10;
        !          1813:                                pc.device.pos = pc.endpos;
        !          1814:                                mbfl_convert_filter_copy(pc.decoder_backup, pc.decoder);
        !          1815:                                mbfl_convert_filter_reset(encoder, marker->no_encoding, mbfl_no_encoding_wchar);
        !          1816:                                p = marker->val;
        !          1817:                                n = marker->len;
        !          1818:                                while (n > 0) {
        !          1819:                                        if ((*encoder->filter_function)(*p++, encoder) < 0) {
        !          1820:                                                break;
        !          1821:                                        }
        !          1822:                                        n--;
        !          1823:                                }
        !          1824:                                mbfl_convert_filter_flush(encoder);
        !          1825:                        }
        !          1826:                } else if (pc.status != 0) {
        !          1827:                        pc.device.pos = pc.endpos;
        !          1828:                        mbfl_convert_filter_copy(pc.decoder_backup, pc.decoder);
        !          1829:                }
        !          1830:                mbfl_convert_filter_flush(pc.decoder);
        !          1831:        }
        !          1832:        result = mbfl_memory_device_result(&pc.device, result);
        !          1833:        mbfl_convert_filter_delete(encoder);
        !          1834:        mbfl_convert_filter_delete(pc.decoder);
        !          1835:        mbfl_convert_filter_delete(pc.decoder_backup);
        !          1836: 
        !          1837:        return result;
        !          1838: }
        !          1839: 
        !          1840: mbfl_string *
        !          1841: mbfl_ja_jp_hantozen(
        !          1842:     mbfl_string *string,
        !          1843:     mbfl_string *result,
        !          1844:     int mode)
        !          1845: {
        !          1846:        int n;
        !          1847:        unsigned char *p;
        !          1848:        const mbfl_encoding *encoding;
        !          1849:        mbfl_memory_device device;
        !          1850:        mbfl_convert_filter *decoder = NULL;
        !          1851:        mbfl_convert_filter *encoder = NULL;
        !          1852:        mbfl_convert_filter *tl_filter = NULL;
        !          1853:        mbfl_convert_filter *next_filter = NULL;
        !          1854:        mbfl_filt_tl_jisx0201_jisx0208_param *param = NULL;
        !          1855: 
        !          1856:        /* validate parameters */
        !          1857:        if (string == NULL || result == NULL) {
        !          1858:                return NULL;
        !          1859:        }
        !          1860: 
        !          1861:        encoding = mbfl_no2encoding(string->no_encoding);
        !          1862:        if (encoding == NULL) {
        !          1863:                return NULL;
        !          1864:        }
        !          1865: 
        !          1866:        mbfl_memory_device_init(&device, string->len, 0);
        !          1867:        mbfl_string_init(result);
        !          1868: 
        !          1869:        result->no_language = string->no_language;
        !          1870:        result->no_encoding = string->no_encoding;
        !          1871: 
        !          1872:        decoder = mbfl_convert_filter_new(
        !          1873:                mbfl_no_encoding_wchar,
        !          1874:                string->no_encoding,
        !          1875:                mbfl_memory_device_output, 0, &device);
        !          1876:        if (decoder == NULL) {
        !          1877:                goto out;
        !          1878:        }
        !          1879:        next_filter = decoder;
        !          1880: 
        !          1881:        param =
        !          1882:                (mbfl_filt_tl_jisx0201_jisx0208_param *)mbfl_malloc(sizeof(mbfl_filt_tl_jisx0201_jisx0208_param));
        !          1883:        if (param == NULL) {
        !          1884:                goto out;
        !          1885:        }
        !          1886: 
        !          1887:        param->mode = mode;
        !          1888: 
        !          1889:        tl_filter = mbfl_convert_filter_new2(
        !          1890:                &vtbl_tl_jisx0201_jisx0208,
        !          1891:                (int(*)(int, void*))next_filter->filter_function,
        !          1892:                (int(*)(void*))next_filter->filter_flush,
        !          1893:                next_filter);
        !          1894:        if (tl_filter == NULL) {
        !          1895:                mbfl_free(param);
        !          1896:                goto out;
        !          1897:        }
        !          1898: 
        !          1899:        tl_filter->opaque = param;
        !          1900:        next_filter = tl_filter;
        !          1901: 
        !          1902:        encoder = mbfl_convert_filter_new(
        !          1903:                string->no_encoding,
        !          1904:                mbfl_no_encoding_wchar,
        !          1905:                (int(*)(int, void*))next_filter->filter_function,
        !          1906:                (int(*)(void*))next_filter->filter_flush,
        !          1907:                next_filter);   
        !          1908:        if (encoder == NULL) {
        !          1909:                goto out;
        !          1910:        }
        !          1911: 
        !          1912:        /* feed data */
        !          1913:        p = string->val;
        !          1914:        n = string->len;
        !          1915:        if (p != NULL) {
        !          1916:                while (n > 0) {
        !          1917:                        if ((*encoder->filter_function)(*p++, encoder) < 0) {
        !          1918:                                break;
        !          1919:                        }
        !          1920:                        n--;
        !          1921:                }
        !          1922:        }
        !          1923: 
        !          1924:        mbfl_convert_filter_flush(encoder);
        !          1925:        result = mbfl_memory_device_result(&device, result);
        !          1926: out:
        !          1927:        if (tl_filter != NULL) {
        !          1928:                if (tl_filter->opaque != NULL) {
        !          1929:                        mbfl_free(tl_filter->opaque);
        !          1930:                }
        !          1931:                mbfl_convert_filter_delete(tl_filter);
        !          1932:        }
        !          1933: 
        !          1934:        if (decoder != NULL) {
        !          1935:                mbfl_convert_filter_delete(decoder);
        !          1936:        }
        !          1937: 
        !          1938:        if (encoder != NULL) {
        !          1939:                mbfl_convert_filter_delete(encoder);
        !          1940:        }
        !          1941: 
        !          1942:        return result;
        !          1943: }
        !          1944: 
        !          1945: 
        !          1946: /*
        !          1947:  *  MIME header encode
        !          1948:  */
        !          1949: struct mime_header_encoder_data {
        !          1950:        mbfl_convert_filter *conv1_filter;
        !          1951:        mbfl_convert_filter *block_filter;
        !          1952:        mbfl_convert_filter *conv2_filter;
        !          1953:        mbfl_convert_filter *conv2_filter_backup;
        !          1954:        mbfl_convert_filter *encod_filter;
        !          1955:        mbfl_convert_filter *encod_filter_backup;
        !          1956:        mbfl_memory_device outdev;
        !          1957:        mbfl_memory_device tmpdev;
        !          1958:        int status1;
        !          1959:        int status2;
        !          1960:        int prevpos;
        !          1961:        int linehead;
        !          1962:        int firstindent;
        !          1963:        int encnamelen;
        !          1964:        int lwsplen;
        !          1965:        char encname[128];
        !          1966:        char lwsp[16];
        !          1967: };
        !          1968: 
        !          1969: static int
        !          1970: mime_header_encoder_block_collector(int c, void *data)
        !          1971: {
        !          1972:        int n;
        !          1973:        struct mime_header_encoder_data *pe = (struct mime_header_encoder_data *)data;
        !          1974: 
        !          1975:        switch (pe->status2) {
        !          1976:        case 1: /* encoded word */
        !          1977:                pe->prevpos = pe->outdev.pos;
        !          1978:                mbfl_convert_filter_copy(pe->conv2_filter, pe->conv2_filter_backup);
        !          1979:                mbfl_convert_filter_copy(pe->encod_filter, pe->encod_filter_backup);
        !          1980:                (*pe->conv2_filter->filter_function)(c, pe->conv2_filter);
        !          1981:                (*pe->conv2_filter->filter_flush)(pe->conv2_filter);
        !          1982:                (*pe->encod_filter->filter_flush)(pe->encod_filter);
        !          1983:                n = pe->outdev.pos - pe->linehead + pe->firstindent;
        !          1984:                pe->outdev.pos = pe->prevpos;
        !          1985:                mbfl_convert_filter_copy(pe->conv2_filter_backup, pe->conv2_filter);
        !          1986:                mbfl_convert_filter_copy(pe->encod_filter_backup, pe->encod_filter);
        !          1987:                if (n >= 74) {
        !          1988:                        (*pe->conv2_filter->filter_flush)(pe->conv2_filter);
        !          1989:                        (*pe->encod_filter->filter_flush)(pe->encod_filter);
        !          1990:                        mbfl_memory_device_strncat(&pe->outdev, "\x3f\x3d", 2); /* ?= */
        !          1991:                        mbfl_memory_device_strncat(&pe->outdev, pe->lwsp, pe->lwsplen);
        !          1992:                        pe->linehead = pe->outdev.pos;
        !          1993:                        pe->firstindent = 0;
        !          1994:                        mbfl_memory_device_strncat(&pe->outdev, pe->encname, pe->encnamelen);
        !          1995:                        c = (*pe->conv2_filter->filter_function)(c, pe->conv2_filter);
        !          1996:                } else {
        !          1997:                        c = (*pe->conv2_filter->filter_function)(c, pe->conv2_filter);
        !          1998:                }
        !          1999:                break;
        !          2000: 
        !          2001:        default:
        !          2002:                mbfl_memory_device_strncat(&pe->outdev, pe->encname, pe->encnamelen);
        !          2003:                c = (*pe->conv2_filter->filter_function)(c, pe->conv2_filter);
        !          2004:                pe->status2 = 1;
        !          2005:                break;
        !          2006:        }
        !          2007: 
        !          2008:        return c;
        !          2009: }
        !          2010: 
        !          2011: static int
        !          2012: mime_header_encoder_collector(int c, void *data)
        !          2013: {
        !          2014:        static int qp_table[256] = {
        !          2015:                1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, /* 0x00 */
        !          2016:                1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, /* 0x00 */
        !          2017:                1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, /* 0x20 */
        !          2018:                0, 0, 0, 0, 0, 0, 0 ,0, 0, 0, 0, 0, 0, 1, 0, 1, /* 0x10 */
        !          2019:                0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, /* 0x40 */
        !          2020:                0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, /* 0x50 */
        !          2021:                0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, /* 0x60 */
        !          2022:                0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, /* 0x70 */
        !          2023:                1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, /* 0x80 */
        !          2024:                1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, /* 0x90 */
        !          2025:                1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, /* 0xA0 */
        !          2026:                1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, /* 0xB0 */
        !          2027:                1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, /* 0xC0 */
        !          2028:                1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, /* 0xD0 */
        !          2029:                1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, /* 0xE0 */
        !          2030:                1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1  /* 0xF0 */
        !          2031:        };
        !          2032: 
        !          2033:        int n;
        !          2034:        struct mime_header_encoder_data *pe = (struct mime_header_encoder_data *)data;
        !          2035: 
        !          2036:        switch (pe->status1) {
        !          2037:        case 11:        /* encoded word */
        !          2038:                (*pe->block_filter->filter_function)(c, pe->block_filter);
        !          2039:                break;
        !          2040: 
        !          2041:        default:        /* ASCII */
        !          2042:                if (c <= 0x00ff && !qp_table[(c & 0xff)]) { /* ordinary characters */
        !          2043:                        mbfl_memory_device_output(c, &pe->tmpdev);
        !          2044:                        pe->status1 = 1;
        !          2045:                } else if (pe->status1 == 0 && c == 0x20) {     /* repeat SPACE */
        !          2046:                        mbfl_memory_device_output(c, &pe->tmpdev);
        !          2047:                } else {
        !          2048:                        if (pe->tmpdev.pos < 74 && c == 0x20) {
        !          2049:                                n = pe->outdev.pos - pe->linehead + pe->tmpdev.pos + pe->firstindent;
        !          2050:                                if (n > 74) {
        !          2051:                                        mbfl_memory_device_strncat(&pe->outdev, pe->lwsp, pe->lwsplen);         /* LWSP */
        !          2052:                                        pe->linehead = pe->outdev.pos;
        !          2053:                                        pe->firstindent = 0;
        !          2054:                                } else if (pe->outdev.pos > 0) {
        !          2055:                                        mbfl_memory_device_output(0x20, &pe->outdev);
        !          2056:                                }
        !          2057:                                mbfl_memory_device_devcat(&pe->outdev, &pe->tmpdev);
        !          2058:                                mbfl_memory_device_reset(&pe->tmpdev);
        !          2059:                                pe->status1 = 0;
        !          2060:                        } else {
        !          2061:                                n = pe->outdev.pos - pe->linehead + pe->encnamelen + pe->firstindent;
        !          2062:                                if (n > 60)  {
        !          2063:                                        mbfl_memory_device_strncat(&pe->outdev, pe->lwsp, pe->lwsplen);         /* LWSP */
        !          2064:                                        pe->linehead = pe->outdev.pos;
        !          2065:                                        pe->firstindent = 0;
        !          2066:                                } else if (pe->outdev.pos > 0)  {
        !          2067:                                        mbfl_memory_device_output(0x20, &pe->outdev);
        !          2068:                                }
        !          2069:                                mbfl_convert_filter_devcat(pe->block_filter, &pe->tmpdev);
        !          2070:                                mbfl_memory_device_reset(&pe->tmpdev);
        !          2071:                                (*pe->block_filter->filter_function)(c, pe->block_filter);
        !          2072:                                pe->status1 = 11;
        !          2073:                        }
        !          2074:                }
        !          2075:                break;
        !          2076:        }
        !          2077: 
        !          2078:        return c;
        !          2079: }
        !          2080: 
        !          2081: mbfl_string *
        !          2082: mime_header_encoder_result(struct mime_header_encoder_data *pe, mbfl_string *result)
        !          2083: {
        !          2084:        if (pe->status1 >= 10) {
        !          2085:                (*pe->conv2_filter->filter_flush)(pe->conv2_filter);
        !          2086:                (*pe->encod_filter->filter_flush)(pe->encod_filter);
        !          2087:                mbfl_memory_device_strncat(&pe->outdev, "\x3f\x3d", 2);         /* ?= */
        !          2088:        } else if (pe->tmpdev.pos > 0) {
        !          2089:                if (pe->outdev.pos > 0) {
        !          2090:                        if ((pe->outdev.pos - pe->linehead + pe->tmpdev.pos) > 74) {
        !          2091:                                mbfl_memory_device_strncat(&pe->outdev, pe->lwsp, pe->lwsplen);
        !          2092:                        } else {
        !          2093:                                mbfl_memory_device_output(0x20, &pe->outdev);
        !          2094:                        }
        !          2095:                }
        !          2096:                mbfl_memory_device_devcat(&pe->outdev, &pe->tmpdev);
        !          2097:        }
        !          2098:        mbfl_memory_device_reset(&pe->tmpdev);
        !          2099:        pe->prevpos = 0;
        !          2100:        pe->linehead = 0;
        !          2101:        pe->status1 = 0;
        !          2102:        pe->status2 = 0;
        !          2103: 
        !          2104:        return mbfl_memory_device_result(&pe->outdev, result);
        !          2105: }
        !          2106: 
        !          2107: struct mime_header_encoder_data*
        !          2108: mime_header_encoder_new(
        !          2109:     enum mbfl_no_encoding incode,
        !          2110:     enum mbfl_no_encoding outcode,
        !          2111:     enum mbfl_no_encoding transenc)
        !          2112: {
        !          2113:        int n;
        !          2114:        const char *s;
        !          2115:        const mbfl_encoding *outencoding;
        !          2116:        struct mime_header_encoder_data *pe;
        !          2117: 
        !          2118:        /* get output encoding and check MIME charset name */
        !          2119:        outencoding = mbfl_no2encoding(outcode);
        !          2120:        if (outencoding == NULL || outencoding->mime_name == NULL || outencoding->mime_name[0] == '\0') {
        !          2121:                return NULL;
        !          2122:        }
        !          2123: 
        !          2124:        pe = (struct mime_header_encoder_data*)mbfl_malloc(sizeof(struct mime_header_encoder_data));
        !          2125:        if (pe == NULL) {
        !          2126:                return NULL;
        !          2127:        }
        !          2128: 
        !          2129:        mbfl_memory_device_init(&pe->outdev, 0, 0);
        !          2130:        mbfl_memory_device_init(&pe->tmpdev, 0, 0);
        !          2131:        pe->prevpos = 0;
        !          2132:        pe->linehead = 0;
        !          2133:        pe->firstindent = 0;
        !          2134:        pe->status1 = 0;
        !          2135:        pe->status2 = 0;
        !          2136: 
        !          2137:        /* make the encoding description string  exp. "=?ISO-2022-JP?B?" */
        !          2138:        n = 0;
        !          2139:        pe->encname[n++] = 0x3d;
        !          2140:        pe->encname[n++] = 0x3f;
        !          2141:        s = outencoding->mime_name;
        !          2142:        while (*s) {
        !          2143:                pe->encname[n++] = *s++;
        !          2144:        }
        !          2145:        pe->encname[n++] = 0x3f;
        !          2146:        if (transenc == mbfl_no_encoding_qprint) {
        !          2147:                pe->encname[n++] = 0x51;
        !          2148:        } else {
        !          2149:                pe->encname[n++] = 0x42;
        !          2150:                transenc = mbfl_no_encoding_base64;
        !          2151:        }
        !          2152:        pe->encname[n++] = 0x3f;
        !          2153:        pe->encname[n] = '\0';
        !          2154:        pe->encnamelen = n;
        !          2155: 
        !          2156:        n = 0;
        !          2157:        pe->lwsp[n++] = 0x0d;
        !          2158:        pe->lwsp[n++] = 0x0a;
        !          2159:        pe->lwsp[n++] = 0x20;
        !          2160:        pe->lwsp[n] = '\0';
        !          2161:        pe->lwsplen = n;
        !          2162: 
        !          2163:        /* transfer encode filter */
        !          2164:        pe->encod_filter = mbfl_convert_filter_new(outcode, transenc, mbfl_memory_device_output, 0, &(pe->outdev));
        !          2165:        pe->encod_filter_backup = mbfl_convert_filter_new(outcode, transenc, mbfl_memory_device_output, 0, &(pe->outdev));
        !          2166: 
        !          2167:        /* Output code filter */
        !          2168:        pe->conv2_filter = mbfl_convert_filter_new(mbfl_no_encoding_wchar, outcode, mbfl_filter_output_pipe, 0, pe->encod_filter);
        !          2169:        pe->conv2_filter_backup = mbfl_convert_filter_new(mbfl_no_encoding_wchar, outcode, mbfl_filter_output_pipe, 0, pe->encod_filter);
        !          2170: 
        !          2171:        /* encoded block filter */
        !          2172:        pe->block_filter = mbfl_convert_filter_new(mbfl_no_encoding_wchar, mbfl_no_encoding_wchar, mime_header_encoder_block_collector, 0, pe);
        !          2173: 
        !          2174:        /* Input code filter */
        !          2175:        pe->conv1_filter = mbfl_convert_filter_new(incode, mbfl_no_encoding_wchar, mime_header_encoder_collector, 0, pe);
        !          2176: 
        !          2177:        if (pe->encod_filter == NULL ||
        !          2178:            pe->encod_filter_backup == NULL ||
        !          2179:            pe->conv2_filter == NULL ||
        !          2180:            pe->conv2_filter_backup == NULL ||
        !          2181:            pe->conv1_filter == NULL) {
        !          2182:                mime_header_encoder_delete(pe);
        !          2183:                return NULL;
        !          2184:        }
        !          2185: 
        !          2186:        if (transenc == mbfl_no_encoding_qprint) {
        !          2187:                pe->encod_filter->status |= MBFL_QPRINT_STS_MIME_HEADER;
        !          2188:                pe->encod_filter_backup->status |= MBFL_QPRINT_STS_MIME_HEADER;
        !          2189:        } else {
        !          2190:                pe->encod_filter->status |= MBFL_BASE64_STS_MIME_HEADER;
        !          2191:                pe->encod_filter_backup->status |= MBFL_BASE64_STS_MIME_HEADER;
        !          2192:        }
        !          2193: 
        !          2194:        return pe;
        !          2195: }
        !          2196: 
        !          2197: void
        !          2198: mime_header_encoder_delete(struct mime_header_encoder_data *pe)
        !          2199: {
        !          2200:        if (pe) {
        !          2201:                mbfl_convert_filter_delete(pe->conv1_filter);
        !          2202:                mbfl_convert_filter_delete(pe->block_filter);
        !          2203:                mbfl_convert_filter_delete(pe->conv2_filter);
        !          2204:                mbfl_convert_filter_delete(pe->conv2_filter_backup);
        !          2205:                mbfl_convert_filter_delete(pe->encod_filter);
        !          2206:                mbfl_convert_filter_delete(pe->encod_filter_backup);
        !          2207:                mbfl_memory_device_clear(&pe->outdev);
        !          2208:                mbfl_memory_device_clear(&pe->tmpdev);
        !          2209:                mbfl_free((void*)pe);
        !          2210:        }
        !          2211: }
        !          2212: 
        !          2213: int
        !          2214: mime_header_encoder_feed(int c, struct mime_header_encoder_data *pe)
        !          2215: {
        !          2216:        return (*pe->conv1_filter->filter_function)(c, pe->conv1_filter);
        !          2217: }
        !          2218: 
        !          2219: mbfl_string *
        !          2220: mbfl_mime_header_encode(
        !          2221:     mbfl_string *string,
        !          2222:     mbfl_string *result,
        !          2223:     enum mbfl_no_encoding outcode,
        !          2224:     enum mbfl_no_encoding encoding,
        !          2225:     const char *linefeed,
        !          2226:     int indent)
        !          2227: {
        !          2228:        int n;
        !          2229:        unsigned char *p;
        !          2230:        struct mime_header_encoder_data *pe;
        !          2231: 
        !          2232:        mbfl_string_init(result);
        !          2233:        result->no_language = string->no_language;
        !          2234:        result->no_encoding = mbfl_no_encoding_ascii;
        !          2235: 
        !          2236:        pe = mime_header_encoder_new(string->no_encoding, outcode, encoding);
        !          2237:        if (pe == NULL) {
        !          2238:                return NULL;
        !          2239:        }
        !          2240: 
        !          2241:        if (linefeed != NULL) {
        !          2242:                n = 0;
        !          2243:                while (*linefeed && n < 8) {
        !          2244:                        pe->lwsp[n++] = *linefeed++;
        !          2245:                }
        !          2246:                pe->lwsp[n++] = 0x20;
        !          2247:                pe->lwsp[n] = '\0';
        !          2248:                pe->lwsplen = n;
        !          2249:        }
        !          2250:        if (indent > 0 && indent < 74) {
        !          2251:                pe->firstindent = indent;
        !          2252:        }
        !          2253: 
        !          2254:        n = string->len;
        !          2255:        p = string->val;
        !          2256:        while (n > 0) {
        !          2257:                (*pe->conv1_filter->filter_function)(*p++, pe->conv1_filter);
        !          2258:                n--;
        !          2259:        }
        !          2260: 
        !          2261:        result = mime_header_encoder_result(pe, result);
        !          2262:        mime_header_encoder_delete(pe);
        !          2263: 
        !          2264:        return result;
        !          2265: }
        !          2266: 
        !          2267: 
        !          2268: /*
        !          2269:  *  MIME header decode
        !          2270:  */
        !          2271: struct mime_header_decoder_data {
        !          2272:        mbfl_convert_filter *deco_filter;
        !          2273:        mbfl_convert_filter *conv1_filter;
        !          2274:        mbfl_convert_filter *conv2_filter;
        !          2275:        mbfl_memory_device outdev;
        !          2276:        mbfl_memory_device tmpdev;
        !          2277:        int cspos;
        !          2278:        int status;
        !          2279:        enum mbfl_no_encoding encoding;
        !          2280:        enum mbfl_no_encoding incode;
        !          2281:        enum mbfl_no_encoding outcode;
        !          2282: };
        !          2283: 
        !          2284: static int
        !          2285: mime_header_decoder_collector(int c, void* data)
        !          2286: {
        !          2287:        const mbfl_encoding *encoding;
        !          2288:        struct mime_header_decoder_data *pd = (struct mime_header_decoder_data*)data;
        !          2289: 
        !          2290:        switch (pd->status) {
        !          2291:        case 1:
        !          2292:                if (c == 0x3f) {                /* ? */
        !          2293:                        mbfl_memory_device_output(c, &pd->tmpdev);
        !          2294:                        pd->cspos = pd->tmpdev.pos;
        !          2295:                        pd->status = 2;
        !          2296:                } else {
        !          2297:                        mbfl_convert_filter_devcat(pd->conv1_filter, &pd->tmpdev);
        !          2298:                        mbfl_memory_device_reset(&pd->tmpdev);
        !          2299:                        if (c == 0x3d) {                /* = */
        !          2300:                                mbfl_memory_device_output(c, &pd->tmpdev);
        !          2301:                        } else if (c == 0x0d || c == 0x0a) {    /* CR or LF */
        !          2302:                                pd->status = 9;
        !          2303:                        } else {
        !          2304:                                (*pd->conv1_filter->filter_function)(c, pd->conv1_filter);
        !          2305:                                pd->status = 0;
        !          2306:                        }
        !          2307:                }
        !          2308:                break;
        !          2309:        case 2:         /* store charset string */
        !          2310:                if (c == 0x3f) {                /* ? */
        !          2311:                        /* identify charset */
        !          2312:                        mbfl_memory_device_output('\0', &pd->tmpdev);
        !          2313:                        encoding = mbfl_name2encoding((const char *)&pd->tmpdev.buffer[pd->cspos]);
        !          2314:                        if (encoding != NULL) {
        !          2315:                                pd->incode = encoding->no_encoding;
        !          2316:                                pd->status = 3;
        !          2317:                        }
        !          2318:                        mbfl_memory_device_unput(&pd->tmpdev);
        !          2319:                        mbfl_memory_device_output(c, &pd->tmpdev);
        !          2320:                } else {
        !          2321:                        mbfl_memory_device_output(c, &pd->tmpdev);
        !          2322:                        if (pd->tmpdev.pos > 100) {             /* too long charset string */
        !          2323:                                pd->status = 0;
        !          2324:                        } else if (c == 0x0d || c == 0x0a) {    /* CR or LF */
        !          2325:                                mbfl_memory_device_unput(&pd->tmpdev);
        !          2326:                                pd->status = 9;
        !          2327:                        }
        !          2328:                        if (pd->status != 2) {
        !          2329:                                mbfl_convert_filter_devcat(pd->conv1_filter, &pd->tmpdev);
        !          2330:                                mbfl_memory_device_reset(&pd->tmpdev);
        !          2331:                        }
        !          2332:                }
        !          2333:                break;
        !          2334:        case 3:         /* identify encoding */
        !          2335:                mbfl_memory_device_output(c, &pd->tmpdev);
        !          2336:                if (c == 0x42 || c == 0x62) {           /* 'B' or 'b' */
        !          2337:                        pd->encoding = mbfl_no_encoding_base64;
        !          2338:                        pd->status = 4;
        !          2339:                } else if (c == 0x51 || c == 0x71) {    /* 'Q' or 'q' */
        !          2340:                        pd->encoding = mbfl_no_encoding_qprint;
        !          2341:                        pd->status = 4;
        !          2342:                } else {
        !          2343:                        if (c == 0x0d || c == 0x0a) {   /* CR or LF */
        !          2344:                                mbfl_memory_device_unput(&pd->tmpdev);
        !          2345:                                pd->status = 9;
        !          2346:                        } else {
        !          2347:                                pd->status = 0;
        !          2348:                        }
        !          2349:                        mbfl_convert_filter_devcat(pd->conv1_filter, &pd->tmpdev);
        !          2350:                        mbfl_memory_device_reset(&pd->tmpdev);
        !          2351:                }
        !          2352:                break;
        !          2353:        case 4:         /* reset filter */
        !          2354:                mbfl_memory_device_output(c, &pd->tmpdev);
        !          2355:                if (c == 0x3f) {                /* ? */
        !          2356:                        /* charset convert filter */
        !          2357:                        mbfl_convert_filter_reset(pd->conv1_filter, pd->incode, mbfl_no_encoding_wchar);
        !          2358:                        /* decode filter */
        !          2359:                        mbfl_convert_filter_reset(pd->deco_filter, pd->encoding, mbfl_no_encoding_8bit);
        !          2360:                        pd->status = 5;
        !          2361:                } else {
        !          2362:                        if (c == 0x0d || c == 0x0a) {   /* CR or LF */
        !          2363:                                mbfl_memory_device_unput(&pd->tmpdev);
        !          2364:                                pd->status = 9;
        !          2365:                        } else {
        !          2366:                                pd->status = 0;
        !          2367:                        }
        !          2368:                        mbfl_convert_filter_devcat(pd->conv1_filter, &pd->tmpdev);
        !          2369:                }
        !          2370:                mbfl_memory_device_reset(&pd->tmpdev);
        !          2371:                break;
        !          2372:        case 5:         /* encoded block */
        !          2373:                if (c == 0x3f) {                /* ? */
        !          2374:                        pd->status = 6;
        !          2375:                } else {
        !          2376:                        (*pd->deco_filter->filter_function)(c, pd->deco_filter);
        !          2377:                }
        !          2378:                break;
        !          2379:        case 6:         /* check end position */
        !          2380:                if (c == 0x3d) {                /* = */
        !          2381:                        /* flush and reset filter */
        !          2382:                        (*pd->deco_filter->filter_flush)(pd->deco_filter);
        !          2383:                        (*pd->conv1_filter->filter_flush)(pd->conv1_filter);
        !          2384:                        mbfl_convert_filter_reset(pd->conv1_filter, mbfl_no_encoding_ascii, mbfl_no_encoding_wchar);
        !          2385:                        pd->status = 7;
        !          2386:                } else {
        !          2387:                        (*pd->deco_filter->filter_function)(0x3f, pd->deco_filter);
        !          2388:                        if (c != 0x3f) {                /* ? */
        !          2389:                                (*pd->deco_filter->filter_function)(c, pd->deco_filter);
        !          2390:                                pd->status = 5;
        !          2391:                        }
        !          2392:                }
        !          2393:                break;
        !          2394:        case 7:         /* after encoded block */
        !          2395:                if (c == 0x0d || c == 0x0a) {   /* CR LF */
        !          2396:                        pd->status = 8;
        !          2397:                } else {
        !          2398:                        mbfl_memory_device_output(c, &pd->tmpdev);
        !          2399:                        if (c == 0x3d) {                /* = */
        !          2400:                                pd->status = 1;
        !          2401:                        } else if (c != 0x20 && c != 0x09) {            /* not space */
        !          2402:                                mbfl_convert_filter_devcat(pd->conv1_filter, &pd->tmpdev);
        !          2403:                                mbfl_memory_device_reset(&pd->tmpdev);
        !          2404:                                pd->status = 0;
        !          2405:                        }
        !          2406:                }
        !          2407:                break;
        !          2408:        case 8:         /* folding */
        !          2409:        case 9:         /* folding */
        !          2410:                if (c != 0x0d && c != 0x0a && c != 0x20 && c != 0x09) {
        !          2411:                        if (c == 0x3d) {                /* = */
        !          2412:                                if (pd->status == 8) {
        !          2413:                                        mbfl_memory_device_output(0x20, &pd->tmpdev);   /* SPACE */
        !          2414:                                } else {
        !          2415:                                        (*pd->conv1_filter->filter_function)(0x20, pd->conv1_filter);
        !          2416:                                }
        !          2417:                                mbfl_memory_device_output(c, &pd->tmpdev);
        !          2418:                                pd->status = 1;
        !          2419:                        } else {
        !          2420:                                mbfl_memory_device_output(0x20, &pd->tmpdev);
        !          2421:                                mbfl_memory_device_output(c, &pd->tmpdev);
        !          2422:                                mbfl_convert_filter_devcat(pd->conv1_filter, &pd->tmpdev);
        !          2423:                                mbfl_memory_device_reset(&pd->tmpdev);
        !          2424:                                pd->status = 0;
        !          2425:                        }
        !          2426:                }
        !          2427:                break;
        !          2428:        default:                /* non encoded block */
        !          2429:                if (c == 0x0d || c == 0x0a) {   /* CR LF */
        !          2430:                        pd->status = 9;
        !          2431:                } else if (c == 0x3d) {         /* = */
        !          2432:                        mbfl_memory_device_output(c, &pd->tmpdev);
        !          2433:                        pd->status = 1;
        !          2434:                } else {
        !          2435:                        (*pd->conv1_filter->filter_function)(c, pd->conv1_filter);
        !          2436:                }
        !          2437:                break;
        !          2438:        }
        !          2439: 
        !          2440:        return c;
        !          2441: }
        !          2442: 
        !          2443: mbfl_string *
        !          2444: mime_header_decoder_result(struct mime_header_decoder_data *pd, mbfl_string *result)
        !          2445: {
        !          2446:        switch (pd->status) {
        !          2447:        case 1:
        !          2448:        case 2:
        !          2449:        case 3:
        !          2450:        case 4:
        !          2451:        case 7:
        !          2452:        case 8:
        !          2453:        case 9:
        !          2454:                mbfl_convert_filter_devcat(pd->conv1_filter, &pd->tmpdev);
        !          2455:                break;
        !          2456:        case 5:
        !          2457:        case 6:
        !          2458:                (*pd->deco_filter->filter_flush)(pd->deco_filter);
        !          2459:                (*pd->conv1_filter->filter_flush)(pd->conv1_filter);
        !          2460:                break;
        !          2461:        }
        !          2462:        (*pd->conv2_filter->filter_flush)(pd->conv2_filter);
        !          2463:        mbfl_memory_device_reset(&pd->tmpdev);
        !          2464:        pd->status = 0;
        !          2465: 
        !          2466:        return mbfl_memory_device_result(&pd->outdev, result);
        !          2467: }
        !          2468: 
        !          2469: struct mime_header_decoder_data*
        !          2470: mime_header_decoder_new(enum mbfl_no_encoding outcode)
        !          2471: {
        !          2472:        struct mime_header_decoder_data *pd;
        !          2473: 
        !          2474:        pd = (struct mime_header_decoder_data*)mbfl_malloc(sizeof(struct mime_header_decoder_data));
        !          2475:        if (pd == NULL) {
        !          2476:                return NULL;
        !          2477:        }
        !          2478: 
        !          2479:        mbfl_memory_device_init(&pd->outdev, 0, 0);
        !          2480:        mbfl_memory_device_init(&pd->tmpdev, 0, 0);
        !          2481:        pd->cspos = 0;
        !          2482:        pd->status = 0;
        !          2483:        pd->encoding = mbfl_no_encoding_pass;
        !          2484:        pd->incode = mbfl_no_encoding_ascii;
        !          2485:        pd->outcode = outcode;
        !          2486:        /* charset convert filter */
        !          2487:        pd->conv2_filter = mbfl_convert_filter_new(mbfl_no_encoding_wchar, pd->outcode, mbfl_memory_device_output, 0, &pd->outdev);
        !          2488:        pd->conv1_filter = mbfl_convert_filter_new(pd->incode, mbfl_no_encoding_wchar, mbfl_filter_output_pipe, 0, pd->conv2_filter);
        !          2489:        /* decode filter */
        !          2490:        pd->deco_filter = mbfl_convert_filter_new(pd->encoding, mbfl_no_encoding_8bit, mbfl_filter_output_pipe, 0, pd->conv1_filter);
        !          2491: 
        !          2492:        if (pd->conv1_filter == NULL || pd->conv2_filter == NULL || pd->deco_filter == NULL) {
        !          2493:                mime_header_decoder_delete(pd);
        !          2494:                return NULL;
        !          2495:        }
        !          2496: 
        !          2497:        return pd;
        !          2498: }
        !          2499: 
        !          2500: void
        !          2501: mime_header_decoder_delete(struct mime_header_decoder_data *pd)
        !          2502: {
        !          2503:        if (pd) {
        !          2504:                mbfl_convert_filter_delete(pd->conv2_filter);
        !          2505:                mbfl_convert_filter_delete(pd->conv1_filter);
        !          2506:                mbfl_convert_filter_delete(pd->deco_filter);
        !          2507:                mbfl_memory_device_clear(&pd->outdev);
        !          2508:                mbfl_memory_device_clear(&pd->tmpdev);
        !          2509:                mbfl_free((void*)pd);
        !          2510:        }
        !          2511: }
        !          2512: 
        !          2513: int
        !          2514: mime_header_decoder_feed(int c, struct mime_header_decoder_data *pd)
        !          2515: {
        !          2516:        return mime_header_decoder_collector(c, pd);
        !          2517: }
        !          2518: 
        !          2519: mbfl_string *
        !          2520: mbfl_mime_header_decode(
        !          2521:     mbfl_string *string,
        !          2522:     mbfl_string *result,
        !          2523:     enum mbfl_no_encoding outcode)
        !          2524: {
        !          2525:        int n;
        !          2526:        unsigned char *p;
        !          2527:        struct mime_header_decoder_data *pd;
        !          2528: 
        !          2529:        mbfl_string_init(result);
        !          2530:        result->no_language = string->no_language;
        !          2531:        result->no_encoding = outcode;
        !          2532: 
        !          2533:        pd = mime_header_decoder_new(outcode);
        !          2534:        if (pd == NULL) {
        !          2535:                return NULL;
        !          2536:        }
        !          2537: 
        !          2538:        /* feed data */
        !          2539:        n = string->len;
        !          2540:        p = string->val;
        !          2541:        while (n > 0) {
        !          2542:                mime_header_decoder_collector(*p++, pd);
        !          2543:                n--;
        !          2544:        }
        !          2545: 
        !          2546:        result = mime_header_decoder_result(pd, result);
        !          2547:        mime_header_decoder_delete(pd);
        !          2548: 
        !          2549:        return result;
        !          2550: }
        !          2551: 
        !          2552: 
        !          2553: 
        !          2554: /*
        !          2555:  *  convert HTML numeric entity
        !          2556:  */
        !          2557: struct collector_htmlnumericentity_data {
        !          2558:        mbfl_convert_filter *decoder;
        !          2559:        int status;
        !          2560:        int cache;
        !          2561:        int digit;
        !          2562:        int *convmap;
        !          2563:        int mapsize;
        !          2564: };
        !          2565: 
        !          2566: static int
        !          2567: collector_encode_htmlnumericentity(int c, void *data)
        !          2568: {
        !          2569:        struct collector_htmlnumericentity_data *pc = (struct collector_htmlnumericentity_data *)data;
        !          2570:        int f, n, s, r, d, size, *mapelm;
        !          2571: 
        !          2572:        size = pc->mapsize;
        !          2573:        f = 0;
        !          2574:        n = 0;
        !          2575:        while (n < size) {
        !          2576:                mapelm = &(pc->convmap[n*4]);
        !          2577:                if (c >= mapelm[0] && c <= mapelm[1]) {
        !          2578:                        s = (c + mapelm[2]) & mapelm[3];
        !          2579:                        if (s >= 0) {
        !          2580:                                (*pc->decoder->filter_function)(0x26, pc->decoder);     /* '&' */
        !          2581:                                (*pc->decoder->filter_function)(0x23, pc->decoder);     /* '#' */
        !          2582:                                r = 100000000;
        !          2583:                                s %= r;
        !          2584:                                while (r > 0) {
        !          2585:                                        d = s/r;
        !          2586:                                        if (d || f) {
        !          2587:                                                f = 1;
        !          2588:                                                s %= r;
        !          2589:                                                (*pc->decoder->filter_function)(mbfl_hexchar_table[d], pc->decoder);
        !          2590:                                        }
        !          2591:                                        r /= 10;
        !          2592:                                }
        !          2593:                                if (!f) {
        !          2594:                                        f = 1;
        !          2595:                                        (*pc->decoder->filter_function)(mbfl_hexchar_table[0], pc->decoder);
        !          2596:                                }
        !          2597:                                (*pc->decoder->filter_function)(0x3b, pc->decoder);             /* ';' */
        !          2598:                        }
        !          2599:                }
        !          2600:                if (f) {
        !          2601:                        break;
        !          2602:                }
        !          2603:                n++;
        !          2604:        }
        !          2605:        if (!f) {
        !          2606:                (*pc->decoder->filter_function)(c, pc->decoder);
        !          2607:        }
        !          2608: 
        !          2609:        return c;
        !          2610: }
        !          2611: 
        !          2612: static int
        !          2613: collector_decode_htmlnumericentity(int c, void *data)
        !          2614: {
        !          2615:        struct collector_htmlnumericentity_data *pc = (struct collector_htmlnumericentity_data *)data;
        !          2616:        int f, n, s, r, d, size, *mapelm;
        !          2617: 
        !          2618:        switch (pc->status) {
        !          2619:        case 1:
        !          2620:                if (c == 0x23) {        /* '#' */
        !          2621:                        pc->status = 2;
        !          2622:                } else {
        !          2623:                        pc->status = 0;
        !          2624:                        (*pc->decoder->filter_function)(0x26, pc->decoder);             /* '&' */
        !          2625:                        (*pc->decoder->filter_function)(c, pc->decoder);
        !          2626:                }
        !          2627:                break;
        !          2628:        case 2:
        !          2629:                if (c >= 0x30 && c <= 0x39) {   /* '0' - '9' */
        !          2630:                        pc->cache = c - 0x30;
        !          2631:                        pc->status = 3;
        !          2632:                        pc->digit = 1;
        !          2633:                } else {
        !          2634:                        pc->status = 0;
        !          2635:                        (*pc->decoder->filter_function)(0x26, pc->decoder);             /* '&' */
        !          2636:                        (*pc->decoder->filter_function)(0x23, pc->decoder);             /* '#' */
        !          2637:                        (*pc->decoder->filter_function)(c, pc->decoder);
        !          2638:                }
        !          2639:                break;
        !          2640:        case 3:
        !          2641:                s = 0;
        !          2642:                f = 0;
        !          2643:                if (c >= 0x30 && c <= 0x39) {   /* '0' - '9' */
        !          2644:                        if (pc->digit > 9) {
        !          2645:                                pc->status = 0;
        !          2646:                                s = pc->cache;
        !          2647:                                f = 1;
        !          2648:                        } else {
        !          2649:                                s = pc->cache*10 + c - 0x30;
        !          2650:                                pc->cache = s;
        !          2651:                                pc->digit++;
        !          2652:                        }
        !          2653:                } else {
        !          2654:                        pc->status = 0;
        !          2655:                        s = pc->cache;
        !          2656:                        f = 1;
        !          2657:                        n = 0;
        !          2658:                        size = pc->mapsize;
        !          2659:                        while (n < size) {
        !          2660:                                mapelm = &(pc->convmap[n*4]);
        !          2661:                                d = s - mapelm[2];
        !          2662:                                if (d >= mapelm[0] && d <= mapelm[1]) {
        !          2663:                                        f = 0;
        !          2664:                                        (*pc->decoder->filter_function)(d, pc->decoder);
        !          2665:                                        if (c != 0x3b) {        /* ';' */
        !          2666:                                                (*pc->decoder->filter_function)(c, pc->decoder);
        !          2667:                                        }
        !          2668:                                        break;
        !          2669:                                }
        !          2670:                                n++;
        !          2671:                        }
        !          2672:                }
        !          2673:                if (f) {
        !          2674:                        (*pc->decoder->filter_function)(0x26, pc->decoder);             /* '&' */
        !          2675:                        (*pc->decoder->filter_function)(0x23, pc->decoder);             /* '#' */
        !          2676:                        r = 1;
        !          2677:                        n = pc->digit;
        !          2678:                        while (n > 0) {
        !          2679:                                r *= 10;
        !          2680:                                n--;
        !          2681:                        }
        !          2682:                        s %= r;
        !          2683:                        r /= 10;
        !          2684:                        while (r > 0) {
        !          2685:                                d = s/r;
        !          2686:                                s %= r;
        !          2687:                                r /= 10;
        !          2688:                                (*pc->decoder->filter_function)(mbfl_hexchar_table[d], pc->decoder);
        !          2689:                        }
        !          2690:                        (*pc->decoder->filter_function)(c, pc->decoder);
        !          2691:                }
        !          2692:                break;
        !          2693:        default:
        !          2694:                if (c == 0x26) {        /* '&' */
        !          2695:                        pc->status = 1;
        !          2696:                } else {
        !          2697:                        (*pc->decoder->filter_function)(c, pc->decoder);
        !          2698:                }
        !          2699:                break;
        !          2700:        }
        !          2701: 
        !          2702:        return c;
        !          2703: }
        !          2704: 
        !          2705: int mbfl_filt_decode_htmlnumericentity_flush(mbfl_convert_filter *filter)
        !          2706: {
        !          2707:        struct collector_htmlnumericentity_data *pc = (struct collector_htmlnumericentity_data *)filter;
        !          2708:        int n, s, r, d;
        !          2709: 
        !          2710:        if (pc->status) {
        !          2711:                switch (pc->status) {
        !          2712:                case 1: /* '&' */
        !          2713:                        (*pc->decoder->filter_function)(0x26, pc->decoder);             /* '&' */
        !          2714:                        break;
        !          2715:                case 2: /* '#' */
        !          2716:                        (*pc->decoder->filter_function)(0x26, pc->decoder);             /* '&' */
        !          2717:                        (*pc->decoder->filter_function)(0x23, pc->decoder);             /* '#' */
        !          2718:                        break;
        !          2719:                case 3: /* '0'-'9' */
        !          2720:                        (*pc->decoder->filter_function)(0x26, pc->decoder);             /* '&' */
        !          2721:                        (*pc->decoder->filter_function)(0x23, pc->decoder);             /* '#' */
        !          2722: 
        !          2723:                        s = pc->cache;
        !          2724:                        r = 1;
        !          2725:                        n = pc->digit;
        !          2726:                        while (n > 0) {
        !          2727:                                r *= 10;
        !          2728:                                n--;
        !          2729:                        }
        !          2730:                        s %= r;
        !          2731:                        r /= 10;
        !          2732:                        while (r > 0) {
        !          2733:                                d = s/r;
        !          2734:                                s %= r;
        !          2735:                                r /= 10;
        !          2736:                                (*pc->decoder->filter_function)(mbfl_hexchar_table[d], pc->decoder);
        !          2737:                        }
        !          2738: 
        !          2739:                        break;
        !          2740:                default:
        !          2741:                        break;
        !          2742:                }
        !          2743:        }
        !          2744: 
        !          2745:        pc->status = 0;
        !          2746:        pc->cache = 0;
        !          2747:        pc->digit = 0;
        !          2748: 
        !          2749:        return 0;
        !          2750: }
        !          2751: 
        !          2752: mbfl_string *
        !          2753: mbfl_html_numeric_entity(
        !          2754:     mbfl_string *string,
        !          2755:     mbfl_string *result,
        !          2756:     int *convmap,
        !          2757:     int mapsize,
        !          2758:     int type)
        !          2759: {
        !          2760:        struct collector_htmlnumericentity_data pc;
        !          2761:        mbfl_memory_device device;
        !          2762:        mbfl_convert_filter *encoder;
        !          2763:        int n;
        !          2764:        unsigned char *p;
        !          2765: 
        !          2766:        if (string == NULL || result == NULL) {
        !          2767:                return NULL;
        !          2768:        }
        !          2769:        mbfl_string_init(result);
        !          2770:        result->no_language = string->no_language;
        !          2771:        result->no_encoding = string->no_encoding;
        !          2772:        mbfl_memory_device_init(&device, string->len, 0);
        !          2773: 
        !          2774:        /* output code filter */
        !          2775:        pc.decoder = mbfl_convert_filter_new(
        !          2776:            mbfl_no_encoding_wchar,
        !          2777:            string->no_encoding,
        !          2778:            mbfl_memory_device_output, 0, &device);
        !          2779:        /* wchar filter */
        !          2780:        if (type == 0) {
        !          2781:                encoder = mbfl_convert_filter_new(
        !          2782:                    string->no_encoding,
        !          2783:                    mbfl_no_encoding_wchar,
        !          2784:                    collector_encode_htmlnumericentity, 0, &pc);
        !          2785:        } else {
        !          2786:                encoder = mbfl_convert_filter_new(
        !          2787:                    string->no_encoding,
        !          2788:                    mbfl_no_encoding_wchar,
        !          2789:                    collector_decode_htmlnumericentity, 
        !          2790:                        (int (*)(void*))mbfl_filt_decode_htmlnumericentity_flush, &pc);
        !          2791:        }
        !          2792:        if (pc.decoder == NULL || encoder == NULL) {
        !          2793:                mbfl_convert_filter_delete(encoder);
        !          2794:                mbfl_convert_filter_delete(pc.decoder);
        !          2795:                return NULL;
        !          2796:        }
        !          2797:        pc.status = 0;
        !          2798:        pc.cache = 0;
        !          2799:        pc.digit = 0;
        !          2800:        pc.convmap = convmap;
        !          2801:        pc.mapsize = mapsize;
        !          2802: 
        !          2803:        /* feed data */
        !          2804:        p = string->val;
        !          2805:        n = string->len;
        !          2806:        if (p != NULL) {
        !          2807:                while (n > 0) {
        !          2808:                        if ((*encoder->filter_function)(*p++, encoder) < 0) {
        !          2809:                                break;
        !          2810:                        }
        !          2811:                        n--;
        !          2812:                }
        !          2813:        }
        !          2814:        mbfl_convert_filter_flush(encoder);
        !          2815:        mbfl_convert_filter_flush(pc.decoder);
        !          2816:        result = mbfl_memory_device_result(&device, result);
        !          2817:        mbfl_convert_filter_delete(encoder);
        !          2818:        mbfl_convert_filter_delete(pc.decoder);
        !          2819: 
        !          2820:        return result;
        !          2821: }
        !          2822: 
        !          2823: /*
        !          2824:  * Local variables:
        !          2825:  * tab-width: 4
        !          2826:  * c-basic-offset: 4
        !          2827:  * End:
        !          2828:  */

FreeBSD-CVSweb <freebsd-cvsweb@FreeBSD.org>