mcabber-crew: mcabber/libjabber/xmltok.c@f381236239a4 (annotated)

25 bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1	/*
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	2	The contents of this file are subject to the Mozilla Public License
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	3	Version 1.1 (the "License"); you may not use this file except in
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	4	compliance with the License. You may obtain a copy of the License at
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	5	http://www.mozilla.org/MPL/
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	6
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	7	Software distributed under the License is distributed on an "AS IS"
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	8	basis, WITHOUT WARRANTY OF ANY KIND, either express or implied. See the
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	9	License for the specific language governing rights and limitations
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	10	under the License.
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	11
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	12	The Original Code is expat.
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	13
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	14	The Initial Developer of the Original Code is James Clark.
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	15	Portions created by James Clark are Copyright (C) 1998, 1999
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	16	James Clark. All Rights Reserved.
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	17
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	18	Contributor(s):
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	19
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	20	Alternatively, the contents of this file may be used under the terms
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	21	of the GNU General Public License (the "GPL"), in which case the
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	22	provisions of the GPL are applicable instead of those above. If you
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	23	wish to allow use of your version of this file only under the terms of
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	24	the GPL and not to allow others to use your version of this file under
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	25	the MPL, indicate your decision by deleting the provisions above and
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	26	replace them with the notice and other provisions required by the
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	27	GPL. If you do not delete the provisions above, a recipient may use
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	28	your version of this file under either the MPL or the GPL.
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	29	*/
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	30
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	31	#include "xmldef.h"
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	32	#include "xmltok.h"
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	33	#include "nametab.h"
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	34
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	35	#define VTABLE1 \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	36	{ PREFIX(prologTok), PREFIX(contentTok), PREFIX(cdataSectionTok) }, \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	37	{ PREFIX(attributeValueTok), PREFIX(entityValueTok) }, \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	38	PREFIX(sameName), \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	39	PREFIX(nameMatchesAscii), \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	40	PREFIX(nameLength), \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	41	PREFIX(skipS), \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	42	PREFIX(getAtts), \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	43	PREFIX(charRefNumber), \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	44	PREFIX(predefinedEntityName), \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	45	PREFIX(updatePosition), \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	46	PREFIX(isPublicId)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	47
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	48	#define VTABLE VTABLE1, PREFIX(toUtf8), PREFIX(toUtf16)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	49
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	50	#define UCS2_GET_NAMING(pages, hi, lo) \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	51	(namingBitmap[(pages[hi] << 3) + ((lo) >> 5)] & (1 << ((lo) & 0x1F)))
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	52
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	53	/* A 2 byte UTF-8 representation splits the characters 11 bits
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	54	between the bottom 5 and 6 bits of the bytes.
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	55	We need 8 bits to index into pages, 3 bits to add to that index and
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	56	5 bits to generate the mask. */
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	57	#define UTF8_GET_NAMING2(pages, byte) \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	58	(namingBitmap[((pages)[(((byte)[0]) >> 2) & 7] << 3) \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	59	+ ((((byte)[0]) & 3) << 1) \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	60	+ ((((byte)[1]) >> 5) & 1)] \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	61	& (1 << (((byte)[1]) & 0x1F)))
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	62
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	63	/* A 3 byte UTF-8 representation splits the characters 16 bits
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	64	between the bottom 4, 6 and 6 bits of the bytes.
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	65	We need 8 bits to index into pages, 3 bits to add to that index and
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	66	5 bits to generate the mask. */
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	67	#define UTF8_GET_NAMING3(pages, byte) \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	68	(namingBitmap[((pages)[((((byte)[0]) & 0xF) << 4) \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	69	+ ((((byte)[1]) >> 2) & 0xF)] \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	70	<< 3) \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	71	+ ((((byte)[1]) & 3) << 1) \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	72	+ ((((byte)[2]) >> 5) & 1)] \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	73	& (1 << (((byte)[2]) & 0x1F)))
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	74
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	75	#define UTF8_GET_NAMING(pages, p, n) \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	76	((n) == 2 \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	77	? UTF8_GET_NAMING2(pages, (const unsigned char *)(p)) \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	78	: ((n) == 3 \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	79	? UTF8_GET_NAMING3(pages, (const unsigned char *)(p)) \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	80	: 0))
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	81
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	82	#define UTF8_INVALID3(p) \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	83	((*p) == 0xED \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	84	? (((p)[1] & 0x20) != 0) \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	85	: ((*p) == 0xEF \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	86	? ((p)[1] == 0xBF && ((p)[2] == 0xBF \|\| (p)[2] == 0xBE)) \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	87	: 0))
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	88
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	89	#define UTF8_INVALID4(p) ((*p) == 0xF4 && ((p)[1] & 0x30) != 0)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	90
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	91	static
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	92	int isNever(const ENCODING enc, const char p)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	93	{
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	94	return 0;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	95	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	96
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	97	static
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	98	int utf8_isName2(const ENCODING enc, const char p)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	99	{
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	100	return UTF8_GET_NAMING2(namePages, (const unsigned char *)p);
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	101	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	102
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	103	static
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	104	int utf8_isName3(const ENCODING enc, const char p)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	105	{
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	106	return UTF8_GET_NAMING3(namePages, (const unsigned char *)p);
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	107	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	108
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	109	#define utf8_isName4 isNever
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	110
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	111	static
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	112	int utf8_isNmstrt2(const ENCODING enc, const char p)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	113	{
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	114	return UTF8_GET_NAMING2(nmstrtPages, (const unsigned char *)p);
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	115	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	116
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	117	static
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	118	int utf8_isNmstrt3(const ENCODING enc, const char p)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	119	{
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	120	return UTF8_GET_NAMING3(nmstrtPages, (const unsigned char *)p);
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	121	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	122
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	123	#define utf8_isNmstrt4 isNever
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	124
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	125	#define utf8_isInvalid2 isNever
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	126
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	127	static
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	128	int utf8_isInvalid3(const ENCODING enc, const char p)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	129	{
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	130	return UTF8_INVALID3((const unsigned char *)p);
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	131	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	132
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	133	static
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	134	int utf8_isInvalid4(const ENCODING enc, const char p)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	135	{
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	136	return UTF8_INVALID4((const unsigned char *)p);
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	137	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	138
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	139	struct normal_encoding {
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	140	ENCODING enc;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	141	unsigned char type[256];
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	142	#ifdef XML_MIN_SIZE
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	143	int (byteType)(const ENCODING , const char *);
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	144	int (isNameMin)(const ENCODING , const char *);
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	145	int (isNmstrtMin)(const ENCODING , const char *);
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	146	int (byteToAscii)(const ENCODING , const char *);
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	147	int (charMatches)(const ENCODING , const char *, int);
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	148	#endif /* XML_MIN_SIZE */
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	149	int (isName2)(const ENCODING , const char *);
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	150	int (isName3)(const ENCODING , const char *);
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	151	int (isName4)(const ENCODING , const char *);
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	152	int (isNmstrt2)(const ENCODING , const char *);
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	153	int (isNmstrt3)(const ENCODING , const char *);
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	154	int (isNmstrt4)(const ENCODING , const char *);
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	155	int (isInvalid2)(const ENCODING , const char *);
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	156	int (isInvalid3)(const ENCODING , const char *);
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	157	int (isInvalid4)(const ENCODING , const char *);
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	158	};
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	159
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	160	#ifdef XML_MIN_SIZE
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	161
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	162	#define STANDARD_VTABLE(E) \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	163	E ## byteType, \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	164	E ## isNameMin, \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	165	E ## isNmstrtMin, \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	166	E ## byteToAscii, \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	167	E ## charMatches,
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	168
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	169	#else
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	170
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	171	#define STANDARD_VTABLE(E) /* as nothing */
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	172
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	173	#endif
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	174
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	175	#define NORMAL_VTABLE(E) \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	176	E ## isName2, \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	177	E ## isName3, \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	178	E ## isName4, \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	179	E ## isNmstrt2, \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	180	E ## isNmstrt3, \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	181	E ## isNmstrt4, \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	182	E ## isInvalid2, \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	183	E ## isInvalid3, \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	184	E ## isInvalid4
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	185
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	186	static int checkCharRefNumber(int);
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	187
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	188	#include "xmltok_impl.h"
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	189
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	190	#ifdef XML_MIN_SIZE
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	191	#define sb_isNameMin isNever
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	192	#define sb_isNmstrtMin isNever
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	193	#endif
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	194
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	195	#ifdef XML_MIN_SIZE
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	196	#define MINBPC(enc) ((enc)->minBytesPerChar)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	197	#else
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	198	/* minimum bytes per character */
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	199	#define MINBPC(enc) 1
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	200	#endif
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	201
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	202	#define SB_BYTE_TYPE(enc, p) \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	203	(((struct normal_encoding )(enc))->type[(unsigned char)(p)])
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	204
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	205	#ifdef XML_MIN_SIZE
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	206	static
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	207	int sb_byteType(const ENCODING enc, const char p)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	208	{
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	209	return SB_BYTE_TYPE(enc, p);
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	210	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	211	#define BYTE_TYPE(enc, p) \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	212	(((const struct normal_encoding *)(enc))->byteType(enc, p))
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	213	#else
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	214	#define BYTE_TYPE(enc, p) SB_BYTE_TYPE(enc, p)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	215	#endif
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	216
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	217	#ifdef XML_MIN_SIZE
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	218	#define BYTE_TO_ASCII(enc, p) \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	219	(((const struct normal_encoding *)(enc))->byteToAscii(enc, p))
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	220	static
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	221	int sb_byteToAscii(const ENCODING enc, const char p)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	222	{
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	223	return *p;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	224	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	225	#else
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	226	#define BYTE_TO_ASCII(enc, p) (*p)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	227	#endif
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	228
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	229	#define IS_NAME_CHAR(enc, p, n) \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	230	(((const struct normal_encoding *)(enc))->isName ## n(enc, p))
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	231	#define IS_NMSTRT_CHAR(enc, p, n) \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	232	(((const struct normal_encoding *)(enc))->isNmstrt ## n(enc, p))
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	233	#define IS_INVALID_CHAR(enc, p, n) \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	234	(((const struct normal_encoding *)(enc))->isInvalid ## n(enc, p))
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	235
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	236	#ifdef XML_MIN_SIZE
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	237	#define IS_NAME_CHAR_MINBPC(enc, p) \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	238	(((const struct normal_encoding *)(enc))->isNameMin(enc, p))
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	239	#define IS_NMSTRT_CHAR_MINBPC(enc, p) \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	240	(((const struct normal_encoding *)(enc))->isNmstrtMin(enc, p))
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	241	#else
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	242	#define IS_NAME_CHAR_MINBPC(enc, p) (0)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	243	#define IS_NMSTRT_CHAR_MINBPC(enc, p) (0)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	244	#endif
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	245
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	246	#ifdef XML_MIN_SIZE
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	247	#define CHAR_MATCHES(enc, p, c) \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	248	(((const struct normal_encoding *)(enc))->charMatches(enc, p, c))
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	249	static
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	250	int sb_charMatches(const ENCODING enc, const char p, int c)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	251	{
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	252	return *p == c;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	253	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	254	#else
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	255	/* c is an ASCII character */
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	256	#define CHAR_MATCHES(enc, p, c) (*(p) == c)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	257	#endif
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	258
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	259	#define PREFIX(ident) normal_ ## ident
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	260	#include "xmltok_impl_c.h"
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	261
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	262	#undef MINBPC
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	263	#undef BYTE_TYPE
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	264	#undef BYTE_TO_ASCII
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	265	#undef CHAR_MATCHES
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	266	#undef IS_NAME_CHAR
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	267	#undef IS_NAME_CHAR_MINBPC
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	268	#undef IS_NMSTRT_CHAR
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	269	#undef IS_NMSTRT_CHAR_MINBPC
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	270	#undef IS_INVALID_CHAR
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	271
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	272	enum { /* UTF8_cvalN is value of masked first byte of N byte sequence */
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	273	UTF8_cval1 = 0x00,
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	274	UTF8_cval2 = 0xc0,
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	275	UTF8_cval3 = 0xe0,
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	276	UTF8_cval4 = 0xf0
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	277	};
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	278
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	279	static
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	280	void utf8_toUtf8(const ENCODING *enc,
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	281	const char *fromP, const char fromLim,
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	282	char *toP, const char toLim)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	283	{
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	284	char *to;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	285	const char *from;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	286	if (fromLim - fromP > toLim - toP) {
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	287	/* Avoid copying partial characters. */
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	288	for (fromLim = fromP + (toLim - toP); fromLim > *fromP; fromLim--)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	289	if (((unsigned char)fromLim[-1] & 0xc0) != 0x80)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	290	break;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	291	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	292	for (to = toP, from = fromP; from != fromLim; from++, to++)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	293	to = from;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	294	*fromP = from;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	295	*toP = to;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	296	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	297
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	298	static
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	299	void utf8_toUtf16(const ENCODING *enc,
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	300	const char *fromP, const char fromLim,
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	301	unsigned short *toP, const unsigned short toLim)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	302	{
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	303	unsigned short to = toP;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	304	const char from = fromP;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	305	while (from != fromLim && to != toLim) {
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	306	switch (((struct normal_encoding )enc)->type[(unsigned char)from]) {
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	307	case BT_LEAD2:
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	308	*to++ = ((from[0] & 0x1f) << 6) \| (from[1] & 0x3f);
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	309	from += 2;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	310	break;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	311	case BT_LEAD3:
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	312	*to++ = ((from[0] & 0xf) << 12) \| ((from[1] & 0x3f) << 6) \| (from[2] & 0x3f);
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	313	from += 3;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	314	break;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	315	case BT_LEAD4:
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	316	{
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	317	unsigned long n;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	318	if (to + 1 == toLim)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	319	break;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	320	n = ((from[0] & 0x7) << 18) \| ((from[1] & 0x3f) << 12) \| ((from[2] & 0x3f) << 6) \| (from[3] & 0x3f);
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	321	n -= 0x10000;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	322	to[0] = (unsigned short)((n >> 10) \| 0xD800);
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	323	to[1] = (unsigned short)((n & 0x3FF) \| 0xDC00);
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	324	to += 2;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	325	from += 4;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	326	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	327	break;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	328	default:
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	329	to++ = from++;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	330	break;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	331	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	332	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	333	*fromP = from;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	334	*toP = to;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	335	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	336
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	337	#ifdef XML_NS
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	338	static const struct normal_encoding utf8_encoding_ns = {
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	339	{ VTABLE1, utf8_toUtf8, utf8_toUtf16, 1, 1, 0 },
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	340	{
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	341	#include "asciitab.h"
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	342	#include "utf8tab.h"
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	343	},
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	344	STANDARD_VTABLE(sb_) NORMAL_VTABLE(utf8_)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	345	};
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	346	#endif
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	347
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	348	static const struct normal_encoding utf8_encoding = {
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	349	{ VTABLE1, utf8_toUtf8, utf8_toUtf16, 1, 1, 0 },
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	350	{
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	351	#define BT_COLON BT_NMSTRT
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	352	#include "asciitab.h"
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	353	#undef BT_COLON
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	354	#include "utf8tab.h"
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	355	},
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	356	STANDARD_VTABLE(sb_) NORMAL_VTABLE(utf8_)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	357	};
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	358
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	359	#ifdef XML_NS
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	360
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	361	static const struct normal_encoding internal_utf8_encoding_ns = {
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	362	{ VTABLE1, utf8_toUtf8, utf8_toUtf16, 1, 1, 0 },
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	363	{
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	364	#include "iasciitab.h"
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	365	#include "utf8tab.h"
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	366	},
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	367	STANDARD_VTABLE(sb_) NORMAL_VTABLE(utf8_)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	368	};
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	369
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	370	#endif
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	371
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	372	static const struct normal_encoding internal_utf8_encoding = {
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	373	{ VTABLE1, utf8_toUtf8, utf8_toUtf16, 1, 1, 0 },
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	374	{
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	375	#define BT_COLON BT_NMSTRT
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	376	#include "iasciitab.h"
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	377	#undef BT_COLON
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	378	#include "utf8tab.h"
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	379	},
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	380	STANDARD_VTABLE(sb_) NORMAL_VTABLE(utf8_)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	381	};
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	382
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	383	static
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	384	void latin1_toUtf8(const ENCODING *enc,
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	385	const char *fromP, const char fromLim,
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	386	char *toP, const char toLim)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	387	{
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	388	for (;;) {
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	389	unsigned char c;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	390	if (*fromP == fromLim)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	391	break;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	392	c = (unsigned char)**fromP;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	393	if (c & 0x80) {
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	394	if (toLim - *toP < 2)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	395	break;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	396	(toP)++ = ((c >> 6) \| UTF8_cval2);
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	397	(toP)++ = ((c & 0x3f) \| 0x80);
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	398	(*fromP)++;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	399	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	400	else {
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	401	if (*toP == toLim)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	402	break;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	403	(toP)++ = (fromP)++;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	404	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	405	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	406	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	407
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	408	static
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	409	void latin1_toUtf16(const ENCODING *enc,
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	410	const char *fromP, const char fromLim,
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	411	unsigned short *toP, const unsigned short toLim)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	412	{
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	413	while (fromP != fromLim && toP != toLim)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	414	(toP)++ = (unsigned char)(fromP)++;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	415	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	416
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	417	#ifdef XML_NS
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	418
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	419	static const struct normal_encoding latin1_encoding_ns = {
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	420	{ VTABLE1, latin1_toUtf8, latin1_toUtf16, 1, 0, 0 },
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	421	{
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	422	#include "asciitab.h"
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	423	#include "latin1tab.h"
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	424	},
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	425	STANDARD_VTABLE(sb_)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	426	};
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	427
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	428	#endif
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	429
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	430	static const struct normal_encoding latin1_encoding = {
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	431	{ VTABLE1, latin1_toUtf8, latin1_toUtf16, 1, 0, 0 },
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	432	{
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	433	#define BT_COLON BT_NMSTRT
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	434	#include "asciitab.h"
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	435	#undef BT_COLON
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	436	#include "latin1tab.h"
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	437	},
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	438	STANDARD_VTABLE(sb_)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	439	};
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	440
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	441	static
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	442	void ascii_toUtf8(const ENCODING *enc,
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	443	const char *fromP, const char fromLim,
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	444	char *toP, const char toLim)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	445	{
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	446	while (fromP != fromLim && toP != toLim)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	447	(toP)++ = (fromP)++;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	448	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	449
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	450	#ifdef XML_NS
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	451
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	452	static const struct normal_encoding ascii_encoding_ns = {
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	453	{ VTABLE1, ascii_toUtf8, latin1_toUtf16, 1, 1, 0 },
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	454	{
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	455	#include "asciitab.h"
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	456	/* BT_NONXML == 0 */
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	457	},
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	458	STANDARD_VTABLE(sb_)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	459	};
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	460
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	461	#endif
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	462
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	463	static const struct normal_encoding ascii_encoding = {
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	464	{ VTABLE1, ascii_toUtf8, latin1_toUtf16, 1, 1, 0 },
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	465	{
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	466	#define BT_COLON BT_NMSTRT
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	467	#include "asciitab.h"
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	468	#undef BT_COLON
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	469	/* BT_NONXML == 0 */
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	470	},
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	471	STANDARD_VTABLE(sb_)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	472	};
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	473
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	474	static int unicode_byte_type(char hi, char lo)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	475	{
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	476	switch ((unsigned char)hi) {
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	477	case 0xD8: case 0xD9: case 0xDA: case 0xDB:
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	478	return BT_LEAD4;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	479	case 0xDC: case 0xDD: case 0xDE: case 0xDF:
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	480	return BT_TRAIL;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	481	case 0xFF:
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	482	switch ((unsigned char)lo) {
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	483	case 0xFF:
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	484	case 0xFE:
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	485	return BT_NONXML;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	486	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	487	break;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	488	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	489	return BT_NONASCII;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	490	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	491
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	492	#define DEFINE_UTF16_TO_UTF8(E) \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	493	static \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	494	void E ## toUtf8(const ENCODING *enc, \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	495	const char *fromP, const char fromLim, \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	496	char *toP, const char toLim) \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	497	{ \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	498	const char *from; \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	499	for (from = *fromP; from != fromLim; from += 2) { \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	500	int plane; \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	501	unsigned char lo2; \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	502	unsigned char lo = GET_LO(from); \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	503	unsigned char hi = GET_HI(from); \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	504	switch (hi) { \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	505	case 0: \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	506	if (lo < 0x80) { \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	507	if (*toP == toLim) { \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	508	*fromP = from; \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	509	return; \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	510	} \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	511	(toP)++ = lo; \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	512	break; \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	513	} \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	514	/* fall through */ \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	515	case 0x1: case 0x2: case 0x3: \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	516	case 0x4: case 0x5: case 0x6: case 0x7: \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	517	if (toLim - *toP < 2) { \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	518	*fromP = from; \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	519	return; \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	520	} \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	521	(toP)++ = ((lo >> 6) \| (hi << 2) \| UTF8_cval2); \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	522	(toP)++ = ((lo & 0x3f) \| 0x80); \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	523	break; \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	524	default: \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	525	if (toLim - *toP < 3) { \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	526	*fromP = from; \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	527	return; \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	528	} \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	529	/* 16 bits divided 4, 6, 6 amongst 3 bytes */ \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	530	(toP)++ = ((hi >> 4) \| UTF8_cval3); \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	531	(toP)++ = (((hi & 0xf) << 2) \| (lo >> 6) \| 0x80); \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	532	(toP)++ = ((lo & 0x3f) \| 0x80); \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	533	break; \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	534	case 0xD8: case 0xD9: case 0xDA: case 0xDB: \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	535	if (toLim - *toP < 4) { \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	536	*fromP = from; \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	537	return; \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	538	} \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	539	plane = (((hi & 0x3) << 2) \| ((lo >> 6) & 0x3)) + 1; \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	540	(toP)++ = ((plane >> 2) \| UTF8_cval4); \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	541	(toP)++ = (((lo >> 2) & 0xF) \| ((plane & 0x3) << 4) \| 0x80); \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	542	from += 2; \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	543	lo2 = GET_LO(from); \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	544	(toP)++ = (((lo & 0x3) << 4) \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	545	\| ((GET_HI(from) & 0x3) << 2) \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	546	\| (lo2 >> 6) \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	547	\| 0x80); \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	548	(toP)++ = ((lo2 & 0x3f) \| 0x80); \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	549	break; \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	550	} \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	551	} \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	552	*fromP = from; \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	553	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	554
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	555	#define DEFINE_UTF16_TO_UTF16(E) \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	556	static \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	557	void E ## toUtf16(const ENCODING *enc, \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	558	const char *fromP, const char fromLim, \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	559	unsigned short *toP, const unsigned short toLim) \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	560	{ \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	561	/* Avoid copying first half only of surrogate */ \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	562	if (fromLim - fromP > ((toLim - toP) << 1) \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	563	&& (GET_HI(fromLim - 2) & 0xF8) == 0xD8) \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	564	fromLim -= 2; \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	565	for (; fromP != fromLim && toP != toLim; *fromP += 2) \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	566	(toP)++ = (GET_HI(fromP) << 8) \| GET_LO(fromP); \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	567	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	568
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	569	#define SET2(ptr, ch) \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	570	(((ptr)[0] = ((ch) & 0xff)), ((ptr)[1] = ((ch) >> 8)))
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	571	#define GET_LO(ptr) ((unsigned char)(ptr)[0])
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	572	#define GET_HI(ptr) ((unsigned char)(ptr)[1])
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	573
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	574	DEFINE_UTF16_TO_UTF8(little2_)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	575	DEFINE_UTF16_TO_UTF16(little2_)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	576
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	577	#undef SET2
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	578	#undef GET_LO
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	579	#undef GET_HI
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	580
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	581	#define SET2(ptr, ch) \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	582	(((ptr)[0] = ((ch) >> 8)), ((ptr)[1] = ((ch) & 0xFF)))
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	583	#define GET_LO(ptr) ((unsigned char)(ptr)[1])
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	584	#define GET_HI(ptr) ((unsigned char)(ptr)[0])
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	585
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	586	DEFINE_UTF16_TO_UTF8(big2_)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	587	DEFINE_UTF16_TO_UTF16(big2_)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	588
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	589	#undef SET2
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	590	#undef GET_LO
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	591	#undef GET_HI
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	592
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	593	#define LITTLE2_BYTE_TYPE(enc, p) \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	594	((p)[1] == 0 \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	595	? ((struct normal_encoding )(enc))->type[(unsigned char)(p)] \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	596	: unicode_byte_type((p)[1], (p)[0]))
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	597	#define LITTLE2_BYTE_TO_ASCII(enc, p) ((p)[1] == 0 ? (p)[0] : -1)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	598	#define LITTLE2_CHAR_MATCHES(enc, p, c) ((p)[1] == 0 && (p)[0] == c)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	599	#define LITTLE2_IS_NAME_CHAR_MINBPC(enc, p) \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	600	UCS2_GET_NAMING(namePages, (unsigned char)p[1], (unsigned char)p[0])
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	601	#define LITTLE2_IS_NMSTRT_CHAR_MINBPC(enc, p) \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	602	UCS2_GET_NAMING(nmstrtPages, (unsigned char)p[1], (unsigned char)p[0])
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	603
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	604	#ifdef XML_MIN_SIZE
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	605
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	606	static
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	607	int little2_byteType(const ENCODING enc, const char p)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	608	{
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	609	return LITTLE2_BYTE_TYPE(enc, p);
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	610	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	611
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	612	static
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	613	int little2_byteToAscii(const ENCODING enc, const char p)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	614	{
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	615	return LITTLE2_BYTE_TO_ASCII(enc, p);
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	616	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	617
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	618	static
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	619	int little2_charMatches(const ENCODING enc, const char p, int c)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	620	{
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	621	return LITTLE2_CHAR_MATCHES(enc, p, c);
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	622	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	623
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	624	static
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	625	int little2_isNameMin(const ENCODING enc, const char p)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	626	{
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	627	return LITTLE2_IS_NAME_CHAR_MINBPC(enc, p);
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	628	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	629
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	630	static
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	631	int little2_isNmstrtMin(const ENCODING enc, const char p)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	632	{
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	633	return LITTLE2_IS_NMSTRT_CHAR_MINBPC(enc, p);
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	634	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	635
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	636	#undef VTABLE
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	637	#define VTABLE VTABLE1, little2_toUtf8, little2_toUtf16
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	638
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	639	#else /* not XML_MIN_SIZE */
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	640
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	641	#undef PREFIX
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	642	#define PREFIX(ident) little2_ ## ident
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	643	#define MINBPC(enc) 2
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	644	/* CHAR_MATCHES is guaranteed to have MINBPC bytes available. */
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	645	#define BYTE_TYPE(enc, p) LITTLE2_BYTE_TYPE(enc, p)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	646	#define BYTE_TO_ASCII(enc, p) LITTLE2_BYTE_TO_ASCII(enc, p)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	647	#define CHAR_MATCHES(enc, p, c) LITTLE2_CHAR_MATCHES(enc, p, c)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	648	#define IS_NAME_CHAR(enc, p, n) 0
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	649	#define IS_NAME_CHAR_MINBPC(enc, p) LITTLE2_IS_NAME_CHAR_MINBPC(enc, p)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	650	#define IS_NMSTRT_CHAR(enc, p, n) (0)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	651	#define IS_NMSTRT_CHAR_MINBPC(enc, p) LITTLE2_IS_NMSTRT_CHAR_MINBPC(enc, p)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	652
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	653	#include "xmltok_impl_c.h"
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	654
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	655	#undef MINBPC
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	656	#undef BYTE_TYPE
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	657	#undef BYTE_TO_ASCII
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	658	#undef CHAR_MATCHES
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	659	#undef IS_NAME_CHAR
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	660	#undef IS_NAME_CHAR_MINBPC
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	661	#undef IS_NMSTRT_CHAR
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	662	#undef IS_NMSTRT_CHAR_MINBPC
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	663	#undef IS_INVALID_CHAR
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	664
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	665	#endif /* not XML_MIN_SIZE */
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	666
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	667	#ifdef XML_NS
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	668
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	669	static const struct normal_encoding little2_encoding_ns = {
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	670	{ VTABLE, 2, 0,
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	671	#if XML_BYTE_ORDER == 12
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	672	1
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	673	#else
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	674	0
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	675	#endif
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	676	},
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	677	{
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	678	#include "asciitab.h"
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	679	#include "latin1tab.h"
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	680	},
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	681	STANDARD_VTABLE(little2_)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	682	};
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	683
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	684	#endif
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	685
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	686	static const struct normal_encoding little2_encoding = {
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	687	{ VTABLE, 2, 0,
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	688	#if XML_BYTE_ORDER == 12
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	689	1
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	690	#else
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	691	0
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	692	#endif
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	693	},
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	694	{
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	695	#define BT_COLON BT_NMSTRT
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	696	#include "asciitab.h"
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	697	#undef BT_COLON
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	698	#include "latin1tab.h"
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	699	},
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	700	STANDARD_VTABLE(little2_)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	701	};
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	702
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	703	#if XML_BYTE_ORDER != 21
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	704
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	705	#ifdef XML_NS
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	706
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	707	static const struct normal_encoding internal_little2_encoding_ns = {
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	708	{ VTABLE, 2, 0, 1 },
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	709	{
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	710	#include "iasciitab.h"
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	711	#include "latin1tab.h"
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	712	},
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	713	STANDARD_VTABLE(little2_)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	714	};
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	715
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	716	#endif
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	717
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	718	static const struct normal_encoding internal_little2_encoding = {
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	719	{ VTABLE, 2, 0, 1 },
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	720	{
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	721	#define BT_COLON BT_NMSTRT
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	722	#include "iasciitab.h"
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	723	#undef BT_COLON
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	724	#include "latin1tab.h"
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	725	},
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	726	STANDARD_VTABLE(little2_)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	727	};
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	728
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	729	#endif
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	730
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	731
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	732	#define BIG2_BYTE_TYPE(enc, p) \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	733	((p)[0] == 0 \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	734	? ((struct normal_encoding *)(enc))->type[(unsigned char)(p)[1]] \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	735	: unicode_byte_type((p)[0], (p)[1]))
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	736	#define BIG2_BYTE_TO_ASCII(enc, p) ((p)[0] == 0 ? (p)[1] : -1)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	737	#define BIG2_CHAR_MATCHES(enc, p, c) ((p)[0] == 0 && (p)[1] == c)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	738	#define BIG2_IS_NAME_CHAR_MINBPC(enc, p) \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	739	UCS2_GET_NAMING(namePages, (unsigned char)p[0], (unsigned char)p[1])
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	740	#define BIG2_IS_NMSTRT_CHAR_MINBPC(enc, p) \
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	741	UCS2_GET_NAMING(nmstrtPages, (unsigned char)p[0], (unsigned char)p[1])
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	742
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	743	#ifdef XML_MIN_SIZE
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	744
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	745	static
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	746	int big2_byteType(const ENCODING enc, const char p)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	747	{
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	748	return BIG2_BYTE_TYPE(enc, p);
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	749	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	750
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	751	static
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	752	int big2_byteToAscii(const ENCODING enc, const char p)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	753	{
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	754	return BIG2_BYTE_TO_ASCII(enc, p);
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	755	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	756
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	757	static
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	758	int big2_charMatches(const ENCODING enc, const char p, int c)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	759	{
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	760	return BIG2_CHAR_MATCHES(enc, p, c);
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	761	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	762
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	763	static
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	764	int big2_isNameMin(const ENCODING enc, const char p)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	765	{
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	766	return BIG2_IS_NAME_CHAR_MINBPC(enc, p);
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	767	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	768
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	769	static
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	770	int big2_isNmstrtMin(const ENCODING enc, const char p)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	771	{
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	772	return BIG2_IS_NMSTRT_CHAR_MINBPC(enc, p);
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	773	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	774
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	775	#undef VTABLE
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	776	#define VTABLE VTABLE1, big2_toUtf8, big2_toUtf16
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	777
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	778	#else /* not XML_MIN_SIZE */
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	779
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	780	#undef PREFIX
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	781	#define PREFIX(ident) big2_ ## ident
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	782	#define MINBPC(enc) 2
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	783	/* CHAR_MATCHES is guaranteed to have MINBPC bytes available. */
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	784	#define BYTE_TYPE(enc, p) BIG2_BYTE_TYPE(enc, p)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	785	#define BYTE_TO_ASCII(enc, p) BIG2_BYTE_TO_ASCII(enc, p)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	786	#define CHAR_MATCHES(enc, p, c) BIG2_CHAR_MATCHES(enc, p, c)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	787	#define IS_NAME_CHAR(enc, p, n) 0
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	788	#define IS_NAME_CHAR_MINBPC(enc, p) BIG2_IS_NAME_CHAR_MINBPC(enc, p)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	789	#define IS_NMSTRT_CHAR(enc, p, n) (0)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	790	#define IS_NMSTRT_CHAR_MINBPC(enc, p) BIG2_IS_NMSTRT_CHAR_MINBPC(enc, p)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	791
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	792	#include "xmltok_impl_c.h"
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	793
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	794	#undef MINBPC
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	795	#undef BYTE_TYPE
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	796	#undef BYTE_TO_ASCII
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	797	#undef CHAR_MATCHES
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	798	#undef IS_NAME_CHAR
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	799	#undef IS_NAME_CHAR_MINBPC
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	800	#undef IS_NMSTRT_CHAR
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	801	#undef IS_NMSTRT_CHAR_MINBPC
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	802	#undef IS_INVALID_CHAR
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	803
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	804	#endif /* not XML_MIN_SIZE */
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	805
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	806	#ifdef XML_NS
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	807
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	808	static const struct normal_encoding big2_encoding_ns = {
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	809	{ VTABLE, 2, 0,
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	810	#if XML_BYTE_ORDER == 21
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	811	1
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	812	#else
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	813	0
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	814	#endif
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	815	},
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	816	{
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	817	#include "asciitab.h"
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	818	#include "latin1tab.h"
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	819	},
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	820	STANDARD_VTABLE(big2_)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	821	};
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	822
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	823	#endif
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	824
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	825	static const struct normal_encoding big2_encoding = {
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	826	{ VTABLE, 2, 0,
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	827	#if XML_BYTE_ORDER == 21
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	828	1
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	829	#else
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	830	0
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	831	#endif
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	832	},
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	833	{
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	834	#define BT_COLON BT_NMSTRT
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	835	#include "asciitab.h"
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	836	#undef BT_COLON
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	837	#include "latin1tab.h"
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	838	},
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	839	STANDARD_VTABLE(big2_)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	840	};
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	841
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	842	#if XML_BYTE_ORDER != 12
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	843
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	844	#ifdef XML_NS
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	845
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	846	static const struct normal_encoding internal_big2_encoding_ns = {
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	847	{ VTABLE, 2, 0, 1 },
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	848	{
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	849	#include "iasciitab.h"
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	850	#include "latin1tab.h"
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	851	},
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	852	STANDARD_VTABLE(big2_)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	853	};
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	854
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	855	#endif
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	856
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	857	static const struct normal_encoding internal_big2_encoding = {
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	858	{ VTABLE, 2, 0, 1 },
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	859	{
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	860	#define BT_COLON BT_NMSTRT
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	861	#include "iasciitab.h"
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	862	#undef BT_COLON
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	863	#include "latin1tab.h"
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	864	},
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	865	STANDARD_VTABLE(big2_)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	866	};
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	867
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	868	#endif
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	869
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	870	#undef PREFIX
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	871
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	872	static
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	873	int streqci(const char s1, const char s2)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	874	{
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	875	for (;;) {
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	876	char c1 = *s1++;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	877	char c2 = *s2++;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	878	if ('a' <= c1 && c1 <= 'z')
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	879	c1 += 'A' - 'a';
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	880	if ('a' <= c2 && c2 <= 'z')
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	881	c2 += 'A' - 'a';
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	882	if (c1 != c2)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	883	return 0;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	884	if (!c1)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	885	break;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	886	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	887	return 1;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	888	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	889
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	890	static
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	891	void initUpdatePosition(const ENCODING enc, const char ptr,
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	892	const char end, POSITION pos)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	893	{
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	894	normal_updatePosition(&utf8_encoding.enc, ptr, end, pos);
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	895	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	896
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	897	static
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	898	int toAscii(const ENCODING enc, const char ptr, const char *end)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	899	{
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	900	char buf[1];
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	901	char *p = buf;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	902	XmlUtf8Convert(enc, &ptr, end, &p, p + 1);
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	903	if (p == buf)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	904	return -1;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	905	else
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	906	return buf[0];
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	907	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	908
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	909	static
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	910	int isSpace(int c)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	911	{
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	912	switch (c) {
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	913	case 0x20:
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	914	case 0xD:
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	915	case 0xA:
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	916	case 0x9:
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	917	return 1;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	918	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	919	return 0;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	920	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	921
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	922	/* Return 1 if there's just optional white space
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	923	or there's an S followed by name=val. */
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	924	static
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	925	int parsePseudoAttribute(const ENCODING *enc,
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	926	const char *ptr,
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	927	const char *end,
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	928	const char **namePtr,
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	929	const char **valPtr,
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	930	const char **nextTokPtr)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	931	{
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	932	int c;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	933	char open;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	934	if (ptr == end) {
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	935	*namePtr = 0;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	936	return 1;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	937	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	938	if (!isSpace(toAscii(enc, ptr, end))) {
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	939	*nextTokPtr = ptr;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	940	return 0;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	941	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	942	do {
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	943	ptr += enc->minBytesPerChar;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	944	} while (isSpace(toAscii(enc, ptr, end)));
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	945	if (ptr == end) {
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	946	*namePtr = 0;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	947	return 1;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	948	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	949	*namePtr = ptr;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	950	for (;;) {
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	951	c = toAscii(enc, ptr, end);
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	952	if (c == -1) {
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	953	*nextTokPtr = ptr;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	954	return 0;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	955	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	956	if (c == '=')
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	957	break;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	958	if (isSpace(c)) {
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	959	do {
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	960	ptr += enc->minBytesPerChar;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	961	} while (isSpace(c = toAscii(enc, ptr, end)));
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	962	if (c != '=') {
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	963	*nextTokPtr = ptr;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	964	return 0;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	965	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	966	break;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	967	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	968	ptr += enc->minBytesPerChar;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	969	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	970	if (ptr == *namePtr) {
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	971	*nextTokPtr = ptr;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	972	return 0;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	973	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	974	ptr += enc->minBytesPerChar;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	975	c = toAscii(enc, ptr, end);
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	976	while (isSpace(c)) {
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	977	ptr += enc->minBytesPerChar;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	978	c = toAscii(enc, ptr, end);
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	979	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	980	if (c != '"' && c != '\'') {
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	981	*nextTokPtr = ptr;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	982	return 0;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	983	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	984	open = c;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	985	ptr += enc->minBytesPerChar;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	986	*valPtr = ptr;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	987	for (;; ptr += enc->minBytesPerChar) {
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	988	c = toAscii(enc, ptr, end);
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	989	if (c == open)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	990	break;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	991	if (!('a' <= c && c <= 'z')
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	992	&& !('A' <= c && c <= 'Z')
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	993	&& !('0' <= c && c <= '9')
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	994	&& c != '.'
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	995	&& c != '-'
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	996	&& c != '_') {
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	997	*nextTokPtr = ptr;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	998	return 0;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	999	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1000	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1001	*nextTokPtr = ptr + enc->minBytesPerChar;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1002	return 1;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1003	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1004
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1005	static
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1006	int doParseXmlDecl(const ENCODING (encodingFinder)(const ENCODING *,
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1007	const char *,
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1008	const char *),
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1009	int isGeneralTextEntity,
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1010	const ENCODING *enc,
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1011	const char *ptr,
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1012	const char *end,
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1013	const char **badPtr,
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1014	const char **versionPtr,
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1015	const char **encodingName,
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1016	const ENCODING **encoding,
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1017	int *standalone)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1018	{
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1019	const char *val = 0;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1020	const char *name = 0;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1021	ptr += 5 * enc->minBytesPerChar;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1022	end -= 2 * enc->minBytesPerChar;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1023	if (!parsePseudoAttribute(enc, ptr, end, &name, &val, &ptr) \|\| !name) {
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1024	*badPtr = ptr;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1025	return 0;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1026	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1027	if (!XmlNameMatchesAscii(enc, name, "version")) {
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1028	if (!isGeneralTextEntity) {
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1029	*badPtr = name;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1030	return 0;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1031	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1032	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1033	else {
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1034	if (versionPtr)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1035	*versionPtr = val;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1036	if (!parsePseudoAttribute(enc, ptr, end, &name, &val, &ptr)) {
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1037	*badPtr = ptr;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1038	return 0;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1039	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1040	if (!name) {
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1041	if (isGeneralTextEntity) {
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1042	/* a TextDecl must have an EncodingDecl */
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1043	*badPtr = ptr;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1044	return 0;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1045	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1046	return 1;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1047	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1048	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1049	if (XmlNameMatchesAscii(enc, name, "encoding")) {
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1050	int c = toAscii(enc, val, end);
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1051	if (!('a' <= c && c <= 'z') && !('A' <= c && c <= 'Z')) {
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1052	*badPtr = val;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1053	return 0;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1054	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1055	if (encodingName)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1056	*encodingName = val;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1057	if (encoding)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1058	*encoding = encodingFinder(enc, val, ptr - enc->minBytesPerChar);
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1059	if (!parsePseudoAttribute(enc, ptr, end, &name, &val, &ptr)) {
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1060	*badPtr = ptr;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1061	return 0;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1062	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1063	if (!name)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1064	return 1;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1065	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1066	if (!XmlNameMatchesAscii(enc, name, "standalone") \|\| isGeneralTextEntity) {
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1067	*badPtr = name;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1068	return 0;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1069	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1070	if (XmlNameMatchesAscii(enc, val, "yes")) {
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1071	if (standalone)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1072	*standalone = 1;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1073	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1074	else if (XmlNameMatchesAscii(enc, val, "no")) {
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1075	if (standalone)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1076	*standalone = 0;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1077	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1078	else {
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1079	*badPtr = val;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1080	return 0;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1081	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1082	while (isSpace(toAscii(enc, ptr, end)))
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1083	ptr += enc->minBytesPerChar;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1084	if (ptr != end) {
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1085	*badPtr = ptr;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1086	return 0;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1087	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1088	return 1;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1089	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1090
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1091	static
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1092	int checkCharRefNumber(int result)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1093	{
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1094	switch (result >> 8) {
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1095	case 0xD8: case 0xD9: case 0xDA: case 0xDB:
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1096	case 0xDC: case 0xDD: case 0xDE: case 0xDF:
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1097	return -1;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1098	case 0:
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1099	if (latin1_encoding.type[result] == BT_NONXML)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1100	return -1;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1101	break;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1102	case 0xFF:
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1103	if (result == 0xFFFE \|\| result == 0xFFFF)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1104	return -1;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1105	break;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1106	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1107	return result;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1108	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1109
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1110	int XmlUtf8Encode(int c, char *buf)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1111	{
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1112	enum {
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1113	/* minN is minimum legal resulting value for N byte sequence */
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1114	min2 = 0x80,
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1115	min3 = 0x800,
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1116	min4 = 0x10000
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1117	};
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1118
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1119	if (c < 0)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1120	return 0;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1121	if (c < min2) {
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1122	buf[0] = (c \| UTF8_cval1);
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1123	return 1;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1124	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1125	if (c < min3) {
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1126	buf[0] = ((c >> 6) \| UTF8_cval2);
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1127	buf[1] = ((c & 0x3f) \| 0x80);
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1128	return 2;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1129	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1130	if (c < min4) {
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1131	buf[0] = ((c >> 12) \| UTF8_cval3);
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1132	buf[1] = (((c >> 6) & 0x3f) \| 0x80);
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1133	buf[2] = ((c & 0x3f) \| 0x80);
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1134	return 3;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1135	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1136	if (c < 0x110000) {
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1137	buf[0] = ((c >> 18) \| UTF8_cval4);
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1138	buf[1] = (((c >> 12) & 0x3f) \| 0x80);
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1139	buf[2] = (((c >> 6) & 0x3f) \| 0x80);
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1140	buf[3] = ((c & 0x3f) \| 0x80);
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1141	return 4;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1142	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1143	return 0;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1144	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1145
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1146	int XmlUtf16Encode(int charNum, unsigned short *buf)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1147	{
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1148	if (charNum < 0)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1149	return 0;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1150	if (charNum < 0x10000) {
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1151	buf[0] = charNum;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1152	return 1;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1153	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1154	if (charNum < 0x110000) {
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1155	charNum -= 0x10000;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1156	buf[0] = (charNum >> 10) + 0xD800;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1157	buf[1] = (charNum & 0x3FF) + 0xDC00;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1158	return 2;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1159	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1160	return 0;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1161	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1162
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1163	struct unknown_encoding {
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1164	struct normal_encoding normal;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1165	int (convert)(void userData, const char *p);
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1166	void *userData;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1167	unsigned short utf16[256];
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1168	char utf8[256][4];
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1169	};
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1170
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1171	int XmlSizeOfUnknownEncoding()
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1172	{
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1173	return sizeof(struct unknown_encoding);
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1174	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1175
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1176	static
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1177	int unknown_isName(const ENCODING enc, const char p)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1178	{
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1179	int c = ((const struct unknown_encoding *)enc)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1180	->convert(((const struct unknown_encoding *)enc)->userData, p);
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1181	if (c & ~0xFFFF)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1182	return 0;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1183	return UCS2_GET_NAMING(namePages, c >> 8, c & 0xFF);
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1184	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1185
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1186	static
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1187	int unknown_isNmstrt(const ENCODING enc, const char p)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1188	{
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1189	int c = ((const struct unknown_encoding *)enc)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1190	->convert(((const struct unknown_encoding *)enc)->userData, p);
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1191	if (c & ~0xFFFF)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1192	return 0;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1193	return UCS2_GET_NAMING(nmstrtPages, c >> 8, c & 0xFF);
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1194	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1195
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1196	static
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1197	int unknown_isInvalid(const ENCODING enc, const char p)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1198	{
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1199	int c = ((const struct unknown_encoding *)enc)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1200	->convert(((const struct unknown_encoding *)enc)->userData, p);
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1201	return (c & ~0xFFFF) \|\| checkCharRefNumber(c) < 0;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1202	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1203
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1204	static
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1205	void unknown_toUtf8(const ENCODING *enc,
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1206	const char *fromP, const char fromLim,
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1207	char *toP, const char toLim)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1208	{
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1209	char buf[XML_UTF8_ENCODE_MAX];
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1210	for (;;) {
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1211	const char *utf8;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1212	int n;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1213	if (*fromP == fromLim)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1214	break;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1215	utf8 = ((const struct unknown_encoding )enc)->utf8[(unsigned char)*fromP];
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1216	n = *utf8++;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1217	if (n == 0) {
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1218	int c = ((const struct unknown_encoding *)enc)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1219	->convert(((const struct unknown_encoding )enc)->userData, fromP);
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1220	n = XmlUtf8Encode(c, buf);
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1221	if (n > toLim - *toP)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1222	break;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1223	utf8 = buf;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1224	fromP += ((const struct normal_encoding )enc)->type[(unsigned char)**fromP]
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1225	- (BT_LEAD2 - 2);
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1226	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1227	else {
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1228	if (n > toLim - *toP)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1229	break;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1230	(*fromP)++;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1231	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1232	do {
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1233	(toP)++ = *utf8++;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1234	} while (--n != 0);
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1235	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1236	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1237
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1238	static
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1239	void unknown_toUtf16(const ENCODING *enc,
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1240	const char *fromP, const char fromLim,
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1241	unsigned short *toP, const unsigned short toLim)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1242	{
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1243	while (fromP != fromLim && toP != toLim) {
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1244	unsigned short c
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1245	= ((const struct unknown_encoding )enc)->utf16[(unsigned char)*fromP];
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1246	if (c == 0) {
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1247	c = (unsigned short)((const struct unknown_encoding *)enc)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1248	->convert(((const struct unknown_encoding )enc)->userData, fromP);
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1249	fromP += ((const struct normal_encoding )enc)->type[(unsigned char)**fromP]
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1250	- (BT_LEAD2 - 2);
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1251	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1252	else
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1253	(*fromP)++;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1254	(toP)++ = c;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1255	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1256	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1257
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1258	ENCODING *
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1259	XmlInitUnknownEncoding(void *mem,
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1260	int *table,
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1261	int (convert)(void userData, const char *p),
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1262	void *userData)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1263	{
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1264	int i;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1265	struct unknown_encoding *e = mem;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1266	for (i = 0; i < sizeof(struct normal_encoding); i++)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1267	((char )mem)[i] = ((char )&latin1_encoding)[i];
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1268	for (i = 0; i < 128; i++)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1269	if (latin1_encoding.type[i] != BT_OTHER
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1270	&& latin1_encoding.type[i] != BT_NONXML
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1271	&& table[i] != i)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1272	return 0;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1273	for (i = 0; i < 256; i++) {
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1274	int c = table[i];
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1275	if (c == -1) {
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1276	e->normal.type[i] = BT_MALFORM;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1277	/* This shouldn't really get used. */
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1278	e->utf16[i] = 0xFFFF;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1279	e->utf8[i][0] = 1;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1280	e->utf8[i][1] = 0;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1281	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1282	else if (c < 0) {
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1283	if (c < -4)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1284	return 0;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1285	e->normal.type[i] = BT_LEAD2 - (c + 2);
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1286	e->utf8[i][0] = 0;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1287	e->utf16[i] = 0;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1288	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1289	else if (c < 0x80) {
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1290	if (latin1_encoding.type[c] != BT_OTHER
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1291	&& latin1_encoding.type[c] != BT_NONXML
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1292	&& c != i)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1293	return 0;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1294	e->normal.type[i] = latin1_encoding.type[c];
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1295	e->utf8[i][0] = 1;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1296	e->utf8[i][1] = (char)c;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1297	e->utf16[i] = c == 0 ? 0xFFFF : c;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1298	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1299	else if (checkCharRefNumber(c) < 0) {
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1300	e->normal.type[i] = BT_NONXML;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1301	/* This shouldn't really get used. */
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1302	e->utf16[i] = 0xFFFF;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1303	e->utf8[i][0] = 1;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1304	e->utf8[i][1] = 0;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1305	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1306	else {
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1307	if (c > 0xFFFF)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1308	return 0;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1309	if (UCS2_GET_NAMING(nmstrtPages, c >> 8, c & 0xff))
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1310	e->normal.type[i] = BT_NMSTRT;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1311	else if (UCS2_GET_NAMING(namePages, c >> 8, c & 0xff))
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1312	e->normal.type[i] = BT_NAME;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1313	else
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1314	e->normal.type[i] = BT_OTHER;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1315	e->utf8[i][0] = (char)XmlUtf8Encode(c, e->utf8[i] + 1);
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1316	e->utf16[i] = c;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1317	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1318	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1319	e->userData = userData;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1320	e->convert = convert;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1321	if (convert) {
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1322	e->normal.isName2 = unknown_isName;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1323	e->normal.isName3 = unknown_isName;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1324	e->normal.isName4 = unknown_isName;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1325	e->normal.isNmstrt2 = unknown_isNmstrt;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1326	e->normal.isNmstrt3 = unknown_isNmstrt;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1327	e->normal.isNmstrt4 = unknown_isNmstrt;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1328	e->normal.isInvalid2 = unknown_isInvalid;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1329	e->normal.isInvalid3 = unknown_isInvalid;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1330	e->normal.isInvalid4 = unknown_isInvalid;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1331	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1332	e->normal.enc.utf8Convert = unknown_toUtf8;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1333	e->normal.enc.utf16Convert = unknown_toUtf16;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1334	return &(e->normal.enc);
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1335	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1336
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1337	/* If this enumeration is changed, getEncodingIndex and encodings
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1338	must also be changed. */
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1339	enum {
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1340	UNKNOWN_ENC = -1,
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1341	ISO_8859_1_ENC = 0,
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1342	US_ASCII_ENC,
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1343	UTF_8_ENC,
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1344	UTF_16_ENC,
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1345	UTF_16BE_ENC,
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1346	UTF_16LE_ENC,
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1347	/* must match encodingNames up to here */
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1348	NO_ENC
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1349	};
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1350
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1351	static
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1352	int getEncodingIndex(const char *name)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1353	{
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1354	static const char *encodingNames[] = {
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1355	"ISO-8859-1",
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1356	"US-ASCII",
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1357	"UTF-8",
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1358	"UTF-16",
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1359	"UTF-16BE"
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1360	"UTF-16LE",
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1361	};
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1362	int i;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1363	if (name == 0)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1364	return NO_ENC;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1365	for (i = 0; i < sizeof(encodingNames)/sizeof(encodingNames[0]); i++)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1366	if (streqci(name, encodingNames[i]))
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1367	return i;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1368	return UNKNOWN_ENC;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1369	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1370
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1371	/* For binary compatibility, we store the index of the encoding specified
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1372	at initialization in the isUtf16 member. */
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1373
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1374	#define INIT_ENC_INDEX(enc) ((enc)->initEnc.isUtf16)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1375
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1376	/* This is what detects the encoding.
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1377	encodingTable maps from encoding indices to encodings;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1378	INIT_ENC_INDEX(enc) is the index of the external (protocol) specified encoding;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1379	state is XML_CONTENT_STATE if we're parsing an external text entity,
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1380	and XML_PROLOG_STATE otherwise.
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1381	*/
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1382
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1383
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1384	static
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1385	int initScan(const ENCODING **encodingTable,
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1386	const INIT_ENCODING *enc,
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1387	int state,
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1388	const char *ptr,
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1389	const char *end,
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1390	const char **nextTokPtr)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1391	{
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1392	const ENCODING **encPtr;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1393
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1394	if (ptr == end)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1395	return XML_TOK_NONE;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1396	encPtr = enc->encPtr;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1397	if (ptr + 1 == end) {
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1398	/* only a single byte available for auto-detection */
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1399	/* a well-formed document entity must have more than one byte */
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1400	if (state != XML_CONTENT_STATE)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1401	return XML_TOK_PARTIAL;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1402	/* so we're parsing an external text entity... */
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1403	/* if UTF-16 was externally specified, then we need at least 2 bytes */
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1404	switch (INIT_ENC_INDEX(enc)) {
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1405	case UTF_16_ENC:
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1406	case UTF_16LE_ENC:
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1407	case UTF_16BE_ENC:
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1408	return XML_TOK_PARTIAL;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1409	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1410	switch ((unsigned char)*ptr) {
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1411	case 0xFE:
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1412	case 0xFF:
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1413	case 0xEF: /* possibly first byte of UTF-8 BOM */
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1414	if (INIT_ENC_INDEX(enc) == ISO_8859_1_ENC
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1415	&& state == XML_CONTENT_STATE)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1416	break;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1417	/* fall through */
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1418	case 0x00:
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1419	case 0x3C:
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1420	return XML_TOK_PARTIAL;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1421	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1422	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1423	else {
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1424	switch (((unsigned char)ptr[0] << 8) \| (unsigned char)ptr[1]) {
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1425	case 0xFEFF:
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1426	if (INIT_ENC_INDEX(enc) == ISO_8859_1_ENC
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1427	&& state == XML_CONTENT_STATE)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1428	break;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1429	*nextTokPtr = ptr + 2;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1430	*encPtr = encodingTable[UTF_16BE_ENC];
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1431	return XML_TOK_BOM;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1432	/* 00 3C is handled in the default case */
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1433	case 0x3C00:
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1434	if ((INIT_ENC_INDEX(enc) == UTF_16BE_ENC
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1435	\|\| INIT_ENC_INDEX(enc) == UTF_16_ENC)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1436	&& state == XML_CONTENT_STATE)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1437	break;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1438	*encPtr = encodingTable[UTF_16LE_ENC];
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1439	return XmlTok(*encPtr, state, ptr, end, nextTokPtr);
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1440	case 0xFFFE:
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1441	if (INIT_ENC_INDEX(enc) == ISO_8859_1_ENC
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1442	&& state == XML_CONTENT_STATE)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1443	break;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1444	*nextTokPtr = ptr + 2;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1445	*encPtr = encodingTable[UTF_16LE_ENC];
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1446	return XML_TOK_BOM;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1447	case 0xEFBB:
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1448	/* Maybe a UTF-8 BOM (EF BB BF) */
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1449	/* If there's an explicitly specified (external) encoding
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1450	of ISO-8859-1 or some flavour of UTF-16
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1451	and this is an external text entity,
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1452	don't look for the BOM,
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1453	because it might be a legal data. */
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1454	if (state == XML_CONTENT_STATE) {
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1455	int e = INIT_ENC_INDEX(enc);
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1456	if (e == ISO_8859_1_ENC \|\| e == UTF_16BE_ENC \|\| e == UTF_16LE_ENC \|\| e == UTF_16_ENC)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1457	break;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1458	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1459	if (ptr + 2 == end)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1460	return XML_TOK_PARTIAL;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1461	if ((unsigned char)ptr[2] == 0xBF) {
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1462	*encPtr = encodingTable[UTF_8_ENC];
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1463	return XML_TOK_BOM;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1464	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1465	break;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1466	default:
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1467	if (ptr[0] == '\0') {
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1468	/* 0 isn't a legal data character. Furthermore a document entity can only
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1469	start with ASCII characters. So the only way this can fail to be big-endian
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1470	UTF-16 if it it's an external parsed general entity that's labelled as
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1471	UTF-16LE. */
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1472	if (state == XML_CONTENT_STATE && INIT_ENC_INDEX(enc) == UTF_16LE_ENC)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1473	break;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1474	*encPtr = encodingTable[UTF_16BE_ENC];
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1475	return XmlTok(*encPtr, state, ptr, end, nextTokPtr);
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1476	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1477	else if (ptr[1] == '\0') {
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1478	/* We could recover here in the case:
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1479	- parsing an external entity
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1480	- second byte is 0
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1481	- no externally specified encoding
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1482	- no encoding declaration
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1483	by assuming UTF-16LE. But we don't, because this would mean when
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1484	presented just with a single byte, we couldn't reliably determine
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1485	whether we needed further bytes. */
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1486	if (state == XML_CONTENT_STATE)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1487	break;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1488	*encPtr = encodingTable[UTF_16LE_ENC];
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1489	return XmlTok(*encPtr, state, ptr, end, nextTokPtr);
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1490	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1491	break;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1492	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1493	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1494	*encPtr = encodingTable[INIT_ENC_INDEX(enc)];
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1495	return XmlTok(*encPtr, state, ptr, end, nextTokPtr);
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1496	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1497
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1498
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1499	#define NS(x) x
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1500	#define ns(x) x
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1501	#include "xmltok_ns_c.h"
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1502	#undef NS
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1503	#undef ns
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1504
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1505	#ifdef XML_NS
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1506
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1507	#define NS(x) x ## NS
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1508	#define ns(x) x ## _ns
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1509
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1510	#include "xmltok_ns_c.h"
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1511
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1512	#undef NS
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1513	#undef ns
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1514
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1515	ENCODING *
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1516	XmlInitUnknownEncodingNS(void *mem,
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1517	int *table,
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1518	int (convert)(void userData, const char *p),
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1519	void *userData)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1520	{
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1521	ENCODING *enc = XmlInitUnknownEncoding(mem, table, convert, userData);
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1522	if (enc)
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1523	((struct normal_encoding *)enc)->type[':'] = BT_COLON;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1524	return enc;
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1525	}
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1526
bf3d6e241714 [/trunk] Changeset 41 by mikael mikael parents: diff changeset	1527	#endif /* XML_NS */

author	mikael
	Wed, 06 Apr 2005 12:35:34 +0000
changeset 57	f381236239a4
parent 25	bf3d6e241714
child 237	c8df64f43625
permissions	-rw-r--r--