Annotation of embedaddon/pcre/testdata/testinput15, revision 1.1.1.5
1.1.1.5 ! misho 1: /-- This set of tests is for UTF-8 support but not Unicode property support,
! 2: and is relevant only to the 8-bit library. --/
! 3:
! 4: < forbid W
1.1 misho 5:
1.1.1.2 misho 6: /X(\C{3})/8
7: X\x{1234}
8:
9: /X(\C{4})/8
10: X\x{1234}YZ
11:
12: /X\C*/8
13: XYZabcdce
14:
15: /X\C*?/8
16: XYZabcde
17:
18: /X\C{3,5}/8
19: Xabcdefg
20: X\x{1234}
21: X\x{1234}YZ
22: X\x{1234}\x{512}
23: X\x{1234}\x{512}YZ
24:
25: /X\C{3,5}?/8
26: Xabcdefg
27: X\x{1234}
28: X\x{1234}YZ
29: X\x{1234}\x{512}
30:
31: /a\Cb/8
32: aXb
33: a\nb
34:
35: /a\C\Cb/8
36: a\x{100}b
37:
38: /ab\Cde/8
39: abXde
40:
41: /a\C\Cb/8
42: a\x{100}b
43: ** Failers
44: a\x{12257}b
45:
46: /[]/8
47:
48: //8
49:
50: /xxx/8
51:
1.1.1.5 ! misho 52: /xxx/8?DZSSO
1.1.1.2 misho 53:
1.1.1.4 misho 54: /badutf/8
55: \xdf
56: \xef
57: \xef\x80
58: \xf7
59: \xf7\x80
60: \xf7\x80\x80
61: \xfb
62: \xfb\x80
63: \xfb\x80\x80
64: \xfb\x80\x80\x80
65: \xfd
66: \xfd\x80
67: \xfd\x80\x80
68: \xfd\x80\x80\x80
69: \xfd\x80\x80\x80\x80
70: \xdf\x7f
71: \xef\x7f\x80
72: \xef\x80\x7f
73: \xf7\x7f\x80\x80
74: \xf7\x80\x7f\x80
75: \xf7\x80\x80\x7f
76: \xfb\x7f\x80\x80\x80
77: \xfb\x80\x7f\x80\x80
78: \xfb\x80\x80\x7f\x80
79: \xfb\x80\x80\x80\x7f
80: \xfd\x7f\x80\x80\x80\x80
81: \xfd\x80\x7f\x80\x80\x80
82: \xfd\x80\x80\x7f\x80\x80
83: \xfd\x80\x80\x80\x7f\x80
84: \xfd\x80\x80\x80\x80\x7f
85: \xed\xa0\x80
86: \xc0\x8f
87: \xe0\x80\x8f
88: \xf0\x80\x80\x8f
89: \xf8\x80\x80\x80\x8f
90: \xfc\x80\x80\x80\x80\x8f
91: \x80
92: \xfe
93: \xff
94:
95: /badutf/8
96: \xfb\x80\x80\x80\x80
97: \xfd\x80\x80\x80\x80\x80
98: \xf7\xbf\xbf\xbf
99:
100: /shortutf/8
101: \P\P\xdf
102: \P\P\xef
103: \P\P\xef\x80
104: \P\P\xf7
105: \P\P\xf7\x80
106: \P\P\xf7\x80\x80
107: \P\P\xfb
108: \P\P\xfb\x80
109: \P\P\xfb\x80\x80
110: \P\P\xfb\x80\x80\x80
111: \P\P\xfd
112: \P\P\xfd\x80
113: \P\P\xfd\x80\x80
114: \P\P\xfd\x80\x80\x80
115: \P\P\xfd\x80\x80\x80\x80
1.1.1.2 misho 116:
117: /anything/8
118: \xc0\x80
119: \xc1\x8f
120: \xe0\x9f\x80
121: \xf0\x8f\x80\x80
122: \xf8\x87\x80\x80\x80
123: \xfc\x83\x80\x80\x80\x80
124: \xfe\x80\x80\x80\x80\x80
125: \xff\x80\x80\x80\x80\x80
126: \xc3\x8f
127: \xe0\xaf\x80
128: \xe1\x80\x80
129: \xf0\x9f\x80\x80
130: \xf1\x8f\x80\x80
131: \xf8\x88\x80\x80\x80
132: \xf9\x87\x80\x80\x80
133: \xfc\x84\x80\x80\x80\x80
134: \xfd\x83\x80\x80\x80\x80
135: \?\xf8\x88\x80\x80\x80
136: \?\xf9\x87\x80\x80\x80
137: \?\xfc\x84\x80\x80\x80\x80
138: \?\xfd\x83\x80\x80\x80\x80
139:
140: /\x{100}/8DZ
141:
142: /\x{1000}/8DZ
143:
144: /\x{10000}/8DZ
145:
146: /\x{100000}/8DZ
147:
148: /\x{10ffff}/8DZ
149:
150: /[\x{ff}]/8DZ
151:
152: /[\x{100}]/8DZ
153:
154: /\x80/8DZ
155:
156: /\xff/8DZ
157:
158: /\x{D55c}\x{ad6d}\x{C5B4}/DZ8
159: \x{D55c}\x{ad6d}\x{C5B4}
160:
161: /\x{65e5}\x{672c}\x{8a9e}/DZ8
162: \x{65e5}\x{672c}\x{8a9e}
163:
164: /\x{80}/DZ8
165:
166: /\x{084}/DZ8
167:
168: /\x{104}/DZ8
169:
170: /\x{861}/DZ8
171:
172: /\x{212ab}/DZ8
173:
174: /-- This one is here not because it's different to Perl, but because the way
175: the captured single-byte is displayed. (In Perl it becomes a character, and you
176: can't tell the difference.) --/
177:
178: /X(\C)(.*)/8
179: X\x{1234}
180: X\nabc
181:
182: /-- This one is here because Perl gives out a grumbly error message (quite
183: correctly, but that messes up comparisons). --/
184:
185: /a\Cb/8
186: *** Failers
187: a\x{100}b
188:
189: /[^ab\xC0-\xF0]/8SDZ
190: \x{f1}
191: \x{bf}
192: \x{100}
193: \x{1000}
194: *** Failers
195: \x{c0}
196: \x{f0}
197:
198: /Ā{3,4}/8SDZ
199: \x{100}\x{100}\x{100}\x{100\x{100}
200:
201: /(\x{100}+|x)/8SDZ
202:
203: /(\x{100}*a|x)/8SDZ
204:
205: /(\x{100}{0,2}a|x)/8SDZ
206:
207: /(\x{100}{1,2}a|x)/8SDZ
208:
209: /\x{100}/8DZ
210:
211: /a\x{100}\x{101}*/8DZ
212:
213: /a\x{100}\x{101}+/8DZ
214:
215: /[^\x{c4}]/DZ
216:
217: /[\x{100}]/8DZ
218: \x{100}
219: Z\x{100}
220: \x{100}Z
221: *** Failers
222:
223: /[\xff]/DZ8
224: >\x{ff}<
225:
226: /[^\xff]/8DZ
227:
228: /\x{100}abc(xyz(?1))/8DZ
229:
230: /a\x{1234}b/P8
231: a\x{1234}b
232:
233: /\777/8I
234: \x{1ff}
235: \777
236:
237: /\x{100}+\x{200}/8DZ
238:
239: /\x{100}+X/8DZ
240:
241: /^[\QĀ\E-\QŐ\E/BZ8
242:
243: /-- This tests the stricter UTF-8 check according to RFC 3629. --/
244:
245: /X/8
246: \x{d800}
247: \x{d800}\?
248: \x{da00}
249: \x{da00}\?
250: \x{dfff}
251: \x{dfff}\?
252: \x{110000}
253: \x{110000}\?
254: \x{2000000}
255: \x{2000000}\?
256: \x{7fffffff}
257: \x{7fffffff}\?
258:
259: /(*UTF8)\x{1234}/
260: abcd\x{1234}pqr
261:
1.1.1.4 misho 262: /(*CRLF)(*UTF)(*BSR_UNICODE)a\Rb/I
1.1.1.2 misho 263:
264: /\h/SI8
265: ABC\x{09}
266: ABC\x{20}
267: ABC\x{a0}
268: ABC\x{1680}
269: ABC\x{180e}
270: ABC\x{2000}
271: ABC\x{202f}
272: ABC\x{205f}
273: ABC\x{3000}
274:
275: /\v/SI8
276: ABC\x{0a}
277: ABC\x{0b}
278: ABC\x{0c}
279: ABC\x{0d}
280: ABC\x{85}
281: ABC\x{2028}
282:
283: /\h*A/SI8
284: CDBABC
285:
286: /\v+A/SI8
287:
288: /\s?xxx\s/8SI
289:
290: /\sxxx\s/I8ST1
291: AB\x{85}xxx\x{a0}XYZ
292: AB\x{a0}xxx\x{85}XYZ
293:
294: /\S \S/I8ST1
295: \x{a2} \x{84}
296: A Z
297:
298: /a+/8
299: a\x{123}aa\>1
300: a\x{123}aa\>2
301: a\x{123}aa\>3
302: a\x{123}aa\>4
303: a\x{123}aa\>5
304: a\x{123}aa\>6
305:
306: /\x{1234}+/iS8I
307:
308: /\x{1234}+?/iS8I
309:
310: /\x{1234}++/iS8I
311:
312: /\x{1234}{2}/iS8I
313:
314: /[^\x{c4}]/8DZ
315:
316: /X+\x{200}/8DZ
317:
318: /\R/SI8
319:
320: /\777/8DZ
1.1 misho 321:
1.1.1.3 misho 322: /\w+\x{C4}/8BZ
323: a\x{C4}\x{C4}
324:
325: /\w+\x{C4}/8BZT1
326: a\x{C4}\x{C4}
327:
328: /\W+\x{C4}/8BZ
329: !\x{C4}
330:
331: /\W+\x{C4}/8BZT1
332: !\x{C4}
333:
334: /\W+\x{A1}/8BZ
335: !\x{A1}
336:
337: /\W+\x{A1}/8BZT1
338: !\x{A1}
339:
340: /X\s+\x{A0}/8BZ
341: X\x20\x{A0}\x{A0}
342:
343: /X\s+\x{A0}/8BZT1
344: X\x20\x{A0}\x{A0}
345:
346: /\S+\x{A0}/8BZ
347: X\x{A0}\x{A0}
348:
349: /\S+\x{A0}/8BZT1
350: X\x{A0}\x{A0}
351:
352: /\x{a0}+\s!/8BZ
353: \x{a0}\x20!
354:
355: /\x{a0}+\s!/8BZT1
356: \x{a0}\x20!
357:
1.1.1.4 misho 358: /A/8
359: \x{ff000041}
360: \x{7f000041}
361:
362: /(*UTF8)abc/9
363:
364: /abc/89
365:
1.1 misho 366: /-- End of testinput15 --/
FreeBSD-CVSweb <freebsd-cvsweb@FreeBSD.org>