UTF8 string class/de

From Lazarus wiki
Revision as of 20:39, 17 January 2022 by FpTuxe (talk | contribs) (Created page with "{{LanguageBar|TbUtf8}} __TOC__ == Was ist TbUtf8? == Mit TbUtf8 kann man auf einfache Weise Utf8 Strings verändern. == Problem == Bei Lazarus (Free Pascal) ist der String...")
(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)
Jump to navigationJump to search

Deutsch (de) English (en)

Was ist TbUtf8?

Mit TbUtf8 kann man auf einfache Weise Utf8 Strings verändern.

Problem

Bei Lazarus (Free Pascal) ist der String UTF8 kodiert. Allerdings ist der Type „String“ nichts anderes als ein dynamisches Byte- Array. Length liefert die Anzahl der Bytes im Array aber nicht die Anzahl der Zeichen. Bei UTF8 kann ein Zeichen 4Byte groß sein und mit kombinierten Zeichen sogar 7 Byte. Ein Beispiel soll das veranschaulichen. ‚Thomas‘ 6 Zeichen, 6 Byte groß. ‚Thömäs‘ 6 Zeichen, 8 Byte groß.

Lösung

Mit TbUtf8 kann man jetzt auf einfache Weise UTF8 Strings mit Sonder- und kombinierten Zeichen, wie „üäößẶặǺǻǼǽǞǟǍǎḂḃÞþÇçĆćĊċ…“ verändern und durchsuchen. Im wesentlichen besteht die Bibliothek aus einer UTF8 String Klasse (TIbUtf8).