[an error occurred while processing this directive] [an error occurred while processing this directive][an error occurred while processing this directive] [an error occurred while processing this directive] [an error occurred while processing this directive] [an error occurred while processing this directive] (none) [an error occurred while processing this directive] [an error occurred while processing this directive] [an error occurred while processing this directive] [an error occurred while processing this directive] [an error occurred while processing this directive][an error occurred while processing this directive]
[an error occurred while processing this directive][an error occurred while processing this directive] [an error occurred while processing this directive][an error occurred while processing this directive] [an error occurred while processing this directive] [an error occurred while processing this directive] [an error occurred while processing this directive] (none) [an error occurred while processing this directive] [an error occurred while processing this directive] [an error occurred while processing this directive][an error occurred while processing this directive]![]() |
![]() |
![]() |
|||||||||||||||||||||||||
|
|||||||||||||||||||||||||||
![]() |
![]() |
![]() |
On Fri, Jul 01, 2005 at 04:09:01PM +0200, Lars Aronsson wrote: > Jacob Sparre Andersen wrote: > > > Ole Laursen skrev: > > > Selv hvis POSIX skulle tillade det, kan man simpelthen > > > ikke - der er ufatteligt mange programmer der er bygget op > > > om at char er en byte. > > > > Ufatteligt mange defekte programmer med andre ord. > > Snälla Jacob, vad handlar den här diskussionstråden om? Har du > startat ett personligt korståg mot UTF-8? Är det inte minst tio > år för sent? > > Datatypen "char" i (ANSI) C/C++ är en 8-bits lagringsenhet och har > inte nödvändigtvis något med skrivbara tecken att göra. För > kinesiska eller japanska tecken har det aldrig gått att använda > "char", utan endera har man använt "int" eller "wchar_t". > Funktionen getchar() returnerar en int som är positiv för tecken > och -1 för end-of-file, så inte ens för engelska är all > teckenhantering i form av "char". > > Alla nya språk av Wikipedia använder UTF-8 och de äldre håller på > att konverteras till UTF-8. Programspråket Java, som lanserades > 1995, har använt UTF-8 som default från starten. Nej, det er ikke rigtigt. Java anvender ucs2- en 16-bits størrelse for tegn. Jeg tror altså at det stadig er 16-bits. Andre nyere sprog bruger 32-bits char. Nogen bruger utf-16, som er en variabel-længde kodning i 16 bit (gys). Hilsen keld
![]() |
![]() |
![]() |
||||||||||||
|
||||||||||||||
![]() | ||||||||||||||
|
||||||||||||||
![]() |
![]() |
![]() |