Karakterler ve entity’ler
Entity lerin deklerasyonu ve referans işlemlerinin detaylarında girmeden önce karakterlerin entity’ler içerisinde nasıl kullanıldığını anlamak çok önemlidir.Çünkü XML karakterlerin encoding işlemi sırasında değişik standartlar kullanır ve bu da ona büyük bir esneklik sağlar.XML karakter encoding işleminin temelinde ISO/IEC 10646 Unicode standardı kullanılmaktadır.Bu standart karakter kullanımında inanılmaz bir esneklik sağlar.
Bu standarda ek olarak ISO 8859 veya JIS X-0208-1997 standardı da kullanılabilmektedir.Bu standart terimler size karışık geliyorsa Unicode seçeneğini kullanmak uygun olacaktır.
Karakter encoding deklerasyonu dökümanın başlangıcında karakter encoding decleration denilen kısımda yapılır.Bu deklerasyon kısmı XML attribute deklerasyonuna benzer.
<?xml version="1.0" encoding="UTF-8"?>
Burada UTF-8 değeri yukarıda bahsedilmiş olan ISO/EIC 10646 standardını bir altkümesi olarak düşünülebilir.UTF-8 ve UTF-16 karakter encoding işlemlerinde en sık kullanılan standartlardır ve bu iki encoding standardı hemen hemen tüm XML processor’lar tarafından desteklenmektedir.
Aşağıda karakter encoding işlemlerini içeren bir liste görülmektedir.
şeklindedir.
©
örneğinde bu karakter referans işleminde desimal olarak 169 değerine karşılık gelen karakter değeri(bu copright işaretine karşılık gelir.)
Şimdi copright işaretine karşılık gelen bu karakter değerinin refere edilme işlemine bir gözatalım:
©1999 Emre Ultav
Refere etme işlemi sırasında kullanılan diğer bir teknikde base-16 tekniği yani hexadecimal tekniktir.Bunun genel yazılımı ise
şeklindedir.
Tekniğin temel işleyişi aynıdır.
Decimal olarak 169 değerine sahip olan karakter hexadecimal olarak refere edileceğinde:
©
şeklinde refere edilecektir.
Software AG / TÜRKİYE
Entity lerin deklerasyonu ve referans işlemlerinin detaylarında girmeden önce karakterlerin entity’ler içerisinde nasıl kullanıldığını anlamak çok önemlidir.Çünkü XML karakterlerin encoding işlemi sırasında değişik standartlar kullanır ve bu da ona büyük bir esneklik sağlar.XML karakter encoding işleminin temelinde ISO/IEC 10646 Unicode standardı kullanılmaktadır.Bu standart karakter kullanımında inanılmaz bir esneklik sağlar.
Bu standarda ek olarak ISO 8859 veya JIS X-0208-1997 standardı da kullanılabilmektedir.Bu standart terimler size karışık geliyorsa Unicode seçeneğini kullanmak uygun olacaktır.
Karakter encoding deklerasyonu dökümanın başlangıcında karakter encoding decleration denilen kısımda yapılır.Bu deklerasyon kısmı XML attribute deklerasyonuna benzer.
<?xml version="1.0" encoding="UTF-8"?>
Burada UTF-8 değeri yukarıda bahsedilmiş olan ISO/EIC 10646 standardını bir altkümesi olarak düşünülebilir.UTF-8 ve UTF-16 karakter encoding işlemlerinde en sık kullanılan standartlardır ve bu iki encoding standardı hemen hemen tüm XML processor’lar tarafından desteklenmektedir.
Aşağıda karakter encoding işlemlerini içeren bir liste görülmektedir.
- UTF-8(Unicode)
- UTF-16(Unicode)
- ISO-10646-UCS-2(Unicode)
- ISO-10646-UCS-4(Unicode)
- ISO-8559-1 (ISO-8559-9 üzerinden)
- ISO-2022-JP(JIS X-0208-1997)
- EUC-JP(JIS X-0208-1997)
- Shift_JIS(JIS X-0208-1997)
- decimal referans(base 10)
- hexadecimal referans(base 16)
şeklindedir.
©
örneğinde bu karakter referans işleminde desimal olarak 169 değerine karşılık gelen karakter değeri(bu copright işaretine karşılık gelir.)
Şimdi copright işaretine karşılık gelen bu karakter değerinin refere edilme işlemine bir gözatalım:
©1999 Emre Ultav
Refere etme işlemi sırasında kullanılan diğer bir teknikde base-16 tekniği yani hexadecimal tekniktir.Bunun genel yazılımı ise
şeklindedir.
Tekniğin temel işleyişi aynıdır.
Decimal olarak 169 değerine sahip olan karakter hexadecimal olarak refere edileceğinde:
©
şeklinde refere edilecektir.
Software AG / TÜRKİYE