XML Karakterler ve entity’ler

CorsaiR

Emektar
27 Ara 2005
1,228
18
Çekirdekten
Karakterler ve entity’ler
Entity lerin deklerasyonu ve referans işlemlerinin detaylarında girmeden önce karakterlerin entity’ler içerisinde nasıl kullanıldığını anlamak çok önemlidir.Çünkü XML karakterlerin encoding işlemi sırasında değişik standartlar kullanır ve bu da ona büyük bir esneklik sağlar.XML karakter encoding işleminin temelinde ISO/IEC 10646 Unicode standardı kullanılmaktadır.Bu standart karakter kullanımında inanılmaz bir esneklik sağlar.

Bu standarda ek olarak ISO 8859 veya JIS X-0208-1997 standardı da kullanılabilmektedir.Bu standart terimler size karışık geliyorsa Unicode seçeneğini kullanmak uygun olacaktır.

Karakter encoding deklerasyonu dökümanın başlangıcında karakter encoding decleration denilen kısımda yapılır.Bu deklerasyon kısmı XML attribute deklerasyonuna benzer.


<?xml version="1.0" encoding="UTF-8"?>



Burada UTF-8 değeri yukarıda bahsedilmiş olan ISO/EIC 10646 standardını bir altkümesi olarak düşünülebilir.UTF-8 ve UTF-16 karakter encoding işlemlerinde en sık kullanılan standartlardır ve bu iki encoding standardı hemen hemen tüm XML processor’lar tarafından desteklenmektedir.

Aşağıda karakter encoding işlemlerini içeren bir liste görülmektedir.

  • UTF-8(Unicode)
  • UTF-16(Unicode)
  • ISO-10646-UCS-2(Unicode)
  • ISO-10646-UCS-4(Unicode)
  • ISO-8559-1 (ISO-8559-9 üzerinden)
  • ISO-2022-JP(JIS X-0208-1997)
  • EUC-JP(JIS X-0208-1997)
  • Shift_JIS(JIS X-0208-1997)
XML, karakter referans için iki tekniği destekler:

  • decimal referans(base 10)
  • hexadecimal referans(base 16)
Decimal character referans karakterin, sayısal olarak 10 tabanına gore refere edilmesi ilkesine dayanır.Decimal referans işlemi (&#) işaretini takiben karakter numarasının yazılması ve sona semicolon(;) konulması sonucu elde edilir. Genel yazımı:





şeklindedir.


©


örneğinde bu karakter referans işleminde desimal olarak 169 değerine karşılık gelen karakter değeri(bu copright işaretine karşılık gelir.)

Şimdi copright işaretine karşılık gelen bu karakter değerinin refere edilme işlemine bir gözatalım:


©1999 Emre Ultav


Refere etme işlemi sırasında kullanılan diğer bir teknikde base-16 tekniği yani hexadecimal tekniktir.Bunun genel yazılımı ise





şeklindedir.

Tekniğin temel işleyişi aynıdır.

Decimal olarak 169 değerine sahip olan karakter hexadecimal olarak refere edileceğinde:


©


şeklinde refere edilecektir.

Software AG / TÜRKİYE
 
Üst

Turkhackteam.org internet sitesi 5651 sayılı kanun’un 2. maddesinin 1. fıkrasının m) bendi ile aynı kanunun 5. maddesi kapsamında "Yer Sağlayıcı" konumundadır. İçerikler ön onay olmaksızın tamamen kullanıcılar tarafından oluşturulmaktadır. Turkhackteam.org; Yer sağlayıcı olarak, kullanıcılar tarafından oluşturulan içeriği ya da hukuka aykırı paylaşımı kontrol etmekle ya da araştırmakla yükümlü değildir. Türkhackteam saldırı timleri Türk sitelerine hiçbir zararlı faaliyette bulunmaz. Türkhackteam üyelerinin yaptığı bireysel hack faaliyetlerinden Türkhackteam sorumlu değildir. Sitelerinize Türkhackteam ismi kullanılarak hack faaliyetinde bulunulursa, site-sunucu erişim loglarından bu faaliyeti gerçekleştiren ip adresini tespit edip diğer kanıtlarla birlikte savcılığa suç duyurusunda bulununuz.