CHA NCORE NPU'yu İnceleyelim

Jaime Lannister

Kıdemli Üye
1 Ara 2020
3,691
807
Casterly Rock
Merhaba TurkHackTeam üyeleri bugün CHA NCORE NPU'yu inceleyeceğiz.

qludCv.png

YHOrwJ.gif

qludCv.png


images


AI hızlandırıcı yardımcı işlemcisi, kendi özel zil sesi durağı ile çipin geri kalanıyla aynı halkada oturur. NCORE, her biri L3 önbellek dilimlerinden, DRAM'den ve teorik olarak G/Ç'den okuma ve yazma yapabilen iki DMA kanalına sahiptir. NCORE, çeşitli başlangıçlar tarafından eş zamanlı olarak geliştirilen özel sinir işlemcilerinin çoğundan nispeten farklı bir mimariye sahiptir. Bu amaçla, NCORE son derece geniş bir 32.768 bit (4K bayt) VLIW SIMD yardımcı işlemcisidir. Bu, varsayımsal bir "AVX32768" uzantısının neye benzeyeceğine benzer. Yardımcı işlemci, CPU çekirdekleriyle aynı saat frekansında her döngüde 4K'ya kadar mantık hattını kontrol edebilen programlanabilir bir yardımcı işlemcidir. 4K bayt işlemleri her çevrimde mevcuttur.

NCORE tek iş parçacıklıdır. Talimatlar halka aracılığıyla NCORE'a getirilir ve merkezi bir talimat biriminde saklanır. Ünite, 4 KiB talimat ROM'u içeren bir 12 KiB talimat önbelleği içerir. Her döngüde, tek bir 128 bitlik talimat getirilir, kodu çözülür ve aynı anda tüm hesaplama dilimlerini ve belleği kontrol eden bir sıralayıcı tarafından yürütülür. Talimat ROM'u, yaygın olarak kullanılan işlevlerin yanı sıra doğrulama kodunu yürütmek için kullanılır. Yönerge sıralayıcı, çeşitli adresleme modları ve otomatik artış işlemleri üzerinde gerçekleştirmek için on altı adres kaydı ve özel donanım ile birlikte bir döngü sayacı ve çeşitli özel kayıtlar içerir. NCORE veri yolunun tamamı 4.096 bayt genişliğindedir.

NCORE'a giden veriler NCORE önbelleklerine beslenir. Veriler, halka durdurma arabirimindeki iki DMA kanalı tarafından beslenir. Bu DMA kanalları, asenkron olarak diğer önbelleklere veya belleğe gidebilir. Ara sıra veriler, talimatları ve verileri NCORE RAM'e taşıyabilen CPU çekirdeklerinden birinde çalışan aygıt sürücüsünden veya yazılımdan beslenebilir. NCORE, çok büyük ve çok hızlı (tek döngülü) 16 MiB SRAM önbelleğe sahiptir. Önbellek, her biri 4.096 bayt genişliğinde ve 64-bit ECC korumalı iki SRAM bankası - D-RAM ve W-RAM - içerir. Önbellekler, L3 veya DRAM ile uyumlu değil. RAM, NCORE kullanılmadığında bile mevcut olduğundan, belirli bir işlem için (bir seferde 1 işlem) bir çizik yolu olarak kullanılabilir.

images


İki SRAM, CPU çekirdekleriyle aynı saat olan NCORE ile aynı saatte çalışır. Her döngüde en fazla iki okuma (her bankadan bir tane) yapılabilir. 4.096 baytlık bir arayüze sahip olan her banka ile, 8.192 bayta kadar olan her döngü hesaplama arayüzüne okunabilir. Bu, NCORE'un 20.5 TB/s'lik teorik bir tepe okuma bant genişliğine sahip olmasını sağlar. Fiziksel olarak, NCORE'un "dilimler" veya "nöronlar" adı verilen küçük hesaplama birimleri kullanılarak oluşturulduğunu belirtmekte fayda var. Tasarım, gelecekte yeniden yapılandırılabilirliğe izin vermek için bu şekilde yapılır. Tam CHA yapılandırması 16 dilim içerir. Her dilim 256 bayt genişliğinde bir SIMD birimidir ve kendi 2.048 256B genişliğinde satır önbellek dilimi ile birlikte gelir.

NCORE dört bileşene bölünmüştür - önbellekler, sinirsel veri birimi (NDU), sinirsel işlem birimi (NPU) ve çıkış birimi. Önbellekler, NDU ve NPU, tek döngülü döngüler olarak tasarlanmıştır. Bu birimlerin çıktıları, gerektiğinde sürekli olarak çalışabilmeleri için bir sonraki saatte aynı birimlere giriş olarak mevcut olmalıdır. Tamamlanması için birden fazla döngü gerektirebilecek özel çıktı işlevleri dışında, çıktı biriminin çoğu tek döngülü olduğunu unutmayın. Çıkış işlevleri genellikle birkaç milyon döngüde yalnızca bir kez yürütüldüğünden, bu normalde boru hattında herhangi bir türde durmaya neden olmaz.

images


8BfzfS111434df5fdd155e.md.png

zcIPpR.gif
 

METE _HAN

Katılımcı Üye
16 Eyl 2021
895
565
root💀kali
Merhaba TurkHackTeam üyeleri bugün CHA NCORE NPU'yu inceleyeceğiz.

qludCv.png

YHOrwJ.gif

qludCv.png


images


AI hızlandırıcı yardımcı işlemcisi, kendi özel zil sesi durağı ile çipin geri kalanıyla aynı halkada oturur. NCORE, her biri L3 önbellek dilimlerinden, DRAM'den ve teorik olarak G/Ç'den okuma ve yazma yapabilen iki DMA kanalına sahiptir. NCORE, çeşitli başlangıçlar tarafından eş zamanlı olarak geliştirilen özel sinir işlemcilerinin çoğundan nispeten farklı bir mimariye sahiptir. Bu amaçla, NCORE son derece geniş bir 32.768 bit (4K bayt) VLIW SIMD yardımcı işlemcisidir. Bu, varsayımsal bir "AVX32768" uzantısının neye benzeyeceğine benzer. Yardımcı işlemci, CPU çekirdekleriyle aynı saat frekansında her döngüde 4K'ya kadar mantık hattını kontrol edebilen programlanabilir bir yardımcı işlemcidir. 4K bayt işlemleri her çevrimde mevcuttur.

NCORE tek iş parçacıklıdır. Talimatlar halka aracılığıyla NCORE'a getirilir ve merkezi bir talimat biriminde saklanır. Ünite, 4 KiB talimat ROM'u içeren bir 12 KiB talimat önbelleği içerir. Her döngüde, tek bir 128 bitlik talimat getirilir, kodu çözülür ve aynı anda tüm hesaplama dilimlerini ve belleği kontrol eden bir sıralayıcı tarafından yürütülür. Talimat ROM'u, yaygın olarak kullanılan işlevlerin yanı sıra doğrulama kodunu yürütmek için kullanılır. Yönerge sıralayıcı, çeşitli adresleme modları ve otomatik artış işlemleri üzerinde gerçekleştirmek için on altı adres kaydı ve özel donanım ile birlikte bir döngü sayacı ve çeşitli özel kayıtlar içerir. NCORE veri yolunun tamamı 4.096 bayt genişliğindedir.

NCORE'a giden veriler NCORE önbelleklerine beslenir. Veriler, halka durdurma arabirimindeki iki DMA kanalı tarafından beslenir. Bu DMA kanalları, asenkron olarak diğer önbelleklere veya belleğe gidebilir. Ara sıra veriler, talimatları ve verileri NCORE RAM'e taşıyabilen CPU çekirdeklerinden birinde çalışan aygıt sürücüsünden veya yazılımdan beslenebilir. NCORE, çok büyük ve çok hızlı (tek döngülü) 16 MiB SRAM önbelleğe sahiptir. Önbellek, her biri 4.096 bayt genişliğinde ve 64-bit ECC korumalı iki SRAM bankası - D-RAM ve W-RAM - içerir. Önbellekler, L3 veya DRAM ile uyumlu değil. RAM, NCORE kullanılmadığında bile mevcut olduğundan, belirli bir işlem için (bir seferde 1 işlem) bir çizik yolu olarak kullanılabilir.

images


İki SRAM, CPU çekirdekleriyle aynı saat olan NCORE ile aynı saatte çalışır. Her döngüde en fazla iki okuma (her bankadan bir tane) yapılabilir. 4.096 baytlık bir arayüze sahip olan her banka ile, 8.192 bayta kadar olan her döngü hesaplama arayüzüne okunabilir. Bu, NCORE'un 20.5 TB/s'lik teorik bir tepe okuma bant genişliğine sahip olmasını sağlar. Fiziksel olarak, NCORE'un "dilimler" veya "nöronlar" adı verilen küçük hesaplama birimleri kullanılarak oluşturulduğunu belirtmekte fayda var. Tasarım, gelecekte yeniden yapılandırılabilirliğe izin vermek için bu şekilde yapılır. Tam CHA yapılandırması 16 dilim içerir. Her dilim 256 bayt genişliğinde bir SIMD birimidir ve kendi 2.048 256B genişliğinde satır önbellek dilimi ile birlikte gelir.

NCORE dört bileşene bölünmüştür - önbellekler, sinirsel veri birimi (NDU), sinirsel işlem birimi (NPU) ve çıkış birimi. Önbellekler, NDU ve NPU, tek döngülü döngüler olarak tasarlanmıştır. Bu birimlerin çıktıları, gerektiğinde sürekli olarak çalışabilmeleri için bir sonraki saatte aynı birimlere giriş olarak mevcut olmalıdır. Tamamlanması için birden fazla döngü gerektirebilecek özel çıktı işlevleri dışında, çıktı biriminin çoğu tek döngülü olduğunu unutmayın. Çıkış işlevleri genellikle birkaç milyon döngüde yalnızca bir kez yürütüldüğünden, bu normalde boru hattında herhangi bir türde durmaya neden olmaz.

images


8BfzfS111434df5fdd155e.md.png

zcIPpR.gif
Ellerinize sağlık hocam
 
Üst

Turkhackteam.org internet sitesi 5651 sayılı kanun’un 2. maddesinin 1. fıkrasının m) bendi ile aynı kanunun 5. maddesi kapsamında "Yer Sağlayıcı" konumundadır. İçerikler ön onay olmaksızın tamamen kullanıcılar tarafından oluşturulmaktadır. Turkhackteam.org; Yer sağlayıcı olarak, kullanıcılar tarafından oluşturulan içeriği ya da hukuka aykırı paylaşımı kontrol etmekle ya da araştırmakla yükümlü değildir. Türkhackteam saldırı timleri Türk sitelerine hiçbir zararlı faaliyette bulunmaz. Türkhackteam üyelerinin yaptığı bireysel hack faaliyetlerinden Türkhackteam sorumlu değildir. Sitelerinize Türkhackteam ismi kullanılarak hack faaliyetinde bulunulursa, site-sunucu erişim loglarından bu faaliyeti gerçekleştiren ip adresini tespit edip diğer kanıtlarla birlikte savcılığa suç duyurusunda bulununuz.