Intel'den Veri Merkezi, HPC-AI ve İstemci Bilgi İşlemi İçin Yeni Mimari

Intel; CPU'lar, GPU'lar ve IPU'lar için bir neslin en büyük mimari değişimlerini açıklıyor.

Intel'den En Büyük Mimari Değişimi

Intel'in 2021 Mimari Günü'nde Raja Koduri ve Intel mimarları; iki yeni x86 çekirdek mimarisi hakkında bilgiler verdi. Akıllı Intel® Thread Director iş yükü zamanlayıcısı ile Intel'in "Alder Lake" kod adlı ilk performans hibrit mimarisine ilişkin ayrıntılar açıklanırken; Intel'in veri merkezi için gelecek nesil Intel® Xeon® Scalable işlemcisi "Sapphire Rapids", yeni altyapı işlem birimleri tanıtıldı ve Xe HPG ve Xe HPC mikromimarileri ve Alchemist ile Ponte Vecchio SoCs'u içeren gelecek grafik mimarilerine ilişkin detaylar verildi.

Bu yeni mimariler, yarının yüksek performanslı ürünlerine zemin hazırlayacak ve daha yüksek bilgi işlem gücüne yönelik durmaksızın artan talepleri karşılamayı amaçlayan Intel'in yeni inovasyon çağının temellerini atacak.

Raja Koduri, bu talebi karşılamada mimari ilerlemenin önemine değinerek şöyle konuştu: "Mimari, donanım ve tasarımın simyasıdır. Belirli bir altyapıyı onun için en iyi transistörler ile birleştirir, onları ileri paketleme yoluyla bağlar, yüksek bant genişliği ve düşük güçlü önbellek entegre eder, bir paketteki hibrit bilgi işlem kümeleri için yüksek kapasiteli, yüksek bant genişlikli bellekler ve düşük gecikmeli ölçeklenebilir ara bağlantılar ile bunları donatır. Mimari, bunları yaparken, tüm yazılımların sorunsuz bir şekilde hızlanmasını da sağlar." ... Masaüstünden veri merkezine iş yükleri her zamankinden daha büyük, daha karmaşık ve daha çeşitli hâle gelirken, bugün bahsettiğimiz atılımlar, daha yüksek bilgi işlem performansına yönelik ezici talebi mimarinin nasıl karşılayacağını gösteriyor."

Efficient çekirdek

Intel'in daha önce "Gracemont" kod adını verdiği yeni Efficient çekirdek mikromimarisi, modern çoklu görevler için, iş çıkarma verimliliği ve ölçeklenebilir çok iş parçacıklı performansı sağlamak için tasarlandı. Bu, çok çekirdekli iş yüklerinin çekirdek sayısına göre ölçeklenebilmesini sağlayan agresif bir silikon alan hedefi ile Intel'in en verimli x86 mikromimarisidir. Aynı zamanda geniş bir frekans aralığı da sunmaktadır. Mikromimari ve tasarım çabası, Efficient çekirdeğin daha yüksek frekanslarda işlemek için boşluk payı yaratırken, genel güç tüketimini azaltmak için düşük voltajda çalışmasına olanak tanımaktadır. Efficient core, bu şekilde daha zorlu iş yükleri için performansı artırabilir.

Efficient çekirdek, işlem gücünü israf etmeden iş yüklerini önceliklendirmek ve döngü başına yönergeyi (IPC) iyileştiren özelliklerle performansı doğrudan artırmak için aşağıdakileri de içeren çeşitli teknik ilerlemelerden yararlanır:

  • Daha doğru dallanma öngörüsü sağlayan 5.000 bin girişlik dallanma hedef önbelleği
  • Bellek alt sistemi gücünü harcamadan yararlı yönergeleri yakında tutmak için 64 kilobayt yönerge önbelleği
  • Intel'in ön kod çözme bilgisi üreten ilk isteğe bağlı yönerge uzunluğu kod çözücüsü
  • Intel'in, enerji verimliliğini korurken döngü başına altı yönergeye kadar kod çözme sağlayan kümelenmiş sıralama dışına çıkan kod çözücüsü
  • Beş genişliğinde atama ve sekiz genişliğinde devre dışı bırakma, 256 girişlik sıralama dışına çıkma penceresi ve 17 yürütme bağlantı noktası ile geniş bir arka uç
  • Intel denetim akışı zorlama teknolojisini ve Intel sanallaştırma teknolojisi yönlendirme korumasını destekleyen üstün güvenlik özellikleri
    Tam sayı yapay zekâ (AI) işlemlerini destekleyecek yeni uzantılar ile birlikte AVX ISA'nın uygulanması

Tek iş parçacıklı performansta Intel'in en üretken merkezi işlem birimi (CPU) mikromimarisi olan Skylake SPU'ya kıyasla, Efficient çekirdek aynı güçte %40 daha yüksek performansa ulaşır ya da %40 daha az güç tüketerek aynı performansı sağlar. İş çıkarma yeteneği için, dört Efficient çekirdek; dört iş parçacığı çalıştıran iki Skylake çekirdekten %80 daha yüksek iş çıkarma yeteneği göstermesine rağmen daha az güç tüketir ve aynı performansın %80 oranında daha az güç tüketerek elde edilmesini sağlar.

Performance çekirdek

Intel'in daha önce "Golden Cove" kod adını verdiği, hız için tasarlanan yeni Performance çekirdek mikromimarisi, düşük gecikmeli ve tek iş parçacıklı uygulama performansının sınırlarını zorluyor. İş yükleri, kod ayak izleri büyürken daha fazla yürütme yeteneği talep ediyor. Veri kümeleri de, veri bant genişliği gereksinimleriyle birlikte fazlasıyla büyüyor. Intel'in, yeni Performance çekirdek mikromimarisi, genel amaçlı performansta önemli bir artış sağlar ve büyük kod ayak izli uygulamaları daha iyi destekler.

Performance çekirdek daha geniş, daha derin ve daha akıllı bir mimari sunuyor:

  • Daha Geniş: altı kod çözücü (dörtten yükseldi), sekiz geniş µop önbellek (altıdan yükseldi), 6 atama (beşten yükseldi), 12 yürütme bağlantı noktası (10'dan yükseldi)
  • Daha Derin: Daha büyük kayıt dosyaları, daha büyük fiziksel kayıt dosyaları, 512 girişli daha derin yeniden sıralama arabelleği
  • Daha Akıllı: Geliştirilmiş dallanma öngörüsü doğruluğu, azaltılmış etkili L1 gecikmesi, L2'de tam yazma öngörülü bant genişliği optimizasyonları

Intel'in şimdiye dek yaptığı en yüksek performanslı CPU çekirdek olan Performance çekirdek,  aşağıdakiler ile düşük gecikmeli ve tek iş parçacıklı uygulama performansının sınırlarını zorluyor:

  • Genel amaçlı performans için, ISO frekansta mevcut 11. Nesil Intel® CoreTM işlemci mimarisine (Cypress Cove) kıyasla birçok iş yükünde ~%19'luk geometrik ortalama iyileştirmesi
  • Daha fazla paralelliğe ve yürütme paralelliğinde artışa açık olma
  • Derin öğrenme çıkarımı ve eğitim performansı için; gelecek nesil, yerleşik AI hızlandırma gelişimi olan Intel® Advanced Matrix Extensions. Bu; matris çarpma işlemlerini önemli ölçüde daha hızlı gerçekleştirmek için, ayrılmış donanım ve yeni yönerge kümesi mimarisini içerir.
  • Büyük veriler ve büyük kod ayak izli uygulamalar için daha düşük gecikme ve daha yüksek destek

Alder Lake Client SoC

Daha önce "Alder Lake" kod adı verilen, Intel'in gelecek nesil istemci mimarisi, Intel'in ilk performans hibrit mimarisidir ve tüm iş yükü türlerinde anlamlı performans sağlamak için iki çekirdek türünü (Performance core ve Efficient core) ilk kez birleştirmiştir. Intel 7 işlemci üzerine kurulan Alder Lake, en son belleği ve en hızlı I/O'yu destekler.

Aşağıdaki üç önemli tasarım bileşenine sahip tek, yüksek düzeyde ölçeklenebilir yongada sistem (SoC) mimarisinden faydalanan Alder Lake; ultra taşınabilir dizüstülerden teknoloji tutkunu ve ticari masaüstülere kadar tüm istemci segmentlerini desteklemek için ölçeklenen inanılmaz bir performans sunacak:

  • Liderlik performansı, güç verimliliği, bellek ve I/O'ya sahip olan, maksimum performanslı, iki yongalı, soketli masaüstü
  • Görüntüleme, daha büyük Xe grafikleri ve Thunderbolt 4 bağlantı sağlayan yüksek performanslı bir mobil BGA paketi
  • Optimize edilmiş I/O ve güç dağıtımına sahip olan, ince, daha düşük güçlü, yüksek yoğunluklu bir paket.

Bu kadar yüksek düzeyde ölçeklenebilir bir mimari oluşturmada zor olan, bilgi işlem ve I/O aracılarının inanılmaz bant genişliği taleplerini güçten ödün vermeden karşılamaktır.  Intel, bu zorluğun üstesinden gelmek için, her biri gerçek zamanlı, talebe dayalı buluşsal yöntemlere sahip üç bağımsız yapı tasarladı:

  • Bilgi işlem yapısı, saniyede 1.000 gigabayta (GBp) kadar destekleyebilir - çekirdek başına ya da küme başına saniyede 100 GBp'tır ve çekirdekler ve grafiği, son seviye önbellek üzerinden belleğe bağlar.

               o  Yüksek dinamik frekans aralığı sunar ve gerçek yapı yüklerine dayalı olarak, gecikme-bant genişliği optimizasyonu için veri yolunu dinamik bir şekilde seçebilir

              o Son seviye önbellek politikasını -kapsayıcı ya da kapsayıcı olmayan- kullanıma dayalı olarak dinamik bir şekilde ayarlar

  • I/O yapısı, 64 GBp'a kadar destekleyerek farklı I/O türleri ve dahili aygıtları bağlar. Gereken veri aktarımı miktarını karşılayacak yapı hızını seçerek, aygıtın normal çalışmasına müdahale etmeden hızı sorunsuz bir şekilde değiştirebilir.
  • Bellek yapısı, 204 Gbp'a kadar veri sağlayabilir. Çoklu işletim noktalarını yüksek bant genişliği, düşük gecikme ya da düşük güç için desteklemek üzere, veri yolu genişliğini ve hızını dinamik bir şekilde ölçeklendirebilir.

Intel Thread Director

Intel, Performance ve Efficent çekirdeklerinin işletim sistemi ile sorunsuz bir şekilde çalışması için, Intel Thread Director adlı gelişmiş bir zamanlama teknolojisi geliştirdi. Doğrudan donanımda yerleşik olan Thread Director, çekirdeğin durumuna ve iş parçacığının yönerge karışımına ilişkin düşük seviyeli telemetri sağlar. Bu sayede, doğru iş parçacığını doğru çekirdeğe doğru zamanda yerleştirmek için işletim sistemini güçlendirir. Thread Director, statik kurallara dayalı basit bir yaklaşım benimsemez; dinamik ve uyarlanabilirdir - zamanlama kararlarını gerçek zamanlı bilgi işlem ihtiyaçlarına göre ayarlar.

Geleneksel olarak, işletim sisteminin karar verme süreci, ön plan ve arka plan görevleri gibi mevcut sınırlı istatistiklere dayalıydı. Thread Director ise, aşağıdaki yetenekleri sayesinde karar verme sürecine yeni bir boyut katıyor:

  • Daha yüksek performans gerektiren iş parçacıklarını o anda doğru Performance çekirdeğe yönlendirmek için donanım telemetrisini kullanma;
  • Yönerge karışımı, çekirdeğin durumu ve diğer ilgili mikromimari telemetrisini ayrıntılı izleme ve böylece işletim sisteminin daha akıllı zamanlama kararları vermesine yardımcı olma;
  • Microsoft ile işbirliği yaparak, Intel Thread Director'ı Windows 11'de en iyi performans için optimize etme;
  • Geliştiricilerin iş parçacıkları için hizmet kalitesi niteliklerini açıkça belirtmesine izin veren PowerThrottling API'yı genişletme;
  • İş parçacığı güç verimliliğini tercih ederse zamanlayıcıyı bilgilendiren yeni bir EcoQoS sınıflandırması uygulama (bu gibi iş parçacıkları Efficient çekirdeklerde zamanlanır).

Xe HPG Mikromimarisi ve Alchemist SoC'ler

Xe HPG,  oyun ve yaratıcılık iş yükleri için teknoloji meraklısı sınıfı performansına yönelik tasarlanan yeni bir grafik mikromimarisidir. Xe HPG mikromimarisi, SoC'lerin Alchemist ailesine güç katar. İlk ilgili ürünler, Intel® Arc™ markasıyla 2022'nin birinci çeyreğinde piyasaya sunulacak. Xe HPG mikromimarisi; bilgi işlem odaklı, programlanabilir ve ölçeklenebilir bir öğe olan yeni bir Xe çekirdeğe sahiptir.

İstemci grafik yol haritası, Alchemist (önceki adıyla DG2), Battlemage, Celestial ve Sruid SOC'leri içerir. Sunum sırasında, mikromimarinin ayrıntılarını açıklayan Intel; üretim öncesi Alchemist SoC üzerinde gerçek oyun deneyimi, Unreal Engine 5 sağlık testi ve XeSS adı verilen yeni bir nöral tabanlı süper örnekleme teknolojisini gösteren demolar paylaştı

Xe HPG mikromimarisi tabanlı Alchemist SoC'ler, mükemmel ölçeklenebilirlik ve bilgi işlem verimliliği sağlamak için aşağıdaki mimari özelliklerle tasarlandı:

  • DirectX 12 Ultimate için tasarlanan sabit işlevli sekiz görüntü dilimine kadar
  • 16 vektör altyapısı ve 16 matris altyapısı (XMX – Xe Matrix uzantıları olarak anılır) bulunan yeni Xe çekirdekler, önbellek ve paylaşılan yerel bellek
  • DirectX Raytracing (DXR) ve Vulkan Ray Tracing için destekli yeni ışın izleme üniteleri
  • Mimari, mantık tasarımı, devre tasarımı, işlem teknolojisi ve yazılım optimizasyonlarının kombinasyonu sayesinde, Xe LP mikromimarisine kıyasla 1,5 kat frekans artışı ve 1,5 kat performans/vat iyileştirmesi
  • TSMC'nin N6 işlem düğümünde üretilmiştir.

Intel'in grafik alanında gösterdiği çabaların merkezinde, yazılıma öncelik veren bir yaklaşım bulunur:

  • Xe mimarisi, geliştiricilerle yakın işbirliği içinde tasarlanıyor ve endüstri standartlarına uyum sağlıyor.
  • Intel'in ilk yüksek performanslı oyun grafik işlem birimi (GPU), entegre ve ayrık grafik ürünlerini tek birleştirilmiş kod tabanında bir araya getiren bir sürücü tasarımıyla performans ve kaliteye öncelik verir.
  • Temel grafik sürücü bileşenlerinin, özellikle bellek yönetimi ve derleyicinin yeniden mimarisini tamamlayan Intel, CPU'ya bağımlı oyunlar için %15 daha fazla (ve %80 seviyesinde) iş çıkarma yeteneği ve %25 daha iyi oyun yükleme süreleri sağlıyor.

XeSS

XeSS, yüksek performans ve yüksek kaliteli görseller sağlayan yeni bir çözünürlük yükseltme teknolojisi sunmak için Alchemist'in yerleşik XMX AI hızlandırmasından yararlanır.  Doğal yüksek çözünürlüklü görüntü işleme kalitesine yakın görüntüleri sentezlemek için derin öğrenmeyi kullanır. Oynanması için daha düşük kalite ayarları ya da daha düşük çözünürlükler gereken oyunlar, XeSS sayesinde daha yüksek kalite ayarlarında ve çözünürlüklerde akıcı bir şekilde çalışabilir.

  • XeSS, komşu piksellerden alt piksel ayrıntılarını ve hareket dengelemeli önceki pikselleri yeniden yapılandırarak çalışır.
  • Yeniden yapılandırma, yüksek performans ve mükemmel kalite sağlamak için eğitilmiş, 2 kata kadar performans artışı sunan nöral bir ağ tarafından gerçekleştirilir.
  • XeSS; DP4a yönerge kümesinden yararlanır ve entegre grafik donanımını da içeren geniş bir donanım setinde, AI tabanlı süper örnekleme sunar.
  • Birçok oyun geliştiricisi, XeSS ile ilgilenirken; ilk XMX versiyonu için SDK, ISV'ler için bu ay, DP4a versiyonu ise bu yılın ilerleyen dönemlerinde çıkacak.

Gelecek Nesil Intel Xeon Ölçeklenebilir İşlemci (kod adı: "Sapphire Rapids")

Sapphire Rapids, Intel'in en büyük veri merkezi platformu gelişimini temsil ediyor. Dinamik ve giderek daha talepkâr hale gelen veri merkezi kullanımlarında sağlam bilgi işlem performansı sağlayan işlemci; bulut, mikro hizmetler ve AI gibi elastik bilgi işlem modellerinde yüksek performans sağlayacak şekilde, iş yükü için optimize edilmiştir.

Sapphire Rapids'in merkezinde; monolitik bir CPU arabiriminin yararlarını muhafaza ederken büyük ölçeklenebilirlik sunmak için Intel'in gömülü çoklu kalıp arabağlantı köprüsü (EMIB) paketleme teknolojisinden yararlanan; karolu, modüler bir SoC mimarisi bulunmaktadır. Sapphire Rapids, her iş parçacığının önbellekler, bellek ve I/O dahil tüm karolardaki tüm kaynaklara tam erişiminin bulunduğu, tek dengeli bir birleşik bellek erişimi mimarisi sağlar. Sonuçta, tüm SoC genelinde tutarlı düşük gecikme ve yüksek kesitli bant genişliğine ulaşır.

Intel 7 işlem teknolojisi üzerine kurulu olan Sapphire Rapids; hız için tasarlanan ve düşük gecikmenin ve tek iş parçacıklı uygulama performansının sınırlarını zorlayan, Intel'in yeni Performance çekirdek mikromimarisini kullanır.

Neredeyse tüm müşteri yüklerinde ve kullanımlarda performansı artırmayı amaçlayan Sapphire Rapids; yeni yönerge seti mimarisi ve entegre IP gibi, endüstrinin, veri merkezi alanındaki en geniş yelpazeli hızlandırıcılarını bir araya getirir. Yeni yerleşik hızlandırma altyapıları, şunları içerir:

  • Intel® Accelerator Interfacing Architecture (AIA) – Hızlandırıcılar ve aygıtlara verimli dağıtımı, senkronizasyon ve işaretlemeyi destekler.
  • Intel Advanced Matrix Extensions (AMX) – Sapphire Rapids'in getirdiği; derin öğrenme algoritmalarının merkezinde bulunan tensör işlemede büyük bir hız artışı sağlayan yeni bir hızlandırma altyapısı. Döngü başına 2K INT8 ve 1K BFP16 işletimle bilgi işlem yeteneklerinde artış sağlayabilir. Sapphire Rapids silikon kullanan optimize dahili matris çarpma mikro referans noktaları; Intel AMX yönerge kümesi uzantıları sayesinde, Intel AVX-512 VNNI yönergeler kullanan aynı mikro referans noktası versiyonuna kıyasla 7 kat daha hızlı çalışır ve hem eğitim hem de çıkarım için AI iş yüklerinde büyük performans kazançları sağlar.
  • Intel® Data Streaming Accelerator (DSA) – Veri merkezi ölçekli dağıtımlarda görülen ek yüke neden olan en yaygın veri hareketi görevlerini boşaltmak için tasarlanmıştır. Intel DSA, daha yüksek genel iş yükü performansı sağlamak için bu ek yük görevlerinin işlenmesini iyileştirir ve verileri; CPU, bellek ve önbellekler, tüm iliştirilmiş bellek, depolama ve ağ aygıtları arasında taşıyabilir.

Bu mimari ilerlemeler sayesinde Sapphire Rapids; bulut, veri merkezi, ağ ve akıllı uçta en geniş iş yükleri ve dağıtım modelleri için mükemmel ve alışılmadık bir performans sunar.

İşlemci; PCIe 5.0, CXL 1.1, DDR5 ve HBM teknolojilerini de içeren yeni nesil I/O ve ileri bellek ile endüstri teknoloji geçişlerini yönlendirmek için tasarlanmıştır.

Altyapı İşlem Birimi (IPU)

IPU, bulut ve iletişim hizmeti sağlayıcılarının ek yükü azaltmasını ve CPU'ların performansını artırmasını sağlamak için tasarlanmış programlanabilir bir ağ aygıtıdır.

Intel'in IPU tabanlı mimarisinin birçok önemli avantajı vardır:

  • Altyapı işlevleri ile kiracı iş yükünün güçlü bir şekilde ayrılması, kiracıların CPU üzerinde tam kontrol kazanmasına olanak tanır;
  • Bulut operatörü, altyapı görevlerini IPU'ya taşıyarak CPU kullanımı ve geliri en üst seviyeye çıkarabilir;
  • IPU'lar depolama trafiğini yönetebilir ve bu sayede, depolama kapasitesi disksiz bir sunucu mimarisi aracılığıyla verimli bir şekilde kullanılırken gecikme azalır. Müşteriler IPU sayesinde; işlem ve depolamayı dengelemelerini sağlayan güvenli, programlanabilir ve istikrarlı bir çözümle kaynakları daha iyi kullanabilir.

"Aynı model herkese uygun değildir" mottosunu benimseyen Intel, IPU mimarisine daha derin bir bakış getirdi ve IPU ailesinin, çeşitli ve dağınık veri merkezlerinin karmaşıklığını gidermek için tasarlanan aşağıdaki yeni üyelerini tanıttı.

Mount Evans, Intel'in ilk ASIC IPU'sudur. Mimarisi en önemli bulut hizmeti sağlayıcılarından biriyle birlikte tasarlanan ve geliştirilen Mount Evans, birden fazla FGPA SmartNIC neslinden öğrenmeleri birleştirir.

  • Hiper ölçeğe hazırdır ve üst düzeyde kontrol sağlarken yüksek performanslı ağ ve depolama sanallaştırma işlevleri boşaltması sunar.
  • Güvenlik duvarları ve sanal yönlendirme gibi kullanım durumlarını mümkün kılan, sınıfının en iyisi programlanabilir paket işleme motorunu sağlar.
  • NVMe aygıtlara denk olmak ve onları aşmak için; Intel Optane teknolojisinden yükseltilen, donanım hızlandırmalı NVMe depolama arabirimi uygular.
  • İleri kripto ve sıkıştırma hızlandırma uygulayarak yüksek performanslı Intel® Quick Assist teknolojisini güçlendirir.
  • DPDK ve SPDK gibi yaygın olarak kullanılan yazılım ortamlarını kullanarak programlanabilir ve işlem hattı, Intel'in Barefoot Anahtar Birimi'nin öncülüğünü yaptığı P4 programlama dili kullanılarak yapılandırılabilir.

Oak Springs Canyon; Intel® Xeon-D  ve güç, verimlilik ve performans açısından endüstrinin lider FGPA'i olan Intel® AgilexTM FPGA ile aşağıdakiler için oluşturulmuş bir IPU referans platformudur:

  • Açık sanal anahtar (OVS) gibi ağ sanallaştırma işlevlerini ve Yapı üzerinde NVMe ve RoCE v2 gibi depolama işlevlerini boşaltmak ve daha güvenli, yüksek hızlı 2x100 gigabit Ethernet ağı arabirimi sağlayan sertleştirilmiş bir kripto bloğu sağlamak;
  • Intel ortakları ve müşterilerinin; ölçeklendirilebilir, kaynağı erişilebilir bir yazılım ve donanım altyapısı olan Intel Open FPGA Stack ile çözümlerini özelleştirmelerini sağlamak.
  • x86'da optimize edilmiş olan DPDK ve SPDK gibi mevcut, yaygın olarak kullanılan yazılım ortamları kullanarak programlanmak.

Kod adı "Arrow Creek" olan Intel N6000 Acceleration Development Platform, Xeon tabanlı sunucularla kullanım için tasarlanan bir SmartNIC'dir. Özellikleri:

  • Güç, verimlilik ve performans açısından endüstrinin lider FGPA'i olan Intel'in Agilex FPGA'i; yüksek performanslı 100 gigabit ağ hızlandırma için Intel Ethernet 800 Serisi Denetleyici;
  • Dünyanın en önemli iletişim hizmet sağlayıcılarının (CoSP'ler) bazılarında kullanılmakta olan Intel PAC-N3000'in başarısını temel alan; CoSP'lerin Juniper Contrail, OVS ve SRv6 gibi esnek hızlandırılmış iş yükleri sunmasını sağlayan, çeşitli altyapı iş yükleri için destek.

Xe HPC ve Ponte Vecchio

Xe HPC mikromimarisini kullanan Ponte Vecchio; AI, yüksek performanslı bilgi işlem (HPC) ve ileri analiz iş yüklerini hızlandırmak için, endüstri lideri FLOP'lar ve bilgi işlem yoğunluğu sunar. Xe HPC mikromimarisinin IP bloğuna dair ayrıntıları açıklayan Intel; Xe-core başına sekiz Vector ve Matrix altyapısı (XMX – Xe Matris eXtensions olarak anılır), dilim ve yığın bilgisi ve Compute, Base ve Xe karoları için işlem düğümleri gibi bilgiler verdi. Mimari Günü'nde; Intel, Ponte Vecchio silikonun popüler bir AI kıyaslamasında şimdiden lider performans gösterdiğini ve endüstride, hem çıkarım hem de eğitim iş çıkarma rekoru kırdığını gösterdi.1 Intel'in A0 silikonu, 45 TFLOPS FP32'dan daha fazla iş çıkarma yeteneği, 5 TBps'tan yüksek bellek yapısı bant genişliği ve 2 TBps'tan fazla bağlanabilirlik bant genişliği sağlıyor. Intel, her ikisi de performans liderliği sağlama yolunda ilerleyen saniyede 43.000 görüntünün üzerindeki ResNet çıkarım performansı ve saniyede 3.400 görüntüden daha fazla ResNet eğitimini gösteren bir demoyu da paylaştı.1

Ponte Vecchio, kendini karolar halinde gösteren ve karolar arasında düşük güçle yüksek hızlı bir bağlantı sağlayan bir EMIB karosu aracılığıyla monte edilen çeşitli karmaşık tasarımlardan oluşuyor. Tüm bu tasarımlar; güç ve ara bağlantı yoğunluğu için, aktif silikonun 3D yığınlamasını oluşturan Foveros pakette bir araya getiriliyor. Yüksek hızlı bir MDFI ara bağlantısı, bir yığından iki yığına ölçeklemeye olanak tanıyor.

Bilgi İşlem Karosu, yoğun bir Xe çekirdekleri paketi ve Ponte Vecchio'nun kalbidir.

  • Bir karonun, bilgi işlemi güç verimliliğiyle sağlamanın anahtarı olan toplam 4MB L1 önbellekli sekiz Xe çekirdeği bulunuyor.

TSMC'nin en ileri işlem teknolojisi olan N5'te oluşturuldu.

  • Intel; tasarım altyapısı kurulumu, araç akışları ve bu düğüm için karoları test edebilecek ve doğrulayabilecek metodoloji ile zemini hazırladı.
  • Karoda, Foveros ile 3D yığınlama için son derece sıkı bir 36-mikron "bump pitch" vardır

Temel Karosu, Ponte Vecchio'nun bağ dokusudur. Foveros teknolojisi için optimize edilen Intel 7 ile oluşturulan büyük bir kalıptır.

  • Temel Karosu, tüm karmaşık I/O ve yüksek bant genişliği bileşenlerinin SoC altyapısı -PCIe Gen5, HBM2e bellek, karo-karo ve EMIB köprülerini bağlamak için MDFI bağlantıları- ile bir araya geldiği yerdir
  • Yüksek 2D arabağlantılı ve düşük gecikmeli süper yüksek bant genişlikli 3D bağlantı sayesinde, sonsuz bir bağlanabilirlik makinesi haline gelir.
  • Intel teknoloji geliştirme ekibi; bant genişliği, "bump pitch" ve sinyal bütünlüğü gereksinimlerini karşılamak için çalıştı.

Xe Bağlantı Karosu, karo başına sekiz bağlantıyı destekleyen GPU'lar arasında bağlanabilirliği sağlar.

  • HPC ve AI için ölçek yükseltmede kritiktir.
  • Intel'de desteklenen en hızlı SerDes'i hedefler - 90G'e kadar.
  • Bu karo, Aurora Exascale süper bilgisayar için ölçek yükseltme çözümünü sağlamak üzere eklendi.

Ponte Vecchio; açık, geçerlik sınamasında ve sınırlı sayıda müşteri tarafından denenmeye başladı. Ponte Vecchio, HPC ve AI pazarları için 2022 yılında piyasaya çıkarılacak.

oneAPI

oneAPI endüstri inisiyatifi; açık, standartlara dayalı birleşik bir yazılım yığını sağlar. Tüm mimariler ve satıcılara yönelik bu yığın, geliştiricilerin şirketlere ait tescilli diller ve programlama modellerinden kurtulmasına olanak tanır. Şu anda Nvidia GPU'lar, AMD GPU'lar ve Arm CPU'lar için Data Parallel C++ (DPC++) ve oneAPI kitaplık uygulamaları vardır. oneAPI; bağımsız yazılım satıcıları (ISV'ler), işletim sistemi satıcıları, son kullanıcılar ve akademisyenler tarafından geniş çapta benimsenmektedir. Önemli endüstri liderleri; özellikleri, ek kullanım durumları ve mimarileri destekleyecek şekilde geliştirmeye yardım ediyor. Intel'in; belirli dil ve kitaplıkların ötesinde derleyiciler, çözümleyiciler, hata ayıklayıcılar ve taşıma ayarları ekleyen temel oneAPI temel araç setini içeren ticari bir ürünü de bulunuyor.

oneAPI, mimariler arasında uyumluluk sağlayarak geliştirici üretkenliğini ve inovasyonu iyileştirir:

  • Intel'in oneAPI araç takımlarının, 200.000'den fazla benzersiz yüklemesi vardır;
  • 300'ü aşkın uygulama, piyasada oneAPI'ın birleşik programlama modelini kullanıyor;
  • Intel oneAPI Toolkits'i kullanan Xe HPC mikromimaride, 80'den fazla HPC ve AI uygulaması işlevseldir;
  • Geçici versiyon 1.1'ın Mayıs ayında piyasaya çıkarılan özellikleri, derin öğrenme iş yükleri için yeni grafik arabirimleri ve ileri ışın izleme kitaplıkları sağlıyor ve yıl sonuna kadar tamamlanması bekleniyor.

Okuyucu Yorumları

İlk yorum yapan siz olun
Sen de yorum yaz