16 يناير 2017

مراجعة البطاقة الرسومية XFX R7970 Core Edition 3G

– المعمارية الجديدة GCN

لم تتنازل AMD عن مبدأ الحوسبة المتوازية، لكنها قامت بتغيير رئيسي في معمارية GCN هو انتقالها لمفهوم الحوسبة المتوازية على مستوى المهمة، و لنفهم المعمارية الجديدة بشكل أكثر وضوحاً سنقوم بدراستها من القلب.

قلب المعمارية القديمة هو Streaming Processor وقد قامت AMD بإستبداله بـ SIMD أو Single Instruction Multiple Data حقيقي (غير SIMD المستخدم في معماريتها القديمة الذي هو تجميع عدد من Streaming Processors)، حيث يتكون الـ SIMD من 16 وحدة معالجة حسابية ALUs قادرة على حساب المتجهات Vectors مع مسجل بمساحة 64 كيلوبايت، ويعني هذا قدرة SIMD على معالجة تعليمة واحدة و 16 قيمة في التردد الواحد و هذا يعني أن الحزمة Wavefront المكونة من 64 قيمة أو نقطة ستحتاج إلي 4 ترددات كاملة لتتم معالجاتها بشكل كامل داخل SIMD.

وحدة الحساب أو Compute Unit هي وحدة المعالجة الأساسية داخل المعمارية الجديدة، و توضح الصورة السابقة شكل وحدة الحساب و سنقوم بعرض بعض النقاط الهامة التي قد تساعد على فهم المعمارية الجديدة شكل أكبر.

 

  • تتكون Compute Unit من 4 وحدات SIMD (هذا يعني قدرتها على العمل على أربع تعليمات مختلفة في نفس الوقت من نفس الحزمة أو حزم مختلفة).
  • تحتوي Compute Unit على Scalar ALU وهي وحدة معالجة تختص بمعالجة القيم الخاصة والفائقة هي تقوم بمعالجة التعليمات التي لا تستطيع وحدات Vector ALUs معالجاتها، يساعد هذا على زيادة كفاءة المعمارية و تنفذ هذة الوحدة تعليمة واحدة في التردد.
  • تحتوي Compute Unit على 64 كيلو بايت من الذاكرة المشتركة و 16 كيلو من الذاكرة المخباة من المستوى الأول، أيضاً تحتوي على أربع وحدات لمعالجة الإكساءات.
  • تحتوي Compute Unit أيضاً على Hardware Scheduler & Branch unit ( عتاد التوزيع ) و هو المسئول عن جدولة وتوزيع حزم Wavefronts والتعليمات الخاصة بها على وحدات المعالجة و هو من أكبر نقاط التحول في معمارية GCN حيث تم نقل مهمة الجدولة والتوزيع من برنامج القيادة إلي العتاد وهذة الخطوة تقضي على أكبر المشاكل والعقبات التي كانت تواجه AMD في معمارية VLIW.

يقوم عتاد التوزيع بمهمة جدولة وتوزيع البيانات والتعليمات على وحدات المعالجة SIMD حسب أولويتها في التنفيذ In-Order بحيث إن وجد حزمة بيانات أو التعليمات تعتمد على بعضها البعض يقوم بتنفيذ حزمة أخرى غيرها من نفس المهمة Task أو تنفيذ حزمة من مهمة أخري، مما يساعد على زيادة كفاءة المعمارية في معالجة البيانات بدون أهدار للطاقة الحوسبية.

بشكل مختصر معمارية VLIW تعني القيام بتنفيذ العديد من التعليمات من نفس الحزمة في نفس الوقت و بنفس الترتيب، لكن في معمارية GCN يمكن تنفيذ عدة تعليمات بشكل منفرد من نفس الحزمة أو من حزم مختلفة في نفس الوقت.

بعد تناولنا لأهم نقاط الإختلاف الرئيسية بين المعمارية القديمة والجديدة، وشرح طريقة عمل قلب المعمارية الجديدة، سنتناول في الجزء القادم شرح باقي تصميم شريحة المعالج الرسومي حيث قامت AMD بدمج عدد 4 وحدات من Compute Unit لتكون Cluster و هو الجزء الأساسي لبناء معالجاتها الرسومية القادمة، حيث يحتوي Cluster على عدد 256 وحدة معالجة ALUs مقسمة على 16 SIMD.

تقوم شركة AMD بتجميع أي عدد من Clusters (التجميعات) السابقة لتصنع لنا عائلة بطاقاتها الجديدة Southern Island و الصورة التالية توضح شريحة Tahiti التي تحتوي على 8 تجميعات تحتوي على 32 وحدة معالجة Compute Units وعلى 128 SIMD بإجمالي 2048 وحدة معالجة ALUs وكما نلاحظ تحتوي رقاقة المعالج الرسومي على العديد من العتاد والمكونات الأخرى التي سنتاولها بشكل مختصر.

سنبدأ بتناول نظام الذاكرة المخبأة داخل المعمارية حيث يأتي الجيل الجديد بنظام ذاكرة مخبأة جديد حيث يحتوي نظام الذاكرة داخل المعمارية على 16 كيلوبايت من ذاكرة كاش من المستوى الأول لكل وحدة معالجة Compute Unit و مساحة 32 كيلوبايت لتخزين التعليمات، مع ذاكرة من المستوى الثاني بحجم 768 كيلو بايت – و هي أكبر بنسبة 50% من الجيل السابق HD 6900.

 

Asynchronous Compute Engine أو ACEs هو المسئول عن تغذية وحدات الحساب Compute Units و هو يقوم بإستلام الأوامر من النظام و إرسالها لوحدات المعالجة و يقوم أيضاً بتحديد و تخصيص الموارد و تنظيم إستخدامها وأولوياتها.

Graphic Command processor هو الجزء الخاص عن تجميع مخرجات المعالج الرسومي أو البيانات التي تم معالجاتها داخل وحدات المعالج.

Geometry Engines و هي المسئولة عن التفاصيل المجسمة و الترصيع و تأتي شريحة Tahiti بمعالجين ترصيع من الجيل التاسع مما يحسن من أدائها في الترصيع بشكل كبير عن الجيل السابق، كما تتميز هذه المعمارية بقدرتها على التوسع في إضافة هذه الوحدات لمزيد من التحسن في الأداء.

تحتوي شريحة Tahiti على 32 ROPs معالجات الرسم مع عرض ذاكرة بحجم 384bits من نوع DDR5 لتتيح عرض ذاكرة نظري يصل الي 264 GB/s، و قد إستخدمت AMD تصميم على غير المعتاد بفصل وحدات ROPs عن متحكمات الذاكرة و قد مكنها هذا من إستخدام أي عدد ROPs دون الأرتباط بمتحكمات الذاكرة و الذاكرة المخباة.

كان هذا على صعيد تصميم رقاقة Tahiti العتادي، سنتناول في الجزء القادم بعض التقنيات ( العتادية أو البرمجية ) التي قدمتها AMD مع جيل بطاقتها الجديد.

صفحة: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28

Article Tags

Related Posts