телевизори. Конзоли. Проектори и аксесоари. Технологии. Цифрова телевизия

Какъв е бутонът на картата Radeon 7900? Семейства видеокарти AMD Radeon Справочна информация. Инструкции за обработка на медии

  • Кодово име на чип: "Tahiti"
  • 4,3 милиарда транзистора (повече от 60% повече от Cayman и точно два пъти повече от Cypress)
  • 384-битова шина на паметта: шест 64-битови широки контролера, поддържащи GDDR5 памет
  • Честота на ядрото: до 925 MHz (за Radeon HD 7970)
  • 32 изчислителна единица GCN, включително 128 SIMD ядра, състоящи се от общо 2048 ALU за изчисления с плаваща запетая (целочислени и плаващи формати, поддръжка за FP32 и FP64 точност в рамките на стандарта IEEE 754)
  • 128 текстурни единици, с поддръжка на трилинейно и анизотропно филтриране за всички текстурни формати
  • 32 ROP единици с поддръжка за режими на антиалиасинг с програмируемо вземане на проби от повече от 16 проби на пиксел, включително с FP16 или FP32 формат на кадров буфер. Пикова производителност до 32 проби на такт, а в режим само Z - 128 проби на такт
  • Интегрирана поддръжка за шест монитора, включително HDMI 1.4a и DisplayPort 1.2

Спецификации на графичната карта Radeon HD 7970

  • Честота на ядрото: 925 MHz
  • Брой универсални процесори: 2048
  • Брой текстурни блокове: 128, смесващи блокове: 32
  • Ефективна честота на паметта: 5500 MHz (4x1375 MHz)
  • Тип памет: GDDR5
  • Капацитет на паметта: 3 гигабайта
  • Честотна лента на паметта: 264 гигабайта в секунда.
  • Теоретична максимална скорост на запълване: 29,6 гигапиксела в секунда.
  • Теоретична честота на дискретизация на текстурата: 118,4 гигатексела в секунда.
  • Два CrossFire конектора
  • PCI Express 3.0 шина
  • Консумирана мощност: от 3 до 250 W
  • Един 8-пинов и един 6-пинов захранващ конектор
  • Дизайн с двоен слот
  • Препоръчителна цена за американския пазар: $549

Спецификации на графичната карта Radeon HD 7950

  • Честота на ядрото: 800 MHz
  • Брой универсални процесори: 1792
  • Брой текстурни блокове: 112, смесващи блокове: 32
  • Ефективна честота на паметта: 5000 MHz (4x1250 MHz)
  • Тип памет: GDDR5
  • Капацитет на паметта: 3 гигабайта
  • Честотна лента на паметта: 240 гигабайта в секунда.
  • Теоретична максимална скорост на запълване: 25,6 гигапиксела в секунда.
  • Теоретична честота на дискретизация на текстурата: 89,6 гигатексела в секунда.
  • Два CrossFire конектора
  • PCI Express 3.0 шина
  • Конектори: DVI Dual Link, HDMI 1.4, два Mini-DisplayPort 1.2
  • Консумирана мощност: от 3 до 200 W
  • Дизайн с двоен слот
  • MSRP в САЩ: $449

Прави впечатление високата сложност на новия чип - 4,3 милиарда транзистора, което е повече от половината от броя на транзисторите в предишния топ графичен процесор. Възможността да се направи такъв сложен кристал стана възможна благодарение на използването на модерна 28-нанометрова технологична технология, а новият чип беше дори малко по-малък като площ от Cayman. И неговите практически характеристики, които влияят на производителността, са значително подобрени: броят на ALU, TMU и шината на паметта. Само броят на ROP блоковете не се увеличи, а честотата на видеопаметта GDDR5 остана на същото ниво.

Принципът на именуване на видеокартите на компанията остава същият. Radeon HD 7970 е най-продуктивното едночипово решение на компанията; след известно време беше пуснат младшият модел HD 7950, обявен малко по-късно. Първоначално HD 7970 нямаше конкуренти на пазара и не замени нито една конкретна видеокарта от линията на AMD, а по-скоро я премести надолу. Що се отнася до сравнението с конкурента, NVIDIA пусна своето 28-нанометрово решение много по-късно.

Новата видеокарта на AMD е оборудвана със същата GDDR5 памет, но нейният обем, вместо 2 гигабайта в предишното поколение, е нараснал до 3 гигабайта. Това се случи поради разширяването на шината на паметта от 256-бита на 384-бита. И сега можете да поставите 1,5 GB или 3 GB на новата платка. Естествено, от маркетингова гледна точка, инсталирането на по-малък обем би било ясен недостатък, така че беше взето решение да се инсталират 3 GB, въпреки че днес това е малко пресилено. Само в излишък високи резолюцииДа, с MSAA 16x 1.5-2 GB не са достатъчни. Въпреки това AMD също има Eyefinity и за игри на три или повече монитора екранният буфер ще заеме много голям обем.

И така, нека разгледаме Radeon HD 7970. Новата видеокарта в горния ценови клас има двуслотова система за охлаждане, затворена с обичайната за всички съвременни AMD платкипластмасов корпус по цялата дължина на картата. Само дизайнът на този корпус се е променил малко, въпреки че задната част все още се простира отвъд печатната платка. Но дизайнът на лентата с щифтове беше променен - ​​за да се подобри охлаждането на видеокартата, единият от двата слота (половината на лентата) беше зает изключително от вентилационен отвор за отстраняване на топлината.

Но потребителите не трябва да страдат от намаляване на броя на DVI конекторите, запоени директно на платката. За тяхно удобство в комплекта ще бъде включен специален HDMI-DVI адаптер, който ще ви позволи да свържете два монитора с DVI конектори. Между другото, консумацията на енергия нова картане по-ниска от тази на Radeon HD 6970, така че трябваше да бъде оборудван с комплект от един 8-пинов и един 6-пинов захранващ конектор.

Но в новия Radeon HD 7970 системата за охлаждане се промени към по-добро. Използват се ново поколение изпарителна камера и нов по-голям охладител, с преоформени лопатки и повишена производителност (осигурен е повече въздушен поток). Резултатът е повишаване на ефективността на охладителя, като същевременно се намалява шумът.

Не е изчезнал и превключвателят Dual BIOS firmware, за който писахме в описанието на Radeon HD 6900. Накратко: видеокартата има две BIOS версия, единият с възможност за персонализирано флашване, а вторият с фърмуер, монтиран фабрично. И потребителите, и самата AMD харесаха това удобно решение толкова много, че решиха да продължат да ги пакетират с решения от най-висок клас.

Можем само да приветстваме това решение, което наистина помага в различни случаи, свързани с неочаквани проблеми по време на мигане (прекъсване на захранването по време на процеса, например) и ви позволява безстрашно да извършвате различни експерименти с BIOS изображения. Не е изненадващо, че AMD отново и отново намеква за отличните възможности за овърклок на новата видеокарта:

Както можете да видите, овърклок до честота от 1 GHz и по-висока е практически обещана, ако не вземете предвид малкия надпис (който не беше включен в екранната снимка), че гаранцията престава да важи, дори ако видеокартата се повреди в резултат на експеримент с повишаване на честотата от настройките на видео драйверите.

Архитектурни характеристики на Radeon HD 7970

За да оценим уместността на архитектурните модификации в Южните острови, първо разглеждаме развитието на GPU през последните няколко години, представено от AMD. До 2002 г. графичните чипове бяха специфични Хардуер, способен изключително на графични изчисления. Видеочиповете от онова време имаха ограничена функционалност; те можеха само да прилагат и филтрират текстури, да обработват геометрия и да извършват примитивна растеризация и следователно изобщо не бяха подходящи за универсални изчислителни задачи.

През следващите няколко години основната възможност за програмиране беше добавена към GPU, но също така се фокусира изключително върху графични задачи. Това беше времето на поддръжката на DirectX 8 и 9, програми за шейдъри с ограничена функция и възможност за изчисляване с плаваща запетая. Видеочиповете от онова време имаха специализирани ALU единици за обработка на върхове и пиксели, както и специални кешове за пиксели, текстури и други данни. Гъвкавостта все още не беше дори близо.

Едва през 2007 г. AMD придоби унифицираната шейдърна архитектура DirectX 10, както и възможността за програмиране на GPU с помощта на специални инструменти: CAL, Brook, ATI Stream. Графичните процесори от онова време вече имаха разширено кеширане и поддръжка за локални и глобални споделени данни. Архитектурно, чиповете бяха базирани на VLIW5 и VLIW4 блокове, достатъчно гъвкави за някои основни неграфични изчисления, но все пак фокусирани върху графични алгоритми.

Сега е време за нова архитектура, която е още по-подходяща за изчисления с общо предназначение - Graphics Core Next (GCN). Това е нова архитектурна ера за AMD, поради което е избрано името. Новите графични процесори предлагат отлични възможности за графична обработка и производителност, но направените архитектурни промени са предназначени основно за подобряване на позициите в неграфичните изчисления - повишаване на производителността и ефективността при сложни задачи с общо предназначение. Нов дизайнГрафичният процесор е предназначен за така наречените хетерогенни изчисления - смес от графични изчисления и изчисления с общо предназначение в многозадачна среда. Архитектурата на GCN стана по-гъвкава и трябва да бъде още по-подходяща за енергийно ефективно изпълнение на различни задачи.

Основният блок в новата архитектура е блокът GCN. На тези „градивни елементи“ са базирани всички нови графични процесори от серията Southern Islands. Архитектурата за първи път за графични чипове на AMD използва не-VLIW дизайн; използва векторни и скаларни блокове и е една от най- важни промениТова означава, че всяка от изчислителните единици на GCN има свой собствен планировчик и може да изпълнява инструкции от различни програми (ядро).

Новата изчислителна архитектура е проектирана за висока ефективност при зареждане на изчислителни единици в многозадачна среда. Изчислителната единица GCN е разделена на четири подсекции, всяка от които работи със собствен поток от инструкции всеки такт. Нишките могат също да използват скаларния блок, предоставен от GCN за управление на потока или операции с указател. Комбинацията от векторни и скаларни блокове предлага много прост модел на програмиране. Например указателите на функциите и указателите на стека са много по-лесни за програмиране и задачата на компилатора сега е значително опростена, тъй като изпълнителните единици са скаларни.

Всеки GCN блок има 64 KB специално локално съхранение на данни за обмен на данни или разширяване на стека на локалния регистър. Блокът също така включва кеш от първо ниво с възможности за четене и запис и пълноценен конвейер за текстури (единици за вземане на проби и филтриране). Следователно новото изчислително устройство може да работи независимо, без централен планировчик, който в предишните архитектури отговаряше за разпределянето на работата между устройствата. Сега всеки от GCN блоковете може сам да планира и разпределя команди; един изчислителен блок може да изпълнява до 32 различни командни потока, които могат да бъдат от различни виртуални адресни пространства в паметта и са напълно защитени и независими един от друг.

Предишните GPU архитектури на AMD използваха архитектурните модели VLIW4 и VLIW5 и въпреки че са достатъчно добри за графични задачи, те не са достатъчно ефективни за изчисления с общо предназначение, тъй като е много трудно да се заредят всички изпълнителни единици с работа в такива условия. Новата GCN архитектура предлага същия голям брой изпълнителни единици, но със скаларно изпълнение, което премахва ограниченията и зависимостите на регистрите и инструкциите. Преходът от VLIW архитектура към скаларно изпълнение осигурява забележимо опростяване на задачите за оптимизиране на кода.

Когато изпълнява инструкции на предишната VLIW4 архитектура, компилаторът трябва да се справя с конфликти в регистъра, да извършва сложно разпределение на инструкции към изпълнителните единици на етапа на компилиране на кода и т.н. В същото време постигането на висока производителност често изисква нетривиална оптимизация, която е подходящ за повечето графични задачи и много по-малко гъвкав за други изчисления. Новата архитектура предлага значително опростяване на разработката и поддръжката, опростено създаване, анализ и улавяне на грешки в код на ниско ниво, стабилна и предвидима производителност.

Подсистема за кеширане на паметта

Никога няма достатъчно честотна лента, памет и кешове и винаги има нужда и методи за увеличаването им. Новите графични процесори на AMD използват пълен двустепенен кеш за четене/запис. Всяка изчислителна единица има 16 килобайта кеш от първо ниво, а общият обем на кеша от второ ниво е 768 килобайта (общо чипът има 512 KB L1 и 768 KB L2), което е с 50% повече от предишния чип , който изобщо няма възможности за запис в L2 кеша.

По отношение на производителността, всяка GCN изчислителна единица може да получи или запише 64 байта данни от/към L1 кеша или глобалната памет, която се използва за обмен на данни между нишки на инструкции, в един тактов цикъл. Всяка секция от L2 кеша от второ ниво е в състояние да предава и получава същото количество данни. В резултат графичният процесор от най-висок клас на компанията постига 2 терабайта/s за L1 и 700 GB/s за L2, което е с 50% повече от предишното решение от най-висок клас на AMD.

Tahiti GPU

Сега, след като разгледахме архитектурните промени на ниско ниво в новата серия Southern Islands, време е да преминем към детайлите на най-мощното решение на линията, Radeon HD 7900, което включва два модела. На първо място, нека отбележим изключителната сложност на новия графичен процесор, защото той включва повече от 4,3 милиарда транзистора, което е два пъти повече, отколкото имаше в чипа, на който е базиран Radeon HD 5870! Естествено, такъв мощен чип стана възможен само благодарение на използването на новия 28 nm технологичен процес. И така, какво има той вътре?

Броят на геометричните блокове не се е променил, в сравнение с Cayman, все още има два от тях, но ефективността на тяхната работа е значително увеличена - ще се спрем на това по-подробно малко по-късно. В диаграмата на GPU виждаме 32 изчислителни единици с архитектура GCN, налични на Radeon HD 7970, а в случай на решение от по-нисък клас някои от тях ще бъдат деактивирани. Ако вземем предвид пиковата изчислителна производителност на решението, тя е почти 3,8 терафлопа (операции с плаваща запетая в секунда), което е абсолютен рекорд за GPU до момента.

Всеки GCN блок съдържа 16 текстурни единици, което дава крайна цифра от 128 TMU на чип, или повече от 118 гигатексела/сек – и това е още един рекорд към момента на пускане и няма да е последният. Но броят на блоковете ROP не се е променил, все още има 32 от тях в 8 уголемени блока RBE. Друга интересна архитектурна промяна е, че ROP блоковете вече са „прикрепени“ не към канали на паметта, както беше преди, а към GCN блокове.

Въпреки че теоретично скоростта на запис на кадровия буфер е останала почти непроменена и същите 32 цветови стойности и 128 стойности на дълбочина на часовник са максимално възможни, практическа скоростСкоростта на запълване в реални приложения се е увеличила значително поради увеличената честотна лента на паметта. Според измерванията на AMD, Cayman записва само 23 пиксела на такт, докато новият Tahiti се доближава до теоретичните 32 пиксела на такт.

Това е разбираемо, тъй като новият видео чип на AMD има 384-битова шина на паметта - шест 64-битови канала, точно както сегашното решение от най-висок клас на конкурента. Именно това един път и половина увеличение на честотната лента на паметта прави възможно увеличаването на действителната скорост на извличане на текстури и запис в буфера на кадрите. Ширина на честотната лента от 264 GB/sec би трябвало да помогне да се изстиска близо до теоретичните стойности от 118 гигапиксела/sec и 30 гигапиксела/sec, а в практическата част ще проверим това.

В случай на „изрязания“ Radeon HD 7950 GPU, Tahiti включва 28 активни изчислителни единици на GCN архитектурата от 32 физически налични на чипа. В случай на младшето решение от серията Radeon HD 7970 беше решено да се деактивират четири от тях. Тъй като всяка GCN единица съдържа 16 текстурни единици, общият брой на TMU за новия модел е 112 TMU, което дава производителност от почти 90 гигатексела/сек.

Но броят на ROP единиците и контролерите на паметта в HD 7950 не се е променил, те решиха да не ги режат и да ги оставят на същите 32 и 6 броя, съответно. Следователно видео чипът Tahiti Pro има същата 384-битова шина на паметта, събрана от шест 64-битови канала, като топ решението на AMD. Очевидно изчислителните функционални устройства страдат най-много от производствени дефекти и те решиха да не съкращават всичко останало.

Теселация и обработка на геометрия

От архитектурна гледна точка нищо особено не се е променило в геометричните блокове на Таити след Каймана. Два блока все още се използват за обработка (задаване на върхове и теселиране) на геометрични данни и растеризация и схемата е много подобна на това, което видяхме по-рано, с изключение на това, че теселаторите се наричат ​​9-то поколение:

Въпреки схематичните прилики, последното поколение на тези блокове са способни на значително по-висока производителност на теселация и обработка на геометрията, тъй като блоковете са претърпели значителни модификации. Въпреки че пиковата производителност се увеличи само до почти два милиарда върха и примитиви в секунда (925 MHz и два върха на такт), действителната производителност се увеличи повече. Това беше постигнато чрез увеличаване на размера на кеш паметта, подобряване на буферирането на геометричните данни и повторно използване на данните за върховете.

В резултат на това производителността на теселацията е подобрена във всички триъгълни съотношения до четири пъти в сравнение с предишното поколение Radeon HD 6970. Но четири пъти не се постигат във всички случаи, дори на диаграмата от самата AMD:

Графиката сравнява производителността на теселацията на Radeon HD 7970 спрямо HD 6970 при коефициенти на разделяне, вариращи от 1 до 32. И както можете да видите, разликата в производителността е между 1,7 и 4 пъти. Но това е чиста синтетика. И за да се доближим до реалността, нека предоставим още малко данни за скоростта на теселация в приложенията за игри:

Както можете да видите, синтетичните числа на AMD се поддържат добре от тези за игри - производителността в реални приложения с „тежка“ теселация се е увеличила значително. Това е много добър резултат, който определено ще проверим в практическата част, използвайки примера на синтетика и приложения за игри.

Неграфични изчисления

От гледна точка на хетерогенни и неграфични изчислителни задачи, появата на две асинхронни изчислителни машини (Asynchronous Compute Engines - ACE) е много важна. Те са проектирани да планират и разпределят работата между изпълнителните единици за ефективна многозадачност и работят заедно с графичния команден процесор (Command Processor).

Radeon HD 7900 има два независими изчислителни двигателя и един графичен двигател. Общо това дава три програмируеми блока и три командни потока, напълно отделени един от друг. И в допълнение към асинхронната доставка на команди за бързо превключване на контекста, новият графичен процесор разполага и с два двупосочни контролера за директен достъп до паметта (DMA), въведени в Cayman. Тези два контролера са необходими, за да се възползват напълно от новата шина PCI Express 3.0.

Както знаем, от гледна точка на сериозните изчисления е важна не само скоростта на извършване на операции с плаваща запетая с единична точност, но и с плаваща запетая с двойна точност. И новата архитектура на AMD се справя доста добре с тази задача. В момента се предполага, че има две версии на GCN изчислителни единици, които имат различни скорости на изпълнение на FP64 инструкции. За по-старите графични процесори скоростта на изпълнение е 1/4 от скоростта на FP32, а за по-младите чипове скоростта на изпълнение е 1/16, което е напълно достатъчно за поддържане на съвместимост, но не усложнява много евтините решения. В резултат на това Radeon HD 7970 е способен на 947 милиарда операции с двойна точност в секунда (о, те просто не достигнаха терафлопа!) – това е още едно най-високо постижение на новия чип на AMD.

Освен това, това не са същите гигафлопи, както в случая на предишни архитектури, а по-„дебели“. В края на краищата ефективността на новия GPU при сложни изчислителни задачи трябва да се увеличи значително. Първо, подсистемата за памет и кеширане е подобрена. Второ, всяка GCN изчислителна единица има свой собствен планировчик, който трябва да подобри изпълнението на разклонения код и цялостната ефективност. Е, трето, отбелязваме скаларното изпълнение, което не изисква сложни оптимизации от компилатора, в резултат на което изчислителните единици ще бъдат неактивни много по-рядко. И в резултат на това при всякакви задачи новият чип ще бъде по-лесен за демонстриране висока производителности зареждане на ALU.

Сред другите иновации, свързани с изчислителните възможности, отбелязваме пълната ECC поддръжка за DRAM и SRAM. От страна на софтуера е важно Tahiti да е първият GPU с пълна поддръжка за новите версии на API: OpenCL 1.2, DirectCompute 11.1 и C++ AMP и техните възможности. Например, OpenCL 1.2 ви позволява да комбинирате възможностите на множество изчислителни устройства в едно и AMD вече пусна поддръжка за това под формата на AMD APP SDK 2.6 и драйвера Catalyst 11.12.

Изпълнение и ефективност на архитектурата

След като прегледахме всички архитектурни иновации, използвайки примера на най-добрия чип от серията Southern Island, е време да поговорим за ефективността на всички тези промени. Ясно е, че производителността на новите чипове е много по-висока от тази на предишните, обратното би било доста изненадващо. Въпросът е колко по-бързо. В различни задачи резултатите варират от 40-50% (минимум!) до петкратна разлика. Подобренията в архитектурата му позволяват да надхвърли теоретичните 1,4 пъти разликата в глупавите гигафлопси. Нека да разгледаме това с примери:

Диаграмата сравнява новото топ решение и предишното едночипово решение: Radeon HD 7970 и HD 6970, което е съвсем справедливо. Избраните тестове за производителност са различни: SmallptGPU и LuxMark са проследяване на лъчи на OpenCL, SHA256 е защитен алгоритъм за хеширане, а AES256 е алгоритъм за симетрично криптиране. Е, Манделброт е добре познат проблем, изчислен с двойна точност.

Вертикалната пунктирана линия на графиката отбелязва теоретичната разлика в производителността, но данните за скоростта показват, че при три от пет задачи скоростта на новия GPU е значително по-висока. Това се дължи на всички промени, насочени към повишаване на ефективността: отдалечаване от VLIW, наличие на планировчик във всяка изчислителна единица, подобрено кеширане и т.н.

Промени в качеството на изобразяване

Всъщност тази част спокойно можеше да бъде пропусната, тъй като напоследък нямаше и не може да има особени оплаквания относно качеството на изображението - по различни причини. Например, качеството на антиалиасинг на цял екран сред видеокарти от различни производители е много сходно, особено като се има предвид широкото използване на софтуерни методи за антиалиасинг, използващи филтри за последваща обработка, които се изпълняват абсолютно еднакво на всички графични процесори.

Същото важи и за филтрирането на текстури - сега качеството му е такова, че е много трудно да се направи разлика между решенията на AMD и NVIDIA, дори ако направите сравнение пиксел по пиксел. В Radeon HD 6900 - предишното поколение на компанията - анизотропното филтриране се подобри малко повече и сега дори „микроскопът“ няма да помогне да се намерят значителни недостатъци там. Единственото предупреждение е, че в движение Видео карти Radeonмалко по-нисък от GeForce поради по-забележими специфични артефакти, като „шум“ или „пясък“.

С пускането на видео чипове от ново поколение, теглата на текселите във филтъра за текстури бяха преразгледани отново, модифицирани по такъв начин, че да се намалят подобни артефакти, понякога видими на Radeon HD 6900 при наличието на определени типове текстури („високи -честота”, с резки преходи от тъмно към светло, например). Промените в качеството са толкова трудни за показване с примери, че AMD не предоставя сравнителни снимки на HD 7900 спрямо HD 6900, а просто сравнява качеството на „хардуерния“ алгоритъм с чисто софтуерен, изпълнен на GPU поточни процесори, и следователно идеално:

На такъв малък екран разликата в качеството не се вижда, но AMD уверява, че всички направени промени не са довели до спад в производителността и не са влошили качеството на картината в никакъв аспект - то все още не зависи от ъгъла и качеството на филтриране е близко до идеалното. Определено ще проверим това в някой от следващите практически материали.

Частично резидентни текстури

Идеята на Partially Resident Textures (PRT) е да се използват хардуерните възможности на представения GPU – виртуална памет. Със сигурност много потребители вече са виждали играта RAGE от id Software, която използва технология за виртуално текстуриране, така нареченото мегатекстуриране („MegaTexture“), което прави възможно използването на огромни количества текстурни данни и предаването им във видеопаметта.

Използвайки виртуална видео памет, е много лесно да получите ефективна хардуерна поддръжка за такива алгоритми, което ви позволява да използвате до 32 терабайта текстури в приложение, което прави възможно създаването на уникални места в игрите, без повтарящи се части от текстури и без проблеми със зареждането на текстурни данни. Вярно, AMD дава ясен пример, който е твърде странен, от който нищо не е особено ясно:

PRT ви позволява да постигнете високо качество на картината и спомага за подобряване на ефективността на използването на видео паметта. Подобни алгоритми вече се използват в софтуерния двигател на id и се очаква да се появят в много двигатели от следващо поколение. Игрите на бъдещето трябва да работят с огромни количества данни и предимството на новия GPU е, че локалната графична памет в алгоритми a la PRT работи като хардуерна кеш памет и текстурите се зареждат в нея, когато е необходимо. Графичните процесори от семейството на Южните острови поддържат „мегатекстури“ с обем до 32 терабайта (резолюция до 16384 × 16384) и, най-важното, хардуерно филтриране на текстури за тях, което не е налично на по-ранни видео чипове.

Виртуалните текстури са разделени на парчета с размер 64 килобайта (килобайта, не тексели) и този размер на парчето е фиксиран. И само тези, които са необходими при рендиране на текущия кадър, се зареждат в локалната памет на видеокартата. Технологията работи независимо от формата на текстурата, просто размерите на парчетата в текселите ще бъдат различни. Например, за обикновена некомпресирана текстура с 32 бита на цвят, размерът на парчето ще бъде 128x128 тексела, а за текстура, компресирана във формат DXT3 - 256x256 тексела.

Технологията също така включва използването на mip нива на текстури (умалени копия, използвани при филтриране на текстури). Те изискват множество достъпи по време на изобразяване и филтриране. Нека да разгледаме работата на алгоритъма с пример.

Това изображение подчертава четири различни части от различни mip нива, необходими за рендиране. Когато програма за шейдър поиска данни от тях, някои от частите вече са в локалната памет и тези данни незабавно се изпращат до шейдъра за допълнителни изчисления. Но някои части липсват от таблицата и приложението трябва да избере какво да прави по-нататък при тази липса. Например, можете да поискате данни от ниво на mip с по-ниска разделителна способност, тогава изображението ще бъде размито, но поне ще изглежда като истинско нещо и ще бъде изобразено без забавяне. И докато следващият кадър бъде изобразен, той вече може да бъде зареден в кеша - локалната видео памет. Игралите RAGE ще ни разберат.

Това е мощен алгоритъм, който ви позволява да използвате огромни текстури, които са уникални за всеки обект. Подобни алгоритми отдавна се използват при офлайн рендиране, с изключение на необходимостта от изчисления в реално време. AMD дори направи демонстрация, използвайки техниката Per-Face Texture Mapping, разработена от Walt Disney Animation Studios за техните анимационни филми. За жалост, демо програмаВсе още не е готов и сме виждали само екранни снимки с ниска разделителна способност.

Същността на тази техника за картографиране на текстури е да се присвои специфична част от текстурата на всеки полигон, без да е необходимо да се използва UV трансформация (намиране на съответствие между повърхностните координати на триизмерен обект и координатите на двуизмерна текстура) . Този подход решава някои от проблемите при създаването на теселирано съдържание, като прави алгоритъма за картографиране на изместване много прост. И PRT в този метод се използва за ефективно съхраняване и достъп до текстурни данни.

Инструкции за обработка на медии

Интересна иновация в Южните острови изглежда е поддръжката на специализирани инструкции, използвани при обработката на изображения, статични и динамични. Например, широко използвана инструкция, наречена „сума от абсолютни разлики“, по-известна като SAD (сума от абсолютни разлики), е подобрена. Скоростта на неговото изпълнение е много критично за производителността тясно място на много алгоритми за обработка на изображения и видео, като откриване на движение, разпознаване на жестове, търсене на изображения, компютърно зрениеи много други.

Но в нашия преглед на древната видеокарта Radeon HD 5870 вече писахме за поддръжката на SAD. Сега, в допълнение към обичайния SAD (4 × 1), Южните острови имат нови инструкции- QSAD (quad SAD), който комбинира SAD с оператори за смяна, за да увеличи производителността и енергийната ефективност, и "маскираната" инструкция MQSAD, която игнорира фоновите пиксели и се използва за изолиране на движещи се обекти в рамката от фона.

Новите графични процесори могат да обработват до 256 пиксела на GCN изчислителна единица на такт, което в случая на модела AMD Radeon HD 7970 означава възможност за обработка на до 7,6 трилиона пиксела в секунда в случай на 8-битови целочислени цветови стойности. Въпреки че това е теоретична цифра, възможностите за нови графични процесориза обработка на визуални данни са много впечатляващи - много задачи за обработка на видео могат да се изпълняват в реално време.

PCI Express 3.0

Не можехме да пренебрегнем поддръжката на третата версия на PCI Express от цялата линия нови графични решения на Южните острови. Тази поддръжка беше съвсем очаквана, тъй като спецификациите на третата версия на PCI Express бяха окончателно одобрени през есента на 2010 г., но все още нямаше хардуерни решения с поддръжка за него, въпреки че дънни платкивече се появяват, видеокартите бяха пуснати в края на 2011 г. и централни процесориима съответни.

Актуализираният интерфейс има скорост на трансфер от 8 гигатранзакции в секунда вместо 5 GT/s за версия 2.0, а пропускателната способност отново се е удвоила (до 32 GB/s) в сравнение със стандарта PCI Express 2.0. Новата шина използва различна схема за кодиране за данни, изпратени през шината, но е съвместима с предишната PCI версииЕкспресът беше запазен.

Първите дънни платки, поддържащи PCI Express 3.0, бяха представени през лятото на 2011 г., основно Intel чипсет Z68 и те бяха пуснати в обща продажба едва през есента на същата година. Сега видеокартите пристигнаха и AMD отново изпревари останалите по отношение на скоростта на пускане на нови графични процесори, поддържащи най-модерните технологии. Но дали PCI-E 3.0 ще има някакъв практически смисъл, е твърде рано да се прецени.

Технология AMD PowerTune

Едно от най-интересните нововъведения в Cayman беше усъвършенстваната технология за управление на захранването PowerTune. Гъвкавото управление на мощността на GPU се използва от дълго време, но преди Radeon HD 6900 всички тези технологии бяха доста примитивни и предимно софтуерни методи и променяха честотата и напрежението на стъпки, неспособни да изключат големи части от видео чиповете.

Дори в семейството Radeon HD 5000 се появи ограничител на производителността, когато се превиши определено ниво на потребление, а в Radeon HD 6900 системата се премести на качествено различно ниво. За да направите това, чипът включва специални сензори във всички блокове, които следят параметрите за зареждане. Графичният процесор постоянно измерва натоварването и консумацията на енергия и не позволява на последното да надхвърли определен праг, като автоматично регулира честотата и напрежението, така че параметрите да останат в рамките на зададения термичен пакет.

За разлика от по-ранните технологии за управление на захранването, PowerTune осигурява директен контрол върху консумацията на енергия на GPU, за разлика от индиректния контрол чрез промяна на честотите и напреженията. Тази технология помага да се установи високи честоти GPU, получаване на висока производителност в игрите и не се страхувайте, че консумацията може да надхвърли безопасните граници. В края на краищата, повечето игри и общи приложения, които използват GPU изчисления, имат значително по-ниски изисквания за мощност и не се доближават до опасни граници на консумация на енергия, за разлика от тестовете за стабилност като Furmark и OCCT.

Дори и най-тежките игри не изискват максимална консумация на енергия и ако ограничите консумацията по честота, тествайки видеокарти с екстремни тестове, тогава в случай на 3D игри ще остане доста неизползвани възможностипо отношение на ефективността и храненето. В случай, че видеокартата не е достигнала безопасното ниво на консумация, графичният процесор ще работи на фабрично зададената честота, а при тестовете FurMark и OCCT честотата на графичния процесор ще намалее, за да остане в границите на консумацията.

По този начин PowerTune помага да се зададат по-високи фабрични честоти и да се конфигурира системата да използва най-ефективно GPU ресурсите при зададеното максимално ниво на консумация. В примера, показан по-горе, HD 5870 не използва PowerTune и поради ограничението на честотата на GPU поради високата консумация в тестовете за издръжливост, не използва всичките си възможности. Докато Radeon HD 7970 е настроен на максималния TDP, а видеочипът нулира честотите само когато е превишен, постигайки възможно най-високата производителност във всяко приложение.

Това е ясно показано на следващата диаграма. В случай на приложения за игри, постигането на TDP е възможно чрез увеличаване на честотата на GPU, а при пикови натоварвания тестовете за издръжливост намаляват честотата до безопасно ниво на консумация на енергия. Без PowerTune ще трябва да изберете - или възможността за повреда на видеокартата, когато използвате FurMark и OCCT за дълго време, или да намалите потенциалната производителност в игрите. Нова технологияразрешава тези проблеми възможно най-ефективно.

AMD PowerTune реагира бързо на променящите се условия (микросекунди), защото е хардуерна технология. Той също така се отличава с гъвкави настройки на честотата, а не стъпаловидно, както беше в предишните чипове. Всички измервания са независими от драйвера, но могат да се коригират от потребителя чрез настройките на видеокартата.

Разликата между PowerTune и досегашния общоприет подход е, че в други случаи се използва термично дроселиране, което поставя GPU в режим на значително намалена консумация, докато PowerTune просто плавно намалява честотата си, довеждайки GPU консумацията до зададения лимит. Това постига по-високи тактови честоти и производителност.

Технология AMD ZeroCore

AMD не се ограничи до използването на технология за управление на захранването, вече позната от предишни решения. В първите чипове в семейството на Southern Islands той въвежда технологията AMD ZeroCore, която помага за постигане на още по-голяма енергийна ефективност в режим на „дълбок празен ход“ (или „заспиване“) с деактивирано устройство за показване, което се поддържа от всички операционни системи.

В края на краищата почти всяка система, дори и игрална, прекарва по-голямата част от времето си в режим на ниско натоварване на графичния процесор. И видеокартата не трябва да консумира много енергия в този режим. И още повече, да не говорим за режима с изключен монитор - в този случай е препоръчително да изключите напълно GPU. Това направи AMD. Благодарение на ZeroCore, в състояние на дълбоко бездействие, новият графичен процесор консумира по-малко от 5% от енергията на пълен режим, дезактивирайки повечето функционални блокове в този режим.

AMD предоставя схематично сравнение със собствената си Radeon HD 5870, която не поддържа такава технология. ZeroCore е изключителна иновация на Южните острови, въведена в десктоп решения от мобилни графични процесори, предназначени за лаптопи. Между другото, предимствата на тази технология са свързани не само с намаленото потребление. Освен това, при продължителен idle режим при изключен дисплей, видеокартата също напълно изключва вентилатора на охладителя на видеокартата!

Това е точно това, което много потребители чакат от дълго време. Най-интересното е, че според нашите данни лабораторни тестове на подобни решения PowerTune и ZeroCore са проведени преди няколко поколения видеокарти. Някои от инженерните образци на видеокарти от серията AMD, които отдавна са напуснали пазара, работеха точно по този начин, напълно изключвайки охладителя, когато не се използва.

Но не само потребителите с един GPU ще се възползват от намален шум и консумация на енергия с новите ZeroCore графични карти на AMD. Подобни подобрения очакват щастливите собственици на системи CrossFire, базирани на две, три и дори четири графични процесора. Логично е, че в режим на рисуване на двуизмерен интерфейс операционна системаТрябва ли всички видео карти с изключение на основната изобщо да не работят? Но точно така работят сега!

В случай на системи CrossFire на видеокарти с поддръжка на ZeroCore в 2D режим, всички вторични видеокарти се поставят в дълбок сън с минимална консумация на енергия и охладителят е деактивиран. Този режим работи за няколко едночипови видеокарти и за решения с два чипа. В допълнение, основната графична карта CrossFire също ще влезе в този режим в случай на продължително бездействие, конфигурирано в Windows. Разликата в работата изглежда така:

Между другото, технологията не е толкова проста, колкото може да изглежда. Инженерите на AMD трябваше да решат много проблеми, свързани с работата на операционната система в неактивен режим. Например те откриха, че Windows се опитва да актуализира информацията на екрана дори когато мониторът е изключен. Което, естествено, не ви позволява изобщо да деактивирате GPU. Затова програмистите на компанията трябваше да предприемат заобиколно решение, като игнорират всички команди за рисуване на екрана, когато мониторът е изключен в режим на заспиване.

Технология AMD Eyefinity 2.0

Естествено, в новата архитектура имаше място и за подобрения на доказаната технология за показване на изображения на множество монитори - AMD Eyefinity, вече във версия 2.0. Той получи нови функции, по-високи разделителни способности, поддръжка за повече дисплеи и повишена гъвкавост.

Тази технология е доста интересна, въпреки че много малко потребители ще намерят място в стаята и ще съберат смелост да инсталират повече от два монитора в семейството си. Но е по-добре да имате възможност винаги да можете да го използвате, отколкото да го нямате изобщо. Освен това цените на мониторите с голям диагонал почти не намаляват, но решенията от средно ниво постоянно поевтиняват.

Всъщност сега е по-изгодно да закупите три монитора с диагонал на екрана 24 инча, отколкото един 30-инчов. AMD дава точно такъв пример, когато 30-инчов монитор с резолюция 2560×1600 струва повече от $1000, а три 24-инчови FullHD могат да бъдат закупени на половината от тази цена:

Но как да харчите парите и пространството в стаята е личен въпрос за всеки потребител. Основното е, че такава възможност съществува. Освен това Eyefinity 2.0 вече поддържа извеждане на изображения в HD3D стерео режим - нещо, което липсваше в предишните решения, които бяха по-ниски от конкурентните по този параметър. Комбинирайки технологиите AMD Eyefinity и HD3D, графичната карта Radeon HD 7970 е първото решение с един чип, което поддържа три монитора, работещи в стерео режим.

Стерео изобразяването с висока разделителна способност изисква много бърз интерфейс за данни. И с предишни версии HDMI изходи, възможностите бяха ограничени до 24 Hz на око, което е напълно достатъчно за гледане на филми на Blu-ray 3D, но очевидно твърде ниско за геймърите.

За такива задачи те започнаха да използват формата за пакетиране на кадри, когато рамките за лявото и дясното око се комбинират в едно, а AMD Radeon HD 7970 поддържа формат за пакетиране на кадри HDMI 1.4a за изход на стерео изображение. Това е първата видеокарта, която поддържа 3 GHz HDMI с пакетиране на кадри, когато всяко око получава FullHD картина с честота 60 Hz (общо 120 Hz):

Друг интересен нов продукт ни се струва, че е технологията за многоканален аудио изход Discrete Digital Multi-Point Audio (DDMA), работеща заедно с Eyefinity. Всички предишни графични процесори могат да извеждат само един аудио поток през HDMI и DisplayPort. Тоест, дори ако три монитора, разположени в различни стаи, са свързани към компютъра чрез HDMI, се предава само един аудио канал. Но AMD Radeon HD 7900 получи поддръжка за едновременен изход на няколко независими аудио канала, което може да бъде полезно в някои конфигурации с няколко монитора.

Същата функция ще бъде много полезна за използване при видеоконференции с показване на няколко събеседника на отделни екрани, както и многозадачни приложения, като игра на три монитора с аудио игра и гледане на новини на отделен екран с независим аудио поток. Преди това за всичко това беше необходимо да се използват няколко отделни аудио системи, но сега всичко работи възможно най-удобно.

Софтуерната поддръжка на Eyefinity също не е забравена, технологията се актуализира почти всеки месец - появяват се нови възможности. Така през октомври се появи поддръжка за разделителни способности до 16384x16384 и нови конфигурации с няколко монитора: хоризонтални и вертикални 5x1, както и базирани на шест монитора в режим 3x2.

В декемврийската актуализация на видео драйвера Катализатор AMDстана възможно сътрудничество Eyefinity и HD3D, а през февруари те обещават поддръжка за персонализирани резолюции, персонализирано разположение на лентата на задачите и подобрено управление на предварително зададени настройки.

Изход към шест монитора може да се постигне с помощта на два DisplayPort 1.2 порта и два MST хъба (за които писахме по-рано), докато три или дори четири монитора ще изискват само един порт и съответния хъб. Такива хъбове позволяват гъвкава конфигурация на системата за извеждане на изображения; те поддържат до четири FullHD устройства на DisplayPort 1.2 конектор и трябва да бъдат налични за продажба до лятото на 2012 г.

Говорейки за резолюция. Висока разделителна способност или дори свръхвисока - Ultra High Resolution. Текущите устройства с резолюция от 4000 пиксела от по-голямата страна изискват връзка с помощта на няколко кабела наведнъж: два DP 1.1 или четири DVI. Мониторите с тази резолюция от следващото поколение ще бъдат свързани само чрез един кабел: DP 1.2 HBR2 или HDMI 1.4a 3 GHz. И новата видеокарта на AMD вече е готова за такива монитори, отново стана първата в света.

Видео кодиране и декодиране

Съвсем естествено е, че AMD Radeon HD 7970 включва същия UVD модул за декодиране на видео данни, който се появи в предишното поколение видеочипове на компанията. Той просто не се нуждае от модификации, поддържа многопоточен MVC кодек, декодира MPEG-2/MPEG-4 (DivX), VC-1 и H.264 формати, както и декодира два FullHD потока във всички поддържани формати.

Решенията на AMD осигуряват максимално качество на декодиране на видео поток, използват няколко десетки специални алгоритми за подобряване на качеството и осигуряват максимални резултати при тестове за качество като HQV. Сред поддържаните функции отбелязваме: настройка на цвета и тона, намаляване на шума, изостряне, висококачествено мащабиране, динамичен контраст, усъвършенствано деинтерлейсинг и обратно телесино. Ето пример за подобряване на контраста в движение:

Но декодирането на всички видеочипове е повече или по-малко наред от дълго време. Всички нови графични процесори осигуряват прилично качество и производителност при гледане на видео данни. Но кодирането на видео на GPU е все още в начален стадий и основните оплаквания от потребителите са насочени към ниското качество на полученото компресирано изображение.

Може би новата серия Radeon HD 7000 може да помогне с това, тъй като всички GPU в серията включват Video Codec Engine (VCE) единица за видео кодиране. Моделът Radeon HD 7970 стана първата видеокарта, която поддържа хардуерно ускорено видео кодиране и компресиране с помощта на специализиран модул (преди това поточните процесори участваха в кодирането).

Качеството и производителността трябва да бъдат очевидно по-добри от преди, с поддръжка за 1080p кодиране при 60 кадъра в секунда и дори по-бързо от реално време. Трудно е да се каже нещо за качеството без тестове, но ни се обещават различни нива на оптимизация на енкодера за видео данни и игри, както и променливо качество на компресия (възможност да избирате между повишаване на качеството или производителност).

В момента няма къде да опитате VCE - просто няма приложения, които да го поддържат, но AMD работи с партньори като ArcSoft, за да осигури поддръжка за VCE в съответните софтуерни продукти. В бъдеще планираме да пуснем софтуерна библиотека за ускоряване на видео кодирането, което ще улесни разработчиците да поддържат следващо поколение продукти на AMD.

Кодирането може да се извърши в два режима: пълен и хибриден (използвайки възможностите на GPU поточните процесори). Пълният режим е предназначен за задачи, които изискват максимална енергийна ефективност и постоянни нива на производителност. Кодирането в пълен режим на VCE е по-бързо от реално време и осигурява ниска латентност. Но има и хибриден режим:

В този режим математическите блокове на GPU също работят заедно с VCE. Всички силно успоредни етапи, които са очертани в жълто на диаграмата, могат да използват мощността на GCN изчислителните единици, докато специалното VCE устройство обработва ефективно хардуерно ентропийно кодиране. Този режим е много подходящ за видеокарти с голяма математическа мощност, като например Radeon HD 7970. Остават въпроси относно качеството на тези два режима, но това изисква внимателен анализ в отделна статия.

AMD Steady Video

В допълнение към кодирането и декодирането на видео данни, има друга област, в която може да се използва силата на новата графика от AMD - подобряване на видео Лошо качество, заснети от ръка, без използването на статив или други подобни средства за стабилизиране на изображението. Технологията за стабилизиране на видео се нарича AMD Steady Video, като вече е пусната втората й версия.

Алгоритъмът на работа на софтуерния стабилизатор е доста прост: въз основа на видеопотока се събира статистика за движението на камерата (изместване, въртене, мащабиране) и това движение се компенсира в текущия кадър, спрямо предходните - изображението се измества , завъртян и мащабиран, така че картината да не скача много и да остане стабилна.

Колкото и просто да звучи, толкова е трудно за изпълнение. Просто защото има два милиона пиксела на екрана и до 30 или дори 60 кадъра в секунда.Представете си колко изчисления трябва да се направят, за да се проследят всички възможни измествания на кадрите. Вече писахме по-горе за функцията QSAD, използвана при обработка на видео; тя се използва и в Steady Video 2.0 за ускоряване на алгоритъма за откриване на движение. Така GPU трябва да обработва произволни смени с амплитуда до 32 пиксела във всяка посока и това изисква производителност, съответстваща на повече от 500 милиарда SAD операции в секунда (за 1920x1080 при 60 FPS).

Благодарение на поддръжката на нови QSAD инструкции в Radeon HD 7970, нейното предимство пред мощните процесори в алгоритъма за откриване на движение надхвърля 10 пъти! Това е, видео с високо качествовече ще ни бъде осигурено, и то не само при обработката на домашни видеоклипове във видео редактори, но и при гледане на чужди онлайн видеа, заснети кой знае какво и кой знае как.

Подробности: Radeon HD 7800 серия

  • Кодово име на чип: "Pitcairn"
  • Технология на изработка: 28 nm
  • 2,8 милиарда транзистора (малко повече от Cayman, който е в основата на серията Radeon HD 6900)
  • Унифицирана архитектура с масив от общи процесори за поточна обработка на множество типове данни: върхове, пиксели и др.
  • Хардуерна поддръжка за DirectX 11.1, включително Shader Model 5.0
  • 256-битова шина на паметта: четири 64-битови широки контролера, поддържащи GDDR5 памет
  • Честота на ядрото: до 1000 MHz (за Radeon HD 7870)
  • 20 GCN изчислителни единици, включително 80 SIMD ядра, състоящи се от общо 1280 ALU за изчисления с плаваща запетая (целочислени и плаващи формати, поддръжка за FP32 и FP64 точност в рамките на стандарта IEEE 754)
  • 80 текстурни единици, с поддръжка на трилинейно и анизотропно филтриране за всички текстурни формати
  • 32 ROP единици с поддръжка за режими на антиалиасинг с програмируемо вземане на проби от повече от 16 проби на пиксел, включително с FP16 или FP32 формат на кадров буфер. Пикова производителност до 32 проби на такт, а в режим само Z - 128 проби на такт

Спецификации на графичната карта Radeon HD 7870

  • Честота на ядрото: 1000 MHz
  • Брой универсални процесори: 1280
  • Брой текстурни блокове: 80, смесващи блокове: 32
  • Тип памет: GDDR5
  • Капацитет на паметта: 2 гигабайта
  • Теоретична максимална скорост на запълване: 32,0 гигапиксела в секунда.
  • Теоретична честота на дискретизация на текстурата: 80,0 гигатексела в секунда.
  • Един CrossFire конектор
  • PCI Express 3.0 шина
  • Конектори: DVI Dual Link, HDMI 1.4, два Mini-DisplayPort 1.2
  • Консумирана мощност: от 3 до 175 W
  • Два 6-пинови захранващи конектора
  • Дизайн с двоен слот
  • Препоръчителна цена за американския пазар: $349

Спецификации на графичната карта Radeon HD 7850

  • Честота на ядрото: 860 MHz
  • Брой универсални процесори: 1024
  • Брой текстурни блокове: 64, смесващи блокове: 32
  • Ефективна честота на паметта: 4800 MHz (4x1200 MHz)
  • Тип памет: GDDR5
  • Капацитет на паметта: 2 гигабайта
  • Честотна лента на паметта: 153,6 гигабайта в секунда.
  • Теоретична максимална скорост на запълване: 27,5 гигапиксела в секунда.
  • Теоретична честота на дискретизация на текстурата: 55,0 гигатексела в секунда.
  • Един CrossFire конектор
  • PCI Express 3.0 шина
  • Конектори: DVI Dual Link, HDMI 1.4, два Mini-DisplayPort 1.2
  • Консумирана мощност: от 3 до 130 W
  • Дизайн с двоен слот
  • MSRP за САЩ: $249

И този път принципът на именуване на продуктите на компанията не беше променен и тенденциите от предишната серия бяха продължени. Среднобюджетната серия видеокарти, базирани на архитектурата GCN, се различава от горната и бюджетната линия с втората цифра в индекса: вместо 7 и 9 се поставя числото 8, което е съвсем логично. Тъй като AMD взе психологическия праг от 1000 MHz за честотата на GPU, Radeon HD 7870 получи добавянето на „GHz Edition“ към името, което показва, че тази честота е взета.

От името става ясно, че Radeon HD 7800 е по-производителен от HD 7700, но има по-ниска скорост в сравнение с по-старите модели - HD 7900. Що се отнася до решенията на NVIDIA, по-старият пуснат модел HD 7870 към момента на освобождаване се конкурира с видеокартата GeForce GTX 570, а по-младият е насочен към борба с GTX 560 Ti, а NVIDIA все още не е пуснала нови 28 nm чипове от среден клас.

И двата модела видеокарти на AMD имат GDDR5 памет с еднакъв капацитет от 2 гигабайта. И двете използват 256-битова шина на паметта и могат да бъдат конфигурирани с 1, 2 или 4 GB. 1 GB е твърде малко, а 4 GB е твърде скъпо за този ценови сегмент. Следователно можем да кажем, че е избран идеалният обем от 2 GB видео памет, напълно достатъчен за по-голямата част от игрите, дори във високи разделителни способности, и не твърде скъп от гледна точка на цената.

В противен случай, от потребителска гледна точка, моделите HD 7850 и HD 7870 все още са различни. По-старата Radeon HD 7870 има по-висока консумация на енергия, така че се нуждае от два допълнителни 6-пинови захранващи конектора, докато HD 7850 се задоволява само с един от тях. И двете платки имат дизайн на охладителна система с два слота, но повечето производители произвеждат платки със собствен дизайн поне за охладител или дори за печатна платка.

Архитектурни характеристики на семейството Radeon HD 7800

По-горе в текста внимателно описахме всички характеристики на новата архитектура Graphics Core Next (GCN), така че ще повторим само най-важните. Всички нови GPU на компанията предлагат отлични възможности и производителност не само при графична обработка, но и при неграфични изчисления, включително комбинация от различни видове изчисления. Също така новата архитектура на GCN предлага значително опростяване на задачите за оптимизиране на кода, опростена разработка и поддръжка, както и стабилна и предвидима производителност и като цяло доста висока ефективност.

Базовият блок на новата архитектура е блокът GCN и всички графични процесори от серията Southern Islands са сглобени от тях. Помислете за блоковата схема на чипа Pitcairn:

Диаграмата показва графичния процесор Radeon HD 7870 („опростеният“ HD 7850 се различава от него с няколко деактивирани единици); виждаме 20 изчислителни единици на архитектурата GCN. В случая на младшото решение от серията Radeon HD 7800 четири от тях бяха деактивирани, а броят на активните блокове в него е 16. Това съответства съответно на 1280 и 1024 поточни процесора (точно както в случая с HD 7700 семейство, само че има точно два пъти повече блокове) . Тъй като всеки GCN блок съдържа четири текстурен блок, крайната цифра за броя на TMU за по-стария модел е 80 TMU блока, а за по-младия - 64 TMU.

Но броят на ROP модулите и контролерите на паметта в HD 7870 и HD 7850 също е същият, както в решенията на най-младата линия. Броят на ROP блоковете е оставен доста голям - 32 броя за двата модела. Шината на паметта на платките, базирани на Pitcairn, е намалена до 256-битова; тя е сглобена от четири 64-битови канала. Това не е лошо за решение от такова ниво, въпреки че е един път и половина по-малко, отколкото в горния ред, тъй като шината на паметта традиционно е първото нещо, което се реже. Добре е, че използването на бърза GDDR5 памет даде относително висока честотна лента от 153 GB/s.

Подобно на други чипове с архитектура на GCN, Pitcairn включва теселатор от 9-то поколение, който включва множество оптимизации за буфериране и кеширане, за да подобри значително производителността на обработката на геометрията. Ето сравнение на новата платка на AMD с решението от предишното поколение в синтетичен проблем, което предполага увеличение на скоростта на теселация до четири пъти:

По същия начин се поддържат много технологии на AMD, които бяха въведени и подобрени в новите видео чипове от линията Radeon HD 7000. Ето непълен списък: PowerTune, ZeroCore, Eyefinity 2.0, HD3D, Steady Video, подобрения в качеството на филтриране на текстури и т.н. Всичко това е написано по-подробно по-горе. Нека добавим към списъка, че Radeon HD 7800 поддържа напълно както подобрения алгоритъм за анти-алиасинг MLAA 2.0, така и супер-семплиращ анти-алиасинг (SSAA).

Когато става въпрос за сравнение на производителността на игрите, Radeon HD 7870 е значително по-бърз от прекия си конкурент, GeForce GTX 570, особено като се има предвид липсата на 1,25 GB видео памет в последната (в сравнение с 2 GB в разглежданите решения), наблюдавани в съвременните игри при високи разделителни способности на изобразяване. По-младият Radeon HD 7850 може да се сравни с GeForce GTX 560 Ti и тук вече не може да се похвали с капацитет на паметта. Въпреки това, според измерванията на AMD, тяхното ново решение все още е по-бързо от своя конкурент в повечето игри.

Подробности: Radeon HD 7700 серия

  • Кодово име на чип: "Кабо Верде"
  • Технология на изработка: 28 nm
  • 1,5 милиарда транзистора (по-малко от Barts, който е в основата на серията Radeon HD 6800)
  • Унифицирана архитектура с масив от общи процесори за поточна обработка на множество типове данни: върхове, пиксели и др.
  • Хардуерна поддръжка за DirectX 11.1, включително Shader Model 5.0
  • Честота на ядрото: до 1000 MHz (за Radeon HD 7770)
  • 10 GCN изчислителни единици, включително 40 SIMD ядра, състоящи се от общо 640 ALU с плаваща запетая (формати с цели числа и с плаваща запетая, поддръжка за FP32 и FP64 точност в рамките на стандарта IEEE 754)
  • 40 текстурни единици, с поддръжка на трилинейно и анизотропно филтриране за всички текстурни формати
  • Интегрирана поддръжка за до шест монитора, включително HDMI 1.4a и DisplayPort 1.2

Спецификации на графичната карта Radeon HD 7770

  • Честота на ядрото: 1000 MHz
  • Брой универсални процесори: 640
  • Брой текстурни блокове: 40, смесващи блокове: 16
  • Тип памет: GDDR5
  • Капацитет на паметта: 1 гигабайт
  • Теоретична честота на дискретизация на текстурата: 40,0 гигатексела в секунда.
  • Един CrossFire конектор
  • PCI Express 3.0 шина
  • Конектори: DVI Dual Link, HDMI 1.4, два Mini-DisplayPort 1.2
  • Консумирана мощност: от 3 до 80 W
  • Един 6-пинов захранващ конектор
  • Дизайн с двоен слот
  • Препоръчителна цена за американския пазар: $159

Спецификации на графичната карта Radeon HD 7750

  • Честота на ядрото: 800 MHz
  • Брой универсални процесори: 512
  • Брой текстурни блокове: 32, смесващи блокове: 16
  • Ефективна честота на паметта: 4500 MHz (4x1125 MHz)
  • Тип памет: GDDR5
  • Капацитет на паметта: 1 гигабайт
  • Честотна лента на паметта: 72 гигабайта в секунда.
  • Теоретична максимална скорост на запълване: 12,8 гигапиксела в секунда.
  • Теоретична честота на дискретизация на текстурата: 25,6 гигатексела в секунда.
  • PCI Express 3.0 шина
  • Конектори: DVI Dual Link, HDMI 1.4, един DisplayPort 1.2
  • Консумирана мощност: от 3 до 55 W
  • Не изисква допълнително захранване
  • Дизайн с един слот
  • Препоръчителна цена за американския пазар: $109

Евтина серия от видеокарти, базирани на архитектурата GCN, се различава от горните и средните линии с втората цифра в индекса: числото 9 е заето от числото 7, както беше преди. Radeon HD 7770 е по-продуктивно решение, но има и по-млад модел - HD 7750. По-старата платка към момента на пускането си нямаше директни конкуренти на пазара, намирайки се някъде между GeForce GTX 560 и GTX 550 Ti , а по-младият е насочен към борбата с GTX 550 Ti. За HD 7770 по-късно беше обявен конкурент под формата на GeForce GTX 560 SE (всички решения на NVIDIA са базирани на по-стари графични процесори).

И двата разглеждани модела видеокарти на AMD имат GDDR5 памет с еднакъв капацитет от 1 гигабайт. Поради използването на 128-битова шина на паметта те биха могли да бъдат оборудвани с 2 GB, но такова количество GDDR5 памет би било твърде скъпо за техния ценови сегмент. Ето защо досега са пуснати модели с този обем, въпреки че в бъдеще е възможно да бъдат пуснати варианти с 2 GB видео памет. Засега решиха да оставят този капацитет за HD 7800.

По отношение на други потребителски характеристики, моделите HD 7750 и HD 7770 са доста различни. Ако по-старият Radeon HD 7770 има дизайн на охладителната система с два слота и неговият охладител е покрит с пластмасов корпус като по-старите решения, тогава по-младият HD 7750 изглежда значително по-прост, заема един слот и има обикновен охладител. Повечето производители обаче все още произвеждат дъски със собствен дизайн. Консумацията на енергия при новите модели в този ценови диапазон също е различна, по-старият има един 6-пинов допълнителен конектор за захранване, а по-младият използва захранване, получено през PCI Express.

Архитектурни характеристики на Radeon HD 7700

Основният блок на новата архитектура е блокът GCN и всички графични процесори в серията са сглобени от тях. Всеки от наличните GCN блокове е в състояние сам да планира и разпределя команди, а един изчислителен блок може да изпълни до 32 независими командни нишки. Нека да разгледаме блоковата схема на чипа на Кабо Верде:

Диаграмата показва графичния процесор Radeon HD 7770 ("съкратеният" HD 7750 има няколко деактивирани единици); виждаме 10 изчислителни единици на архитектурата GCN. В случая на младшото решение от серията Radeon HD 7700 беше решено да се деактивират два от тях и броят на блоковете стана 8. Това съответства на 640 и 512 поточни процесори. И тъй като всеки GCN блок съдържа 4 текстурни единици, крайният брой TMU за по-стария модел е 40 TMU, а за по-младия - 32 TMU.

Броят на ROP модулите и контролерите на паметта в HD 7770 и HD 7750 не се различава и те решиха да не намаляват много ROP, оставяйки по 16 от тях. Но шината на паметта на Кабо Верде е съкратена до 128-битова, която е съставена от два 64-битови канала. Като цяло това е три пъти по-малко, отколкото в топ серията, и видяхме още едно потвърждение, че шината на паметта традиционно е първото нещо, което се реже в евтините чипове. Въпреки че използването на бърза GDDR5 памет направи възможно поддържането на относително висока (за такива евтини решения) честотна лента от 72 GB/s.

Всичко, което остава да отбележим, е доста голямото количество кеш от второ ниво - цели 512 килобайта (сравнете със 768 KB за топ чипа - очевидно L2 кешът не заема твърде много място в чипа), т.к. както и подобрения в геометричните характеристики. Подобно на чипа от най-висок клас, Cape Verde разполага с теселатор от 9-то поколение, включващ множество оптимизации за буфериране и кеширане, за да подобри значително производителността на геометричната обработка в сравнение със серията Radeon HD 6000.

Като цяло няма да повтаряме цялата информация за технологиите на AMD, които са въведени и подобрени в новите видео чипове от линията Radeon HD 7000 (ето непълен списък: PowerTune, ZeroCore, Eyefinity 2.0, HD3D, Steady Video, подобрения в качеството на филтриране на текстури и т.н. .p.), всичко това е написано подробно по-горе. Серията HD 7700 поддържа всички характеристики, изброени там, включително AMD Eyefinity 2.0 с шест монитора и стерео изобразяване, а също така има подобрено устройство за декодиране и кодиране на видео.

Но какво да кажем за най-важното нещо – производителността в игрите? Първите оценки на скоростта на изобразяване винаги могат да бъдат направени от презентациите на производителя. AMD смята, че Radeon HD 7770 се намира някъде по средата между GeForce GTX 560 и GeForce GTX 550 Ti, съответно, и я сравнява в материалите си с втория модел на конкурента.

Но те не сравняват Radeon HD 7750 с нищо, просто отбелязват, че повечето съвременни игри могат да се играят на този модел при максимални настройки в FullHD резолюция. Това обаче не е изненадващо, тъй като през последните години практически нямаше PC ексклузиви, а мултиплатформените игри са много по-малко взискателни. Така че платките от серията Radeon HD 7700 са идеални за непретенциозни потребители.

Детайли: модел Radeon HD 7790

  • Кодово име на чип: "Bonaire"
  • Технология на изработка: 28 nm
  • 2,08 милиарда транзистора (повече от Cape Verde в Radeon HD 7700, но по-малко от Pitcairn в Radeon HD 7800)
  • Унифицирана архитектура с масив от общи процесори за поточна обработка на множество типове данни: върхове, пиксели и др.
  • Хардуерна поддръжка за DirectX 11.1, включително Shader Model 5.0
  • 128-битова шина на паметта: два 64-битови широки контролера, поддържащи GDDR5 памет
  • Честота на ядрото: 1000 MHz
  • 14 GCN изчислителни единици, включително 56 SIMD ядра, състоящи се от общо 896 ALU с плаваща запетая (формати с цели числа и с плаваща запетая, поддръжка за FP32 и FP64 точност в рамките на стандарта IEEE 754)
  • 56 текстурни единици, с поддръжка на трилинейно и анизотропно филтриране за всички текстурни формати
  • 16 ROP блока с поддръжка за режими на антиалиасинг с възможност за програмируемо вземане на повече от 16 проби на пиксел, включително с FP16 или FP32 формат на кадровия буфер. Пикова производителност до 16 проби на такт, а в режим само Z - 64 проби на такт

Спецификации на графичната карта Radeon HD 7790

  • Честота на ядрото: 1000 MHz
  • Брой универсални процесори: 896
  • Брой текстурни блокове: 56, смесващи блокове: 16
  • Тип памет: GDDR5
  • Капацитет на паметта: 1 гигабайт
  • Честотна лента на паметта: 96 гигабайта в секунда.
  • Теоретична максимална скорост на запълване: 16,0 гигапиксела в секунда.
  • Теоретична честота на дискретизация на текстурата: 56,0 гигатексела в секунда.
  • Един CrossFire конектор
  • PCI Express 3.0 шина
  • Конектори: DVI Dual Link, HDMI 1.4, два Mini-DisplayPort 1.2
  • Консумирана мощност: от 3 до 85 W
  • Един 6-пинов захранващ конектор
  • Дизайн с двоен слот
  • MSRP за САЩ: $149

Евтиният модел видеокарта, базиран на нов чип от среден бюджет, се различава от предишния топ модел на подсемейството HD 7700 с третата цифра в индекса: вместо 7, те поставят числото 9, което показва увеличение на производителността . В същото време индексът Radeon HD 7790 ясно показва, че това е по-малко мощна видеокарта в сравнение с линията с една стъпка по-висока - HD 7800.

Тук обаче всичко не е толкова просто - със сигурност може да се конкурира с по-младия HD 7850. Но препоръчителната цена на Radeon HD 7790 е определена на $149, т.е. приблизително в средата между цените на HD 7770 и HD 7850. Що се отнася до решенията на конкурент от същия ценови сегмент, пускането на HD 7790 явно имаше за цел да има с какво да се бори с NVIDIA GeForce GTX 650 Ti, базирана на чипа GK106, която се намира точно между HD 7770 и HD 7850 по цена и скорост. Но NVIDIA веднага реагира на пускането на новата платка от AMD, пускайки на пазара овърклокната версия на GeForce GTX 650 Ti Boost, която има по-висока производителност.

Този модел видеокарта на AMD разполага с GDDR5 памет с капацитет от само 1 гигабайт. GPU има 128-битова шина на паметта и теоретично би било възможно да се доставят 2 GB, но това количество бърза GDDR5 памет все още е твърде скъпо за този ценови сегмент и AMD пусна модел с по-малък капацитет, въпреки че може не е достатъчно за някои съвременни игри дори и при не най-високите настройки и резолюция. Въпреки това е възможно да се пуснат видеокарти от партньори с 2 GB видео памет.

Подобно на моделите до него в линията, Radeon HD 7790 има дизайн на охладителната система с два слота, която е покрита с пластмасов корпус. Въпреки че повечето производители все още пускат дънни платки със собствен дизайн на охладителя, така че референтният не е толкова важен. Интересното е, че консумацията на енергия на новия модел не се е увеличила много в сравнение с HD 7770, но подобрението на енергийната ефективност беше очаквано. Между другото, затова и новият продукт има само един 6-пинов конектор за допълнително захранване.

Архитектурни особености

Новият графичен процесор Bonaire, на който е базиран пуснатият модел Radeon HD 7790, принадлежи към същата архитектура Graphics Core Next (GCN), с която сме запознати от година и половина, но AMD го нарича GCN 1.1, намеквайки за малки промени. Всъщност чипът практически не се различава архитектурно от предишните, въпреки че наистина има някои малки промени. Например, новата архитектура въведе инструкции, полезни за Heterogeneous System Architecture (HSA), поддръжка за по-голям брой едновременно изпълнявани нишки и нова версияТехнология AMD PowerTune, за която ще говорим по-късно. Но всички тези промени не могат да се нарекат значителни, защото няма нищо ново в основните блокове и подобряването на тяхната ефективност.

Ето защо можете спокойно да се обърнете към, който внимателно описва всички характеристики на новата архитектура Graphics Core Next (GCN), а тук ще повторим само най-важните характеристики и характеристики на конкретен продукт. Всички най-нови графични процесори на AMD предлагат отлични възможности и производителност както при графични, така и при неграфични изчисления, както и комбинация от двете. Новата архитектура на GCN също значително опрости задачите за оптимизация и разработка на софтуер, като същевременно поддържа висока ефективност.

Както знаете, основният блок на архитектурата е блокът GCN, от който се сглобяват всички графични процесори от серията Southern Islands. Изчислителният блок на GCN е разделен на подсекции, всяка от които работи със собствен команден поток. GCN блоковете имат 64 KB специално локално съхранение на данни за обмен на данни или разширяване на стека на локалния регистър. Блокът също така има кеш от първо ниво с възможности за четене и запис и пълноценен конвейер за текстури с модули за вземане на проби и филтриране. Всеки от съществуващите GCN блокове може сам да планира и разпределя команди, а един изчислителен блок може да изпълнява няколко независими командни потока. Нека да разгледаме блоковата схема на новия чип:

Дизайнът на Bonaire потвърждава целта на новото решение да предлага производителност между Кабо Верде, което има 10 GCN изчислителни единици, и Питкерн с нейните 20 GCN единици. Тези два графични процесора, пуснати през 2012 г., са почти наполовина по-малки един от друг, оставяйки доста голяма разлика в производителността в средата, която Bonaire вече е запълнил.

Диаграмата показва графичен процесор под формата на Radeon HD 7790, което е цялостно решение без намаляване на блокове. Чипът включва 14 изчислителни единици от архитектурата GCN, което съответства на 896 поточни процесора. Тъй като всеки GCN блок съдържа 4 текстурни единици, крайният брой TMU за новия модел е 56 TMU. Тоест, Bonaire е точно 1,4 пъти по-бърз от чипа на Кабо Верде по отношение на скоростта на математическите изчисления и извличането на текстури, като се приемат равни честоти.

Но броят на ROP единиците и контролерите на паметта в Bonaire и Radeon HD 7790 е подобен на това, което видяхме в Кабо Верде и Radeon HD 7770 - те решиха да оставят 16 ROP единици, а шината на паметта на новия чип е 128-битова, събрани от два 64-битови битови канала. Малкият брой ROP блокове може да е „ахилесовата пета“ на решението, тъй като използването на бърза GDDR5 памет направи възможно осигуряването на относително висока честотна лента от 96 GB/s, но нищо не може да се направи за ROP производителността.

Но новият GPU има подобрения в геометричната производителност и скоростта на теселация. Да, Кабо Верде също има теселатор от 9-то поколение, но Bonaire също удвои броя на геометричните блокове, растеризаторите и командните процесори (обозначени като ACE на диаграмата) - сега има два от тях. Това подобрение дава на Bonaire способността да обработва до два геометрични примитиви на часовников цикъл - точно като по-мощните Pitcairn и Tahiti.

Както си спомняте, именно в Radeon HD 7770 AMD за първи път достигна важния психологически крайъгълен камък на тактовата честота на GPU от 1 GHz. И така, HD 7790 също има точно същата референтна честота от 1 GHz, така че увеличението на производителността в сравнение с HD 7770 ще бъде оправдано единствено от архитектурни промени и увеличаване на броя на изпълнителните единици.

Но работната честота на видео паметта на новия продукт е много по-висока. Ако HD 7770 имаше относително ниска честота на паметта от 4,5 GHz, тогава HD 7790 е оборудван с бърза GDDR5 памет, работеща на 6 GHz, което осигурява една трета повече честотна лента. Честотната лента на видео паметта се увеличи с 33% в сравнение с моделите от подсемейството Radeon HD 7700, което доведе до ясно увеличение на производителността при игри. AMD предоставя тази диаграма, сравняваща кадровите честоти на HD 7790 с памет, работеща на 4,5 и 6,0 GHz:

Максималното ускорение от увеличаване на честотната лента на паметта беше постигнато в игри като StarCraft II и Crysis 2. И средно 33% увеличение на честотната лента на паметта дава някъде около 10% увеличение на средната честота на кадрите в набор от съвременни игри . Това е добър показател, който показва, че честотната лента на паметта е доста важна в днешно време, въпреки че не е единственият фокус върху производителността. Въпреки че е напълно възможно, когато Повече ▼ ROP, скоростта на Бонер ще бъде още по-висока...

Ясно е, че средната консумация на енергия се е увеличила леко в сравнение с HD 7770. Ако за стария модел тази стойност е 80 W, то за HD 7790 е 85 W - това е много малка цена за теоретично увеличение на производителността от 33-40%! Архитектурни подобрения (PowerTune), проектиране на нов GPU с опит от работа върху предишни, както и непрекъснато подобряване на техническия процес в TSMC - всичко това доведе до леко увеличение на потреблението при значително подобрениескоростни характеристики.

Що се отнася до площта на чипа и броя на транзисторите в Bonaire, новият чип е очевидно по-голям от Кабо Верде, но добавянето на изчислителни, текстурни и геометрични единици не може да остане незабелязано. Според тези параметри Бонер също се намира приблизително по средата между Кабо Верде и Питкерн. Bonaire съдържа 2,08 милиарда транзистора в 160 mm 2 чип, за Кабо Верде тези цифри са съответно 1,5 милиарда и 123 mm 2, а за Pitcairn - 2,8 милиарда транзистора и 212 mm 2 площ на чипа.

Естествено, новият чип поддържа всички технологии на AMD, които бяха въведени и подобрени в новото семейство Radeon HD 7000 (непълен списък: PowerTune, ZeroCore, Eyefinity, HD3D, Steady Video, подобрено качество на филтриране на текстури и т.н.), и двете всичко това е написано подробно в статията AMD Radeon HD 7970: Новият еднопроцесорен лидер. HD 7790 поддържа всички функции, изброени там, включително AMD Eyefinity 2.0 с шест монитора и стерео изобразяване, а също така има подобрен блок за декодиране и кодиране на видео.

Подобрена технология PowerTune

През 2010 г. AMD представи технологията PowerTune в своя чип Cayman (серия AMD Radeon HD 6900). Този GPU беше първият, който включваше динамично управление на захранването, наречено PowerTune. Той позволява по-високи максимални тактови честоти за типични приложения, като същевременно избягва твърде много консумация на енергия при специализирани тестове за стабилност като FurMark. След това технологията беше приложена към двучиповия модел AMD Radeon HD 6990, който имаше още по-голяма нужда от нея по очевидни причини.

Технологията получи сериозна актуализация в средата на 2012 г., когато към AMD PowerTune беше добавено автоматично повишаване на честотата - Boost. В AMD Radeon HD 7970 GHz Edition този алгоритъм направи възможно допълнително подобряване на производителността в сравнение с обикновената версия на видеокартата. Работният алгоритъм на PowerTune във видеокарти без автоматичен овърклок използва три състояния: празен ход, ниско 3D и пълна скорост. HD 7970 GHz добави и режим за овърклок Boost. PowerTune служи за поддържане на необходимата консумация, като при необходимост преминава към режим на по-ниско натоварване. В този случай технологията рязко намалява тактовата честота. На практика подобни скокове са рядкост - поради голямата разлика между двата активни режима.

Намаляването на тактовата честота на GPU намалява консумацията на енергия, но за повече ефективно управлениенапрежението също трябва да бъде намалено. Което е точно това, което прави Radeon HD 7790. Новият графичен чип Bonaire има осем състояния с различни честоти и напрежения, което позволява по-високи тактови честоти от преди, като същевременно поддържа GPU винаги работещ оптимално напрежениеи честота. Превключването между състояния се основава на натоварването на графичния процесор, както и на текущата консумация на енергия на видеочипа.

В новия алгоритъм PowerTune не трябва рязко да нулира честотата при превишаване на нивото на потребление, а заедно с честотата намалява и напрежението. Преходите между състоянията трябва да бъдат възможно най-бързи, за да не се превиши лимитът на потребление дори за кратко време, така че Bonaire превключва състоянията на PowerTune на всеки 10 ms, тоест състоянието на чипа се променя 100 пъти всяка секунда.

При такава постоянна промяна в честотите приложенията на трети страни като MSI Afterburner и GPU-Z няма да показват моментни стойности на тактовата честота, а средни за определен период от време - така наречената „ефективна“ честота. Друга интересна иновация е, че AMD отваря нови настройки на PowerTune приложения на трети страни. Партньорите могат също така да зададат свои собствени настройки на PowerTune, което ще помогне при създаването на фабрично овърклокнати модели видео карти и ще предостави повече опции, които не са ограничени от референтните стойности на AMD. Вярно ли е, различни настройки PowerTune може да доведе до факта, че видеокартите от един и същи модел от различни производители не само ще имат различни тактови честоти, но и алгоритъма за промяната им във времето, което ще затрудни сравнението при едни и същи условия.

Продажбите на видеокарти Radeon HD 7790 на пазара започнаха в самото начало на април 2013 г. AMD, заедно със своите партньори, организира пускането на двете дънни платки с референтни честоти и фабрично овърклокнати решения. И сега и двата производителя пускат нови видеокарти на пазара по приблизително един и същ начин, с бърза наличност различни опцииот техните партньори. Всъщност партньорите пуснаха почти повече овърклокнати версии на HD 7790 от обикновените, а графичните чипове в тях работят на честоти от около 1075 MHz.

Детайли: модел Radeon HD 7990

  • Кодово име "Малта"
  • Технология на изработка: 28 nm
  • 2 чипа с по 4,3 милиарда транзистора всеки
  • Унифицирана архитектура с масив от общи процесори за поточна обработка на множество типове данни: върхове, пиксели и др.
  • Хардуерна поддръжка за DirectX 11.1, включително Shader Model 5.0
  • Двойна 384-битова шина на паметта: два пъти шест 64-битови широки контролера с поддръжка на GDDR5 памет
  • GPU честота: 1000 MHz
  • Два пъти 32 GCN изчислителни единици, всяка с 128 SIMD ядра, състоящи се от общо 4096 ALU с плаваща запетая (формати с цели числа и с плаваща запетая, поддръжка за FP32 и FP64 точност в рамките на стандарта IEEE 754)
  • 2x128 текстурни единици, с поддръжка на трилинейно и анизотропно филтриране за всички текстурни формати
  • 2x32 ROP единици с поддръжка за режими на антиалиасинг с възможност за програмируемо вземане на проби от повече от 16 проби на пиксел, включително с FP16 или FP32 формат на кадров буфер. Пикова производителност до 64 семпли на такт, а в режим само Z - 256 семпли на такт
  • Интегрирана поддръжка за до шест монитора чрез HDMI 1.4a и DisplayPort 1.2 интерфейси

Спецификации на графичната карта Radeon HD 7990

  • Честота на ядрото: 1000 MHz
  • Брой универсални процесори: 4096
  • Брой текстурни блокове: 2x128, блокове за смесване: 2x32
  • Ефективна честота на паметта: 6000 MHz (4x1500 MHz)
  • Тип памет: GDDR5
  • Капацитет на паметта: 2x3 гигабайта
  • Честотна лента на паметта: 2x288 гигабайта в секунда.
  • Теоретична максимална скорост на запълване: 64 гигапиксела в секунда.
  • Теоретична честота на дискретизация на текстурата: 256 гигатексела в секунда.
  • Един CrossFire конектор
  • PCI Express 3.0 шина
  • Конектори: DVI Dual Link, четири Mini-DisplayPort 1.2
  • Консумирана мощност до 375 W
  • Два 8-пинови конектора за спомагателно захранване
  • Дизайн с двоен слот
  • Препоръчителна цена за Русия - 32 999 рубли. (за САЩ - $999).

Вече във второто поколение видеокарти на AMD принципът на именуване на моделите с два чипа остава непроменен. Най-доброто решение на два мощни видеочипа се различава от модела от предишното поколение, съответстващ на неговия клас в първата цифра в индекса: вместо 6, той получи числото 7, което показва нова серия. Обявената видеокарта се различава от едночиповото решение в третата цифра, което показва максимална производителноств рамките на едно поколение.

Що се отнася до сравнението с конкурентите, основният конкурент на анонсирания днес модел Radeon HD 7990 е видеокартата GeForce GTX 690, пусната преди почти година, и именно тези двучипови решения ще трябва да се борят помежду си. Вярно, NVIDIA има и друго мощно решение, но базирано на един GPU - GeForce GTX Titan, което също може да се счита за конкурент на въпросната платка от AMD.

Новата видеокарта Radeon с два чипа е оборудвана с 3 гигабайта GDDR5 памет за всеки GPU, което се дължи на 384-битовата шина на паметта на чиповете Tahiti. Този обем е доста разумен за такъв продукт високо ниво, тъй като в някои съвременни приложения за игри с максимални настройки, активиран anti-aliasing и високи разделителни способности, по-малко количество памет (2 гигабайта на чип или по-малко) може вече да не е достатъчно. И още повече, когато рендирате в стерео режим или на няколко монитора в режим Eyefinity.

Ясно е, че такава мощна двучипова видеокарта има масивна двуслотова охладителна система, която се различава от традиционните охладители за AMD карти. Той разполага с масивен радиатор, скрит под корпус с три големи вентилатора, работещи на относително ниски обороти. Консумацията на енергия на карта с два графични процесора на борда е доста висока по очевидни причини и има два 8-пинови конектора за захранване, но поне това не са три, както беше в нереферентните проби, базирани на два чипа Tahiti .

Архитектура

Тъй като видеокартата с кодово име "Malta" е базирана на два графични процесора "Tahiti" от семейството на Южните острови, можете просто да се обърнете към, което внимателно описва всички характеристики на текущата архитектура Graphics Core Next (GCN). В основните материали повтаряме само най-важните характеристики и характеристики на конкретни продукти.

Основният блок на архитектурата е блокът GCN, от който са сглобени всички графични процесори в серията. Изчислителната единица е разделена на подсекции, всяка от които работи със собствен поток от инструкции, има специално локално съхранение на данни, L1 кеш за четене и запис и конвейер за пълна текстура с модули за извличане и филтриране. Всеки от GCN блоковете може сам да планира и разпределя команди, а един изчислителен блок може да изпълнява няколко независими командни потока. Radeon HD 7990 използва два чипа Tahiti, които вече са ни известни:

Диаграмата на графичния процесор (има два такива в Radeon HD 7990) показва 32 изчислителни блока на архитектурата GCN и всички те са активни. По-рано се предполагаше, че за решение с два чипа ще е необходимо да деактивирате някои от тях и дори да намалите честотата, за да влезете в границите на консумация на енергия от 375 W, но инженерите на AMD успяха успешно да решат този труден проблем. Може би е пусната специална нова ревизия на Tahiti с намалена консумация на енергия или чиповете просто преминават през много строг процес на подбор.

Тъй като всяка GCN единица съдържа 16 текстурни единици, броят на TMU е 128 единици на чип, което дава крайна производителност от 256 гигатексела в секунда, което е много добро за конкурент на GeForce GTX 690. Брой ROP единици и контролери на паметта в HD 7990 също не се промени в сравнение с неговия аналог с един чип, те бяха оставени съответно на 32 и 6 броя на GPU. Radeon HD 7990 има двойни 384-битови шини на паметта, съставени от дванадесет 64-битови канала, което осигурява обща честотна лента на паметта от 576 GB/s – още една рекордна цифра.

Иначе новата платка поддържа всичко модерни технологииКомпании на AMD, които бяха внедрени и подобрени в новите видео чипове от линията Radeon HD 7000: PowerTune, ZeroCore, Eyefinity 2.0, HD3D, Steady Video, подобрено качество на филтриране на текстури и др. Всичко това е написано подробно по-горе в описанието на Radeon HD 7970 и просто няма смисъл да го повтаряме.

Охладителна система и консумация на енергия

В случай на такива сериозни двучипови платки, високоефективната система за охлаждане става особено важна. Ако в случай на решения от партньори, базирани на два Tahiti, бяха използвани решения с три слота, а в случая на ASUS ARES II беше използвано водно охлаждане, в този случай беше необходимо да се направи с по-малко усилия, така че охладител е проектиран с много масивен радиатор и три вентилатора с подобрени акустични характеристики.

Нивото на шума на охладителната система и температурата, осигурена за GPU, са сред най-важните потребителски характеристики за всяка видеокарта, включително решение от най-висок клас, предназначено за ентусиасти. Охладителна система, която е твърде шумна или неефективна, ще се счита от купувачите за по-малко изгодна покупка, при (приблизително) равни всички други фактори. Така че AMD взе този проблем много сериозно в случая с модела Radeon HD 7990, в сравнение с други топ решения на пазара. Нека помислим акустични характеристикинова система:

Диаграмата показва нивото на шума от три различнивидео карти: Radeon HD 7990 и двама конкуренти: двучипов GeForce GTX 690 и едночипов GTX Titan от NVIDIA. Освен това шумът е измерен при различни условия – в режим на празен ход (System Idle) и при максимално натоварване с помощта на Furmark. Ако вярвате на цифрите, предоставени от AMD, тогава дори едночиповият Titan не достига техния нов продукт по ниво на шум от охладителя, да не говорим за двучиповия GTX 690, който е най-шумният в това сравнение.

Но дали такова впечатляващо акустично представяне беше постигнато за сметка на температурата на GPU? Следващата диаграма показва температурите на GPU, измерени на Radeon HD 7990 на AMD и същите двама конкуренти. Този път специалистите на AMD използваха само режим на високо натоварване при тестване във Furmark.

И отново се използва „сложна“ координатна ос с начало не на нула. Истинската разлика между 80 и 82 градуса за Radeon HD 7990 и GTX Titan ще бъде почти незабележима, въпреки че 87 градуса за GTX 690 очевидно се откроява към по-лошото. Отново отбелязваме, че всички тези тестове са проведени от заинтересована страна и подлежат на независима проверка.

По отношение на консумацията на енергия няма нищо ново в двучиповото решение, но има и поддръжка на обявената по-рано технология ZeroCore Power. Тази технология помага за постигане на значително по-ниска консумация на енергия по време на режим на дълбоко бездействие (или заспиване) с изключен дисплей. В този режим неактивният GPU е почти напълно изключен и консумира по-малко от 5% от енергията на пълния режим, дезактивирайки повечето функционални единици. А в случай на двучипова платка е още по-важно, че в системата CrossFire, при изобразяване на двуизмерен интерфейс на операционната система, всички графични процесори с изключение на основния изобщо не работят. Тоест, в случая с Radeon HD 7990, един от чиповете в 2D режим ще бъде потопен в дълбок сън с минимална консумация на енергия, а вторият може да „заспи“ в дълбок режим на празен режим на компютъра.

10 март 2016 г

Тази страница по-долу съдържа връзки за изтегляне на най-новото безплатно Драйвери за видео карти amdот серията Radeon HD 7900, която е включена в Семейство Radeon HD серия. Инсталационните файлове са взети от официалния уебсайт и са подходящи за: Windows 7, 10, 8, 8.1, XP, Vista 32/64-битов (x86/x64).

За да улесните избора на файловете, от които се нуждаете, версията на вашия Windows и неговата битова дълбочина са посочени по-долу.

Вашият компютър работи на:

  1. Изтегли (153,5 MB / версия 16.8.2 (Crimson Edition 16.8.2 Hotfix) / дата на издаване 08/12/2016)

    За Windows 7 32-bit

  2. Изтегли (239,8 MB / версия 16.8.2 (Crimson Edition 16.8.2 Hotfix) / дата на издаване 08/12/2016)

    За Windows 7 64-bit

  3. Изтегли (134,8 MB / версия 16.8.2 (Crimson Edition 16.8.2 Hotfix) / дата на издаване 08/12/2016)

    За Windows 10 32-bit

  4. Изтегли (208,24 MB / версия 16.8.2 (Crimson Edition 16.8.2 Hotfix) / дата на издаване 08/12/2016)

    За Windows 10 64-bit

  5. Изтегли (205 MB / версия 14.4 (Catalyst Software Suite) / дата на издаване 25.04.2014 г.)

    За Windows 8 32-bit

  6. Изтегли (260 MB / версия 14.4 (Catalyst Software Suite) / дата на издаване 25.04.2014 г.)

    За Windows 8 64-bit

  7. Изтегли (154,21 MB / версия 16.8.2 (Crimson Edition 16.8.2 Hotfix) / дата на издаване 08/12/2016)

    За Windows 8.1 32-bit

  8. Изтегли (239,88 MB / версия 16.8.2 (Crimson Edition 16.8.2 Hotfix) / дата на издаване 08/12/2016)

    За Windows 8.1 64-bit

  9. Изтегли (179 MB / версия 14.4 (Catalyst Software Suite) / дата на издаване 25.04.2014 г.)

    За Windows XP 32 и 64 бита

  10. Изтегли (151 MB / версия 13.12 (Catalyst Software Suite) / дата на издаване 18.12.2013 г.)

    За Windows Vista 32-bit

  11. Изтегли (209 MB / версия 13.12 (Catalyst Software Suite) / дата на издаване 18.12.2013 г.)

    За Windows Vista 64-bit

Резервен вариант - Вземете драйвери с помощта на AMD Driver Autodetect

Тази опция е удобна, защото програмата AMD Driver Autodetect ще избере и изтегли най-новите работещи драйверикоито са подходящи за вашата видеокарта AMD и вашите Windows версия. Програмата не изисква инсталация, създадена е от AMD и файловете се изтеглят от техните официални сървъри.

Инструкции:

  1. Стартирайте AMD Driver Autodetect и той веднага автоматично ще избере необходими файловеза инсталиране на драйвери.
  2. За да изтеглите файлове, щракнете върху бутона „Изтегли сега“.
  3. Изчакайте файловете да се изтеглят и започнете инсталацията.

В интернет се появиха такива, които представляват особен интерес за онези потребители, които, гледайки впечатляващия дизайн на тези модели, очакват сериозен потенциал за производителност. Последните изтекли слайдове говорят за функционалностнов . Като начало, нека разгледаме по-подробно трите основни категории функционалност, представени от архитектурата Graphics Core Next (GCN), технологията и възможностите AMD Eyefinity 2.0 хардуерно ускорениеприложения, използващи компютърна технология с общо предназначениеПРИЛОЖЕНИЕ AMD. AMD описва GCN като нова, „революционна“ технология, която променя начина, по който видео чипът извършва графични изчисления.
През последните пет поколения, започвайки със серията Radeon HD 2000, видеокартите на AMD са използвали архитектурната платформа VLIW (Very Long Instruction Word) и дори последната й версия, VLIW4, представена от линията, е по-скоро еволюционно развитие, отколкото революционен пробив в историята на VLIW. С платформата Graphics Core Next универсалните VLIW процесори са заменени от суперскаларни процесори графични ядраГрафично изчисление. Този преход означава по-висока производителност на квадратен милиметър от площта на GPU ядрото, което от своя страна позволява намаляване на размера графичен чип, осигуряване допълнителни функцииза AMD да маневрира по отношение на ценообразуването състезаниес NVIDIA. Самият чип е произведен на базата на 28-нанометров технологичен процес на TSMC. Освен това AMD потвърждава поддръжката на интерфейс с двойно по-голяма честотна лента от предишна версияшини – PCI-Express 2.0.

Технологията AMD PowerTune отговаря за управлението на консумацията на енергия, като ви позволява да регулирате честотните характеристики както нагоре, така и надолу спрямо номиналната, като същевременно оставате в рамките на декларираното ниво на консумация на енергия. Освен това се споменава технологията ZeroCore, която ви позволява напълно да деактивирате графиката, в случай че съобщи за необходимостта от изключване на монитора поради неактивност. Внедряването на технологията ZeroCore спомага за намаляване на консумацията на енергия на видео адаптера до 3 W, демонстрирайки 10-кратно подобрение на този показател в сравнение с моделите от предишни поколения. Също така се съобщава, че тази функция ще позволи на вторичните графични процесори в пакета (т.е. втората, третата и четвъртата карта) да бъдат превключени в режим ZeroCore, оставяйки основната карта (тази, към която е свързан мониторът) в „буден режим“ ” състояние - всичко това при условие, че графичната подсистема на компютъра не е натоварена с интензивни изчисления за изпълнение на 3D задачи.


Обявени са значителни иновации по отношение на технологията Eyefinity 2.0. На първо място, говорим за системата DDM (Direct Drive Monitor), която ви позволява да извеждате независими аудио потоци при предаване на съраунд звук във формат 7.1 чрез HDMI или DisplayPort конектори. Когато преместите програмен прозорец, в който се възпроизвежда определено приложение, от един монитор на друг, аудиопотокът също се прехвърля динамично от един порт на друг. Практическата стойност на такава схема се състои например във възможността за използване на по-дълъг HDMI кабел при свързване на компютър в една стая към HDMI интерфейс в друга стая. Потребителят може сам да мисли за други възможни области на приложение на тази функция. Eyefinity 2.0 ще ви позволи да създавате видеозаписи на базата на 5 монитора в пейзажна ориентация. При условие Поддръжка на AMD HD3D е патентована технология от графичния отдел на AMD, която ви позволява да показвате стереоскопично триизмерно изображение на всеки дисплей като част от видео поредица, компенсирайки изображението, като вземете предвид ъгъла на монитора спрямо перспективата на потребителя и към рамката на други дисплеи.

Изпълнението на приложения, които поддържат изчислителна технология с общо предназначение, известна като AMD APP (Accelerated Parallel Processing), става по-ефективна поради известно разширяване на функционалността поради използването на ресурси на нова, по-мощна изчислителна архитектура, проектирана с мисъл за високи изчислителни натоварвания. Очаква се да поддържа функцията Steady Video 2.0, която ви позволява да подобрите качеството на оригиналния запис, като компенсирате трептенето на картината, заснета на ръка. Подобрен хардуерен блок за декодиране на видео (UVD, Unified Video Decoder) ще разшири възможностите на GPU в тази област. Друго важно предимство е поддръжката на домашно видео в 3D формат, така че актуализираният UVD двигател ще позволи някои проблеми с производителността да бъдат разрешени и в тази област. И накрая, AMD ще разшири своя APP отпечатък чрез разработване на нови приложения, които поддържат технологията.

Днес думите „копаене“, „блокчейн“, „биткойни“ се чуват буквално навсякъде: от пътниците в трамвая до сериозните бизнесмени и депутатите от Държавната дума. Трудно е обаче да се разберат всички тънкости и клопки на тези и свързани с тях концепции в базата данни на нашия уебсайтБързо ще намерите изчерпателна информация, обхващаща всички аспекти.

Търсят Допълнителна информацияв бази данни:

Radeon HD 7900 спецификации

Онлайн бази данни за проекти:

Данни от изложения и семинари:

Данни от регистрите:

Изчакайте търсенето да завърши във всички бази данни.
След завършване ще се появи връзка за достъп до намерените материали.

Накратко, всички необходими знания ще бъдат представени в тази статия.
И така, нека започнем с блокчейна. Същността му е, че компютрите са обединени в една мрежа чрез набор от блокове, съдържащи автоматично криптирана информация, която попада там. Заедно тези блокове образуват база данни. Да приемем, че искате да продадете къща. След като попълните документите, трябва да отидете при нотариус, след което в негово присъствие, като удостоверите превода с неговия подпис, те ще ви дадат парите. Отнема много време и освен това трябва да платите такса.

Благодарение на блокчейн технологията е достатъчно да:

  1. Постигнете споразумение.
  2. Разберете акаунта на получателя.
  3. Прехвърлете пари по сметката на получателя.

И не само пари. Можете да издавате електронен подпис и да изпращате документи и всякаква друга информация, включително поверителна. Отново не са необходими нотариуси и други длъжностни лица: достатъчно е вие ​​и получателят (независимо дали е частно лице или държавна агенция) да се идентифицирате в компютъра си.

Транзакцията става по защитен комуникационен канал, никой не вижда (включително банките и държавата) кой какво и на кого е прехвърлил.

Възможността за хакване е изключена поради огромния брой блокове, описани по-горе. Хакерът трябва да намери шифър за всеки блок, което е физически невъзможно.

Други приложения на блокчейн:

  • Застраховка;
  • Логистиката;
  • Плащане на глоби
  • Регистрация на брак и много други.


Концепцията за криптовалута е тясно свързана с блокчейн. Криптовалутата е ново поколение децентрализирана цифрова валута, създадена и работеща само в интернет. Никой не го контролира; валутата се издава чрез работата на милиони компютри по целия свят, използвайки програма за изчисляване на математически алгоритми.

Накратко изглежда така:
1. Възнамерявате да преведете пари на някого.
2. Генерира се математически код, преминаващ през вече познатите ви блокове.

3. Много компютри (често представляващи колекция от тях, с мощни процесории, като следствие, по-голяма честотна лента) обработва цифрова информация, предавайки ги на следващите блокове, получавайки награда за това (някои транзакции могат да се извършват безплатно)
4. Математическият код достига електронния портфейл на получателя и парите се появяват в неговия баланс.

Отново, както е в случая с блокчейн, трансферите на криптовалута не се контролират от никого.

Въпреки че базата данни е отворена, с всички адреси на тези, които превеждат и получават пари, никой не знае собственика на този или онзи адрес, от който се прави преводът, освен ако самият собственик не иска да каже.

Има много валути, които работят на подобен принцип. Най-известният е, разбира се, Bitcoin. Също така популярни са Ethereum, Rittle, Litecoin, Numits, Namecoin и много други. Разликата между тях е различни видовекриптиране, обработка и някои други параметри.

Миньорите правят пари от технологията за парични преводи.

Това са хората, създали гореспоменатия набор от компютърни видеокарти, който генерира нови блокове, които предават цифрова информация - биткойни (или ритъли, или друга криптовалута). За това те получават награда под формата на същата криптовалута.

Има конкуренция между миньорите, защото... Технологията е програмирана да става все по-сложна с всяка транзакция. Отначало беше възможно да се копае от един компютър (2008 г.), но сега такава валута като биткойн е просто нерентабилна за физически лица: имате нужда от много видео карти (те се наричат ​​заедно ферми) с огромна изчислителна мощност. За целта се наемат отделни помещения, разходите за енергия за работа са сравними с разходите на промишлените предприятия.

Но можете да правите пари от други, по-малко популярни, но развиващи се криптовалути. Съществува също разграничение между соло копаене и копаене в басейн. Соло е създаването на собствена ферма, печалбата се взема за вас. Пулът събира други хора със същите цели. Можете да спечелите много повече, но трябва да го споделите с всички.

Те се заинтересуваха от перспективите за използване на блокчейн технологията като цяло и криптовалутите в частност лица, и цели щати.

Криптовалутата е законна в Япония. В Русия следващата година ще приемат разпоредби за легализирането на блокчейн, преводите на криптовалута и копаене. Предвижда се някои операции да бъдат прехвърлени към рамката на блокчейн. Има смисъл да проучите това по-подробно и, ако желаете, започнете да печелите пари. Това е очевидно сега информационни технологиище се развива и ще навлиза все повече в живота ни.

Навигация на публикации

Преди няколко дни стана известна приблизителната цена на графичните адаптери, базирани на Tahiti GPU с новата архитектура Next Generation Core (NGC). В американските магазини флагманът Radeon HD 7970 ще се продава на цена от $550, а решението Radeon HD 7950 с цена от $450. Освен това от непотвърдени източници идва информация за наличието на 384-битова шина на паметта в тези видеокарти.

В дълбините на форума Beyond3D.com определен почетен потребител феликс сподели със съмишленици снимки на видеокарти Radeon HD 7900. Той се опита да направи качеството на снимките, така че да не надхвърля NDA. Въпреки това има потвърждение за наличието на 384-битова шина върху тях.

Две видеокарти AMD Tahiti работят съвместно с коремчетата си към обектива. В допълнение към променения дизайн можем да отбележим наличието на два 8-пинови конектора за захранване, което осигурява допълнителни 300 W в допълнение към мощността на самия PCIe x16 слот. Съобщава се, че дължината на печатната платка е 30 см и има 12 модула памет, което лесно потвърждава наличието на 384-битова шина.

На тази снимка можете да забележите, че видеокартите очевидно не са проби на дребно.

На същия форум се появиха интригуващи графики, показващи ясното доминиране на архитектурата NGC и видеокартата Radeon HD 7970 над останалите участници в теста. Ясно е, че създаването на такъв график отнема 5 минути и трябва да се отнасяте към него съответно.



Свързани публикации