Статьи

Огляд і тестування відеокарти NVIDIA GeForce GTX 1080 Ti: бій з тінню

  1. ⇡ # Технічні характеристики, ціни
  2. ⇡ # конструкція
  3. ⇡ # плата

NVIDIA застосовує цю стратегію не в перший раз: коли відбувається чергова зміна техпроцесу або архітектури графічних процесорів, верхню позицію в новій лінійці геймерських відеокарт якийсь час займає пристрій на чіпі другого ешелону. Флагманський GPU спершу з'являється в складі просьюмерський прискорювача під маркою TITAN, а потім, з тими чи іншими втратами обчислювальних блоків і функцій, доходить і до ігрових моделей. Однак відмінності в технічних характеристиках між черговим TITAN і черговим ігровим флагманом на тому ж GPU в кожному поколінні відеокарт унікальні.

В епоху Kepler, яка породила перший «Титан» чотири роки тому, GeForce GTX 780 і ​​GTX TITAN були найменше схожі один на одного. Крім істотної різниці в наборі обчислювальних блоків, ігрова відеокарта отримала вдвічі менше оперативної пам'яті і в вісім разів повільніше виконувала розрахунки подвійної точності (FP64). На базі архітектури Maxwell NVIDIA вже не стала випускати процесор, що охоплює одночасно графічні завдання і обчислення подвійної точності, тому GTX 980 Ti відрізняється від GeForce GTX TITAN X лише обсягом RAM і володіє практично еквівалентної продуктивністю в іграх.

З приходом Pascal, вперше в своїй історії, NVIDIA розділила GPU вищого ешелону на професійну і ігрову категорії. Перехід на технологію 16 нм FinFET дозволив випустити процесор з безпрецедентним числом обчислювальних блоків і рівнем швидкодії - GP100. Однак останній застосовується лише в прискорювачах Quadro і Tesla, і ймовірність побачити його під маркою GeForce прагне до нуля. Альтернативний варіант «великого ядра», GP102, позбавлений архітектурних елементів і функцій, важливих для обчислювальних задач, але в той же час не поступається GP100 в пропускної здатності операцій FP32, які лежать в основі шейдерного коду 3D-додатків.

GP102 вже проявив себе у складі оновленого TITAN X , Який, не меншою мірою, ніж ігровою відеокартою, є прискорювачем обчислень, пріоритетом серед яких на цей раз стало застосування моделей ІІ, створених методом глибинного навчання (inference). Але, дивлячись на TITAN X, передбачити, яким виявиться GTX 1080 Ti, було не так-то просто.

Справа в тому, що NVIDIA не залишила собі великого простору для маневру між GTX 1080 і TITAN X. Якщо судити по пікової пропускної спроможності операцій FP32 (що, зрозуміло, не є вичерпною характеристикою GPU), TITAN X лише на 24% перевершує GeForce GTX 1080, в той час як різниця між GTX 980 і GeForce GTX TITAN X з цього параметру становила 35%. Якби в поколінні Pascal розробники вирішили скільки-небудь істотно скоротити обчислювальні ресурси TITAN X, у NVIDIA вийшов би досить непереконливий флагман ігровий лінійки.

Якби в поколінні Pascal розробники вирішили скільки-небудь істотно скоротити обчислювальні ресурси TITAN X, у NVIDIA вийшов би досить непереконливий флагман ігровий лінійки

З іншого боку, в TITAN X ні частотний потенціал, ні набір функціональних блоків GP102 не розкриті повністю, тому GeForce GTX 1080 Ti цілком міг опинитися швидше, ніж TITAN X, адже NVIDIA колись надійшла точно так же з GeForce GTX 780 Ti і першим TITAN. А в результаті сталося щось несподіване: GeForce GTX 1080 Ti дійсно урізали блоки GPU у порівнянні з TITAN X, однак не ті блоки, яких це зазвичай стосується. Разом з тим пікова продуктивність GTX 1080 Ti, принаймні на папері, вище. Більш того, у ігровий відеокарти є й інші, вже не настільки очевидні переваги.

GPU

Кристал GP102, вироблений за нормою 16 нм FinFET на потужностях TSMC, містить 12 млрд транзисторів на площі 471 мм2. Параметри наступного за рангом чіпа в лінійці Pascal, GP104, набагато скромніше - 7,2 млрд транзисторів і 314 мм 2.

Однак структура обчислювальних блоків GP102 повторює таку у чіпа GP104, з урахуванням кількісних змін на вищому рівні архітектури, так що весь додатковий транзисторний бюджет в GP102 пішов на збільшення швидкодії в графіку і інших обчисленнях, що спираються на формат даних FP32. Окремо взятий SM (Streaming Multiprocessor) в GP102 і GP104 містить 128 ядер CUDA для операцій FP32, чотири FP64-сумісних ядра і одне ядро, здатне виконувати дві інструкції FP16 одночасно. Крім того, в SM входять 40 блоків накладення текстур, 96 Кбайт пам'яті, що і 48 Кбайт кеша L1.

Всього GP102 містить 30 блоків SM, які в сумі дають конфігурацію з 3840 ядер CUDA одинарної точності і 240 текстурніков. Back-end конвеєра представлений дванадцятьма 32-бітними контролерами пам'яті GDDR5 / 5X (384-бітна шина), з кожним з яких асоційовані 8 ROP і секція кеша L2 об'ємом 256 Кбайт (3072 Кбайт на весь GPU).

Блок-схема NVIDIA GP102 в GeForce GTX 1080 Ti

З приводу відмінностей архітектури Pascal від Maxwell рекомендуємо звернутися до нашого огляду GeForce GTX 1080 . У цій ітерації розробники розвинули гідності попереднього покоління і компенсували властиві йому недоліки. Коротко перерахуємо найбільш суттєві зміни:

  • поліпшена компресія кольору з співвідношеннями аж до 8: 1;
  • функція Simultaneous Multi-Projection геометричного движка PolyMorph Engine, що дозволяє за один прохід створювати аж до 16 проекцій геометрії сцени (для VR і систем з декількома дисплеями в конфігурації NVIDIA Surround);
  • можливість переривання (preemption) в процесі виконання draw call (при рендеринге) і потоку команд (при обчисленнях), яка разом з динамічним розподілом обчислювальних ресурсів GPU забезпечує повноцінну підтримку асинхронних обчислень (Async Compute) - додаткове джерело швидкодії в іграх під API DirectX 12 і зниженою латентності в VR;
  • контролер дисплея, сумісний з інтерфейсами DisplayPort 1.3 / 1.4 і HDMI 2.b. Підтримка високого динамічного діапазону (HDR);
  • шина SLI з підвищеною пропускною спроможністю.

Додамо до цього списку технологію, яка була секретним ноу-хау останніх архітектур NVIDIA, але слідом за незалежним розслідуванням, результати якого поширилися в інтернеті, компанія розкрила свої карти. Крім потужної компресії кольору, Архітектури Maxwell і Pascal використовують різновид тайлового рендеринга для економії пропускної здатності пам'яті (ПСП).

Класичний тайловий рендеринг, широко поширений в мобільних GPU, має на увазі обробку кадру в два проходи. Спочатку драйвер розділяє екранний простір на тайли (ділянки з типовим розміром 16 × 16 або 32 × 32 пікселя) і становить індекс полігонів, які перебувають в проекції кожного тайла. Потім послідовно в межах кожного тайла цілком виконується процедура рендеринга - від трансформації і перетину полігонів до заповнення текстур і виконання шейдеров - і кінцевий результат всіх тайлів зшивається в єдину картинку. Перевага такого методу полягає в тому, що будь-які проміжні операції в межах тайла оперують єдиним масивом даних, який цілком поміщається в кеш GPU, а отже, скорочується частота звернень до оперативної пам'яті.

Проте, необхідність в двох проходах обробки геометрії сцени сама по собі витрачає пропускну здатність RAM, оскільки GPU необхідно спочатку записати на зовнішній пам'ять інформацію про полігонах, що потрапляють в той чи інший тайл, а потім, виконуючи рендеринг від тайла до Тайлу, витягувати її назад. Як наслідок, ефективність тайлового рендеринга в кінцевому рахунку залежить від того, чи переважує економія ПСП на швидкості заповнення пікселів її втрати на двопрохідні проекцію геометрії. У мобільних додатках, що відрізняються простою геометрією, тайловий рендеринг виправдовує себе, але для сучасних десктопних ігор краще підходить стандартний метод миттєвого (immediate) рендеринга, при якому в єдиному екранному просторі відбувається послідовна растеризация одного полігону за іншим.

У конвеєрі Maxwell і Pascal поєднуються найкращі риси обох методів рендеринга. NVIDIA теж використовує тайли, але в даному випадку отрисовка кадрів, як і в інших десктопних архитектурах, не вимагає окремої стадії сортування (binning) всіх полігонів, що належать кадру, між тим чи іншим Тайлі. Замість цього GPU спочатку цілком виконує трансформацію геометрії сцени, а решту етапів рендеринга відбуваються тайл за Тайлі. При цьому розмір і кількість тайлів, які обробляються одночасно, визначається динамічно в міру заповнення черги геометрії фіксованої довжини - таким чином, щоб всі дані містилися в кеш L2.

# Технічні характеристики, ціни

Як і TITAN X, GTX 1080 Ti не має повністю функціональної версією графічного процесора. Виробник заблокував два з 30 SM в GPU обох відеокарт. Таким чином, front-end чіпа і, отже, теоретична пропускна здатність в операціях за такт в GTX 1080 Ti нітрохи не постраждали в порівнянні з TITAN X. Однак в GTX 1080 Ti відключений один з 12 контролерів RAM, а разом з ним - 8 ROP секція кеша L2. Як наслідок, шина пам'яті GPU зменшилася з 384 до 352 біт і відеокарта оснащується лише 11 замість 12 Гбайт GDDR5X.

Проте GTX 1080 Ti відіграв втрачену пропускну здатність RAM за рахунок збільшеної частоти шини - з 10 000 до 11 000 Мбіт / с на контакт. Крім того, NVIDIA підняла частоти GPU: базову на 63 МГц і Boost Clock - на 51 МГц. Таким чином, єдиним параметром, який диференціює GTX 1080 Ti від TITAN X в рендеринге графіки, залишається обсяг L2.

А що щодо обчислювальних задач? Тут, на відміну від ігор, може виникнути така ситуація, коли додатковий гігабайт RAM має значення. Дивно інше: NVIDIA анітрохи не обмежила швидкість роботи GTX 1080 Ti з різними форматами даних. GP102 і без того не підходить для «бойових» розрахунків на основі даних FP64 і FP16 (швидкість виконання на рівні 1/32 і 1/64 від FP32), зате як TITAN X, так і GTX 1080 Ti виконують за такт вчетверо більше операцій int8 в порівнянні з FP32. До появи GTX 1080 Ti тільки TITAN X в споживчої лінійці NVIDIA підтримував int8 - інструкції, що застосовуються для обробки даних моделями глибинного навчання.

Виробник NVIDIA Модель GeForce GTX 980 Ti GeForce GTX TITAN X GeForce GTX 1080 GeForce GTX 1080 Ti TITAN X Графічний процесор Назва GM200 GM200 GP104 GP102 GP102 Мікроархітектура Maxwell Maxwell Pascal Pascal Pascal Техпроцесс, нм 28 нм 28 нм 16 нм FinFET 16 нм FinFET 16 нм FinFET число транзисторів, млн 8 000 8 000 7 200 12 000 12 000 Тактова частота, МГц: Base Clock / Boost Clock 1 000/1 076 1 000/1 089 1 607/1 733 1 480/1582 1 417/1531 число шейдерних ALU 2 816 3 072 2 560 3 584 3 584 Число блоків накладення текстур 176 192 160 224 224 Число ROP 96 96 64 88 96 Оперативна пам'ять Розрядність шини, біт 384 384 256 352 384 Тип мікросхем GDDR5 SDRAM GDDR5 SDRAM GDDR5X SDRAM GDDR5X SDRAM GDDR5X SDRAM Тактова частота, МГц (пропуск ная здатність на контакт, Мбіт / с) 1 753 (7 012) 1 753 (7 012) 1 250 (10 000) 1 376,25 (11 010) 1 250 (10 000) Обсяг, Мбайт 6 144 12 288 8 192 11 264 12 288 Шина введення / виведення PCI Express 3.0 x16 PCI Express 3.0 x16 PCI Express 3.0 x16 PCI Express 3.0 x16 PCI Express 3.0 x16 продуктивність Пікова продуктивність FP32, GFLOPS (з розрахунку максимальної зазначеної частоти) 6 060 6 691 8 873 11 340 10 974 Продуктивність FP32 / FP64 1/32 1/32 1/32 1/32 1/32 Пропускна здатність оперативної пам'яті, Гбайт / с 336 336 320 484 480 Висновок зображення Інтерфейси виведення зображення DL DVI-I, DisplayPort 1.2, HDMI 1.4a DL DVI-I, DisplayPort 1.2, HDMI 1.4a DL DVI-D, DisplayPort 1.3 / 1.4, HDMI 2.0b DisplayPort 1.3 / 1.4, HDMI 2.0b DL DVI-D, DisplayPort 1.3 / 1.4, H DMI 2.0b TDP, Вт 250 250 180 250 250 Рекомендована роздрібна ціна (США, без податку), $ 649 (на момент виходу) 999 (на момент виходу) На момент виходу: 599/699 (FE) Нова ціна: 499/549 (FE) 699 1 200 Рекомендована роздрібна ціна (Росія), руб. 39 990 (на момент виходу) 74. 900 (на момент виходу) На момент виходу 54 990 (FE) Нова ціна 45 790 (FE) 52 990 (FE) 89 990

GTX 1080 Ti і TITAN X розділяє досить хитка межа, і це, з одного боку, хороша новина для ентузіастів, які вирішили почекати з апгрейдом старої відеокарти на Pascal в очікуванні топового прискорювача. З іншого боку, висока продуктивність відбивається на ціні відеокарти. GTX 1080 Ti став третім однопроцесорним GeForce після GTX 780 Ti і GTX 1080 Founders Edition, що досяг позначки $ 699. Ціна в російському онлайн-магазині компанії складає 52 990 руб. Крім того, NVIDIA на цей раз не робить відмінностей між відеокартою референсного дизайну (Founders Edition) і партнерськими зразками, які з'являться пізніше і отримають точно такий же рекомендований цінник.

У той же час NVIDIA зробила більш доступними GeForce GTX 1070 і GTX 1080. На момент виходу останні були оцінені в $ 379/449 і $ 599/699 (партнерські карти і Founders Edition відповідно), а тепер продаються за $ 349/399 і $ 499/549. Російські ціни відеокарт на сайті NVIDIA знизилися с 34 990 54 990 до 31 590 і 45 790 руб.

Разом з тим NVIDIA оголосила, що виробники відеокарт отримають можливість оснащувати свої версії GeForce GTX 1060 і GTX 1080 швидкіснішими чіпами GDDR5 / 5X: 9 замість 8 Гбіт / с для GTX 1060 і 11 замість 10 Гбіт / с - для GTX 1080. Референсні специфікації моделей при цьому залишилися незмінними, просто у партнерів, які закуповують у NVIDIA чіпи пам'яті разом з GPU для установки на власні плати, з'явився вибір. Судячи з того, як рідко ми бачимо на відкритих оригінального дизайну мікросхеми RAM, відмінні від тих, якими оснащуються референсні прискорювачі, такий хід NVIDIA дійсно може зробити заводський розгін відеопам'яті більш поширеним явищем.

# конструкція

Оскільки предтечею GeForce GTX 1080 Ti є TITAN X, не дивно, що відмінності в образі відеокарт мінімальні. GTX 1080 Ti відрізняється від повністю чорного «Титана» стандартно-сріблястим кольором кожуха, а всередині - точно такий же радіатор з випарної камерою і вентилятор радіального типу. Ця конструкція добре зарекомендувала себе ще за часів першого TITAN і GeForce GTX 780/780 Ti. Володіючи видатними акустичними характеристиками для даного типу системи охолодження, референсні відеокарти NVIDIA виділяються серед партнерських пристроїв, т. К. Останні практично завжди оснащуються кулером відкритої конструкції. При цьому закрита «турбинка» залишається найкращим варіантом для компактних ПК, де важливо, щоб відеокарта викидала більшу частину повітря назовні. Крім того, референсний кулер гарантує охолодження мікросхем пам'яті та безлічі інших гарячих точок плати за рахунок масивного алюмінієвого підстави.

Починаючи з GeForce GTX 1080, відеокарти NVIDIA, сумісні з режимом SLI, дозволяють видалити частину металевої пластини, якою покрита зворотна сторона друкованої плати, щоб повітря вільно проникав до системи охолодження сусідньої відеокарти.

Незважаючи спільну з TITAN X конструкцію системи охолодження, у GTX 1 080 Ti є одна очевидна особливість: NVIDIA видалила порт DL-DVI з зовнішньої панелі відеокарти. Весь набір виходів, який залишився на GTX 1080 Ti, обмежується трьома роз'ємами DisplayPort 1.3 / 1.4 і одним HDMI 2.0b. Зате вся половина пластини тепер задіяна для виведення гарячого повітря за межі корпусу ПК, що має позитивно позначитися на ефективності охолодження. Для тих, хто все ще користується монітором без роз'ємів DisplayPort або HDMI, NVIDIA докладає до GeForce GTX 1080 Ti Founders Edition перехідник з інтерфейсу DP на Single-Link DVI.

# плата

Як і система охолодження, оснащення друкованої плати GeForce GTX 1080 Ti не тільки не погіршилася в порівнянні з TITAN X, а й стала краще. Підвищена пропускна здатність оперативної пам'яті в GTX 1080 Ti досягнута за рахунок нових чіпів Micron (маркування MT58K256M321JA-110), для яких ефективна частота 11 Гбайт / с є штатною. До слова, в каталозі Micron є і пам'ять GDDR5X з частотою 12 Гбайт / с, але, вибравши найбільш швидкісні чіпи, NVIDIA, ймовірно, довелося б вичерпати резерв надійності контролерів RAM в складі GPU.

Що залишається незмінним в перетворювачі напруги відеокарт NVIDIA, так це ШІМ-контролер uP9511 від uPI Semiconductor, який на GTX 1080 Ti обслуговує максимальне для своїх можливостей число фаз - сім, всі з яких належать схемі живлення GPU. Дві фази чіпів GDDR5X керуються контролером uP1685. Однак і в силовій частині відеокарти є зміни. NVIDIA помістила на друковану плату ряд елементів, які були відсутні в TITAN X, в першу чергу - подвоїла всі польові транзистори в «фазах» живлення GPU, що повинно позитивно позначитися на ККД перетворювача.

Якщо Ви помітили помилку - виділіть необхідний текст і натисніть CTRL + ENTER.