NHỮNG CÔNG NGHỆ NVIDIA THẾ HỆ MỚI: Công nghệ Tesla, kỷ nguyên Tesla

Tech MediaOnline

NHỮNG CÔNG NGHỆ NVIDIA THẾ HỆ MỚI: Công nghệ Tesla, kỷ nguyên Tesla

October 31

22:48 2012

Print This Article Share it With Friends

(STS:31.10.2012) Tesla ra đời năm 2007 là thương hiệu chip xử lý đồ họa GPU thứ ba của NVIDIA (sau GeForce và Quadro). Nhưng nó không phải là một GPU đơn thuần chỉ làm nhiệm vụ xử lý các tác vụ đồ họa mà là GPU đa mục đích – GPGPU (General Purpose GPU) đầu tiên của NVIDIA. Dựa trên kiến trúc Fermi 40nm và mới nhất là Kepler 28nm (kiến trúc CUDA mới nhất của NVIDIA), các GPU Tesla là các bộ vi xử lý song song nhanh nhất trong thế giới điện toán sức mạnh cao (high-performance computing). Có khả năng đạt sức mạnh cao hơn tới 10 lần các GPU trước đó, các GPU Tesla dòng Tesla 20-series (kiến trúc Fermi) lý tưởng để thực hiện các tác vụ tính toán và xử lý chuyên nghiệp vốn rất nặng nề.

Trong khi các nhà sản xuất chip vi xử lý như Intel và AMD cố gắng tích hợp GPU vào chung với CPU, NVIDIA lại phát triển theo hướng khai thác sức mạnh xử lý của GPU để làm các công việc của CPU. Xét về sức mạnh xử lý, GPU luôn vượt trội CPU. Chẳng hạn, CPU desktop mạnh nhất hiện nay của Intel là Intel Core i7-3770K Ivy Bridge công nghệ 22nm có 1,4 tỷ transistor, trong khi GPU NVIDIA GTX 680 công nghệ 28nm chứa tới 3,5 tỷ transistor.

Kết quả benchmark so sánh giữa CPU Intel Xeon X5550 (xanh dương) và hai GPU NVIDIA Tesla C1060 (xanh lá) và C2050 (xanh lá mạ).

Do Tesla là giải pháp điện toán cho server và workstation, ta thử so sánh 2 mẫu có giá tương đương: trong khi GPU Tesla M2090 công nghệ 40nm có tới 512 nhân xử lý CUDA, hỗ trợ bộ nhớ GDDR5 có băng thông tổng cộng 177GB/s giá 3.155 USD; CPU Intel Xeon E7-8850 công nghệ 32nm có 10 nhân 20 luồng, hỗ trợ bộ nhớ DDR3 có băng thông tối đa 32GB/s giá 3.059 USD.

Tất nhiên không thể so sánh giữa CPU và GPU được vì mỗi loại chip xử lý này được thiết kế cho một mục đích khác nhau. Sự so sánh trên đây chỉ nhằm giúp bạn có một ý niệm về khả năng tính toán kinh khủng của GPU. Giải pháp của NVIDIA trong các máy tính sức mạnh cao HPC, server, workstation và siêu máy tính là kết hợp giữa CPU (Intel hay AMD) với GPU của mình. Chỉ cần 1 CPU có sức mạnh vừa phải để chạy hệ thống chung, còn sức mạnh tính toán để xử lý các tác vụ được trao phó cho các GPU Tesla và Quadro.

Server gồm 2 GPU NVIDIA Tesla.

Server gồm 2 CPU Intel Xeon 5600 và 8 GPU NVIDIA Tesla.

Để phát triển xu hướng này, dựa trên khả năng tính toán của GPU và kiến trúc nhân CUDA thế hệ mới, NVIDIA đã phát triển kiến trúc Fermi mở đường cho các GPU tính toán (không phải chỉ xử lý đồ họa) mà NVIDIA đặt tên là Tesla. Đây là kiến trúc cho điện toán High-Performance Computing. Với kiến trúc Fermi, GPU có hiệu năng như các CPU cho server của Intel và AMD, nhưng chỉ tiêu thụ năng lượng bằng 5% và chi phí bằng 10%. Công nghệ Fermi mở rộng khả năng xử lý kết hợp của GPU và CPU nhằm xử lý các ứng dụng tính toán đồ sộ của giới chuyên môn và các nhà khoa học.

Từ thế hệ đầu tiên với nhân Fermi công nghệ 40nm, hiện nay, GPU Tesla đã phát triển lên thế hệ mới là Tesla K10 dựa trên kiến trúc Kepler mới (GK104) với công nghệ 28nm. Sức mạnh tính toán của thế hệ Tesla này thật khủng khiếp. Kiến trúc mới cho phép Tesla tích hợp GPU kép, với 2 GPU GK104 high-end, bao gồm tới 3072 nhân CUDA (so với 512 nhân của kiến trúc Fermi), có sức mạnh xử lý dấu chấm động (floating point performance) tới 4577 GigaFLOPS (so với 1331 GigaFLOPS của Tesla thế hệ trước), đạt băng thông bộ nhớ tới 320GB/s (so với 177GB/s). Tesla K10 là cỗ máy tính toán có thông lượng nhanh nhất thế giới. Nó đạt sức mạnh FLOPS tính toán độ chính xác đơn (single precision) và băng thông bộ nhớ cao nhất thế giới.

Trong sự kiện báo chí tại Bangkok ngày 26-10-2012, NVIDIA đã đưa ra kết quả benchmark cho thấy sức mạnh của GPU ngày càng tăng cao. Năm 2009, 96 server node xử lý đạt 46ns/day (nanosecond per day); năm 2010, 8 GPU Tesla M2005 đạt 52ns/day; năm 2011, chỉ cần 4 con GPU Tesla M2090 đã đạt 69ns/day. Trong năm 2012, thế hệ Tesla K10 chỉ cần 2 GPU đã đạt 66ns/day. Với sức mạnh Cluster, 2 GPU Tesla K10 suýt soát 128 server node (kết quả benchmark đạt 0,13 giây so với 0,12 giây).

Với nền tảng Tesla, giờ đây GPU NVIDIA đã có mặt trong nhiều lĩnh vực cần sức mạnh điện toán cao như: dầu khí, nghiên cứu, giáo dục, chính phủ, tài chính, chế tạo,… Các ứng dụng hàng đầu dựa trên nhân CUDA từ 2 ứng dụng trong lĩnh vực siêu điện toán năm 2010, tới năm 2012 đã tăng lên hơn 10 ứng dụng trong nhiều lĩnh vực khác nhau.

Công nghệ Hyper-Q trong kiến trúc Kepler của Tesla K20.

Trong quý 4-2012, NVIDIA tiếp tục nâng cấp dòng GPU Tesla với thế hệ mới hơn là Tesla K20 có sức mạnh hơn hẳn Tesla K10, nhanh gấp 3 lần về tính toán độ chính xác kép.