ai Archives - ROSA Computer https://rosacomputer.com/tag/ai/ Máy tính ROSA Mon, 03 Jul 2023 08:58:43 +0000 vi hourly 1 https://wordpress.org/?v=6.5.5 https://i0.wp.com/rosacomputer.com/wp-content/uploads/2023/07/cropped-ROSA-logo-2.png?fit=32%2C32&ssl=1 ai Archives - ROSA Computer https://rosacomputer.com/tag/ai/ 32 32 220859718 TẠI SAO TERAFLOP KHÔNG CÒN LÀ ĐƠN VỊ ĐO HỢP LÝ TRONG ĐÁNH GIÁ GPU? https://rosacomputer.com/2023/07/03/tai-sao-teraflop-khong-con-la-don-vi-do-hop-ly-trong-danh-gia-gpu/ https://rosacomputer.com/2023/07/03/tai-sao-teraflop-khong-con-la-don-vi-do-hop-ly-trong-danh-gia-gpu/#respond Mon, 03 Jul 2023 08:58:17 +0000 https://rosacomputer.com/?p=72 Teraflop (TFLOP) lâu nay thường được ca ngợi là thước đo tuyệt vời cho mọi phép so sánh khả năng hoạt động, hay nói đơn giản là hiệu năng của GPU. Tuy nhiên, với sự phát triển và thay đổi không ngừng của thế giới công nghệ, phép đo dựa trên TFLOP đã bắt đầu [...]

The post TẠI SAO TERAFLOP KHÔNG CÒN LÀ ĐƠN VỊ ĐO HỢP LÝ TRONG ĐÁNH GIÁ GPU? appeared first on ROSA Computer.

]]>
Teraflop (TFLOP) lâu nay thường được ca ngợi là thước đo tuyệt vời cho mọi phép so sánh khả năng hoạt động, hay nói đơn giản là hiệu năng của GPU. Tuy nhiên, với sự phát triển và thay đổi không ngừng của thế giới công nghệ, phép đo dựa trên TFLOP đã bắt đầu bộc lộ một số điểm hạn chế.

Sự đơn giản hóa quá mức mà TFLOP mang lại đang dần không theo kịp được độ phức tạp của GPU, che giấu hiệu suất thực sự của chúng. Thay vào đó, kiểm tra hiệu năng trong thực tế, hiểu biết sâu sắc về kiến trúc và cách sử dụng theo tình huống cụ thể mới là vấn đề quan trọng.

Teraflop là gì?

Teraflop đề cập đến khả năng của bộ xử lý trong việc tính toán 1 nghìn tỷ phép toán dấu chấm động mỗi giây. Ví dụ, nói một cái gì đó có “6 TFLOP”, nghĩa là thiết lập bộ xử lý của nó có khả năng xử lý trung bình 6 nghìn tỷ phép tính dấu chấm động mỗi giây.

Trong thế giới của các đơn vị xử lý đồ họa (GPU), teraflop thường được sử dụng làm thước đo hiệu suất. Về cơ bản, số lượng teraflop càng cao thì GPU có thể xử lý càng nhiều phép tính trong một giây, được cho là dẫn đến hiệu suất tốt hơn.

Microsoft đánh giá bộ xử lý tùy chỉnh Xbox Series X của mình ở mức 12 TFLOP, nghĩa là console có khả năng thực hiện 12 nghìn tỷ phép tính dấu chấm động mỗi giây. Để so sánh, GPU AMD Radeon Pro bên trong MacBook Pro 16 inch của Apple đạt đỉnh với 4 teraflop, trong khi Mac Pro được thiết kế lại có thể đạt tới 56 teraflop.

Teraflop được lấy từ các thông số kỹ thuật phần cứng của GPU, chủ yếu là tốc độ xung nhịp lõi, số lượng lõi và số lượng hoạt động trên mỗi chu kỳ. Đó là một con số dễ hiểu, nhưng giống như bất kỳ số liệu đơn giản hóa nào, nó sẽ mất đi độ chính xác khi sử dụng sai.

Khi nào thì Teraflop phù hợp để so sánh hiệu năng GPU?

Teraflops có thể hữu ích khi so sánh các GPU có cùng kiến trúc và ngang thế hệ. Vì các GPU này được phát triển trên cùng một công nghệ, nên chúng thường mở rộng hiệu suất theo số lượng teraflop có thể dự đoán được.

Ví dụ: nếu bạn so sánh hai card đồ họa thuộc cùng dòng NVIDIA RTX 3000, model nào có số teraflop cao hơn thường sẽ hoạt động tốt hơn. Điều đó là do các mẫu GPU này được thiết kế tương tự nhau và bất kỳ sự khác biệt nào về hiệu suất có thể chủ yếu là do sức mạnh xử lý của chúng, được biểu thị bằng số lượng teraflop.

Khi nào thì Teraflop không phù hợp để so sánh hiệu năng GPU?

Tuy nhiên, teraflop sẽ trở nên kém tin cậy hơn nhiều khi so sánh giữa các GPU sở hữu kiến trúc hoặc thế hệ khác nhau.

Cách GPU cho ra kết quả teraflop có thể thay đổi đáng kể dựa trên kiến trúc của nó. Chẳng hạn, GPU NVIDIA sử dụng teraflop của nó khác với GPU AMD, dẫn đến các mức hiệu suất khác nhau mặc dù số lượng teraflop tương tự nhau. Tương tự, một GPU hiện đại sẽ sử dụng teraflop hiệu quả hơn so với GPU cũ, ngay cả khi chúng có cùng số lượng TFLOP

Nói cách khác, teraflop chỉ kể ra một phần của câu chuyện. Chúng không thể nói rõ sự khác biệt về hiệu quả, băng thông bộ nhớ hoặc tối ưu hóa trình điều khiển có thể ảnh hưởng đến hiệu suất đáng kể như thế nào.

GPU đang hoạt động thông minh hơn

GPU ngày nay ngày càng trở nên phức tạp và thông minh. Chúng không chỉ thực hiện các phép tính một cách miệt mài và chăm chỉ như trước, mà thay vào đó làm việc thông minh hơn.

Ví dụ: Nhiều mẫu GPU hiện đại được trang bị các công nghệ như DLSS (NVIDIA) hay FidelityFX Super Resolution (AMD), sử dụng AI để nâng cấp hình ảnh độ phân giải thấp trong thời gian thực, cải thiện hiệu suất mà không làm giảm chất lượng hình ảnh. Những công nghệ này có thể nâng cao đáng kể hiệu suất của GPU và chúng không liên quan gì đến teraflop.

Tương tự, những tiến bộ trong kiến trúc, chẳng hạn như quản lý bộ nhớ và xử lý song song tốt hơn, có thể cải thiện đáng kể hiệu năng của GPU. Một lần nữa, những cải tiến này không được phản ánh trong số lượng teraflop.

“Giả mạo” số TFLOP

Một vấn đề khác khi sử dụng teraflop để so sánh GPU là các con số có thể bị thao túng. Các nhà sản xuất có thể “tăng” số lượng teraflop của họ bằng cách tăng tốc độ xung nhịp lõi hoặc số lượng lõi.

Tuy nhiên, những sự tăng cường này thường không dẫn đến cải tiến hiệu suất trong thực tế, vì chúng có thể dẫn đến tăng mức tiêu thụ điện năng và sinh nhiệt, qua đó có thể làm giảm tốc độ GPU và làm giảm hiệu suất. Ngoài ra, ngay cả khi có sự gia tăng hiệu suất, thì nó cũng không tỷ lệ thuận với sự gia tăng TFLOP (lý thuyết), do các hạn chế trong kiến trúc của GPU, chẳng hạn như tắc nghẽn băng thông bộ nhớ hoặc bộ nhớ cache hạn chế của GPU.

So sánh hiệu suất GPU thế nào là tối ưu?

Nếu teraflop không phải là cách đáng tin cậy để so sánh GPU, thì đó là gì? Câu trả lời rất đơn giản: thử nghiệm hiệu suất trong thực tế.

Điểm benchmark hiệu suất, chẳng hạn như do các bên đánh giá độc lập thực hiện, thường cung cấp thước đo chính xác nhất về hiệu suất của GPU. Chúng liên quan đến việc chạy GPU thông qua một loạt tác vụ hoặc trò chơi thực tế và đo lường hiệu suất của nó.

Khi nhìn vào điểm benchmark, điều quan trọng là phải xem xét các tác vụ hoặc trò chơi cụ thể mà bạn sẽ sử dụng GPU. GPU của bạn có thể vượt trội ở nhiệm vụ này nhưng hoạt động kém ở một tác vụ khác, vì vậy hãy thử nghiệm với thang đánh giá benchmark hợp với trường hợp sử dụng của bạn.

Ngoài hiệu năng, hãy xem xét các yếu tố khác như mức tiêu thụ điện năng, nhiệt lượng tỏa ra và chi phí. Một mẫu GPU có thể cho hiệu suất tuyệt vời, nhưng lại không phải là lựa chọn tốt nhất của bạn nếu nó quá ngốn điện hoặc đắt tiền.

The post TẠI SAO TERAFLOP KHÔNG CÒN LÀ ĐƠN VỊ ĐO HỢP LÝ TRONG ĐÁNH GIÁ GPU? appeared first on ROSA Computer.

]]>
https://rosacomputer.com/2023/07/03/tai-sao-teraflop-khong-con-la-don-vi-do-hop-ly-trong-danh-gia-gpu/feed/ 0 72
MỸ CẤM VẬN, TRUNG QUỐC XUẤT HIỆN CHỢ ĐEN GPU NGHIÊN CỨU AI, GIÁ GẤP ĐÔI CHÍNH HÃNG, KHÔNG BẢO HÀNH https://rosacomputer.com/2023/07/03/my-cam-van-trung-quoc-xuat-hien-cho-den-gpu-nghien-cuu-ai-gia-gap-doi-chinh-hang-khong-bao-hanh/ https://rosacomputer.com/2023/07/03/my-cam-van-trung-quoc-xuat-hien-cho-den-gpu-nghien-cuu-ai-gia-gap-doi-chinh-hang-khong-bao-hanh/#respond Mon, 03 Jul 2023 08:56:24 +0000 https://rosacomputer.com/?p=69 Kể từ tháng 9 năm ngoái, phía chính phủ Mỹ đã có những động thái thắt chặt cấm vận ngành công nghệ Trung Quốc, bằng cách yêu cầu Nvidia và AMD không bán những GPU chuyên ngành phục vụ nhu cầu nghiên cứu và xử lý thuật toán machine learning cho Trung Quốc. Một phần khác của cấm vận là yêu cầu [...]

The post MỸ CẤM VẬN, TRUNG QUỐC XUẤT HIỆN CHỢ ĐEN GPU NGHIÊN CỨU AI, GIÁ GẤP ĐÔI CHÍNH HÃNG, KHÔNG BẢO HÀNH appeared first on ROSA Computer.

]]>
Kể từ tháng 9 năm ngoái, phía chính phủ Mỹ đã có những động thái thắt chặt cấm vận ngành công nghệ Trung Quốc, bằng cách yêu cầu Nvidia và AMD không bán những GPU chuyên ngành phục vụ nhu cầu nghiên cứu và xử lý thuật toán machine learning cho Trung Quốc. Một phần khác của cấm vận là yêu cầu tương tự đối với Nvidia và AMD, không được bán chip AI cao cấp cho Nga. Những động thái như thế này, theo phía Mỹ, là để ngăn chặn những công nghệ cao cấp nhất mà các tập đoàn của Mỹ rơi vào tay quân đội Nga và Trung Quốc, trang bị trong những siêu máy tính của hai quốc gia này, vận hành phục vụ mục đích quân sự.

Lệnh cấm vận này đồng nghĩa với việc, các đơn vị Trung Quốc không thể mua những GPU mạnh nhất hiện giờ của Nvidia như A100 và H100. Tương tự như vậy là những giải pháp của AMD như MI250. Lựa chọn duy nhất của phía Trung Quốc giờ là những giải pháp yếu hơn về hiệu năng, ví dụ như Nvidia A800 hay AMD MI100. Lấy ví dụ, A800 có băng thông bộ nhớ kết nối giữa các GPU với nhau, thông qua cầu nối NVLink 400GB/s, còn A100 là 600 GB/s.

Nguồn tin mới nhất của Reuters cho biết, cơn sốt AI tạo nội dung, khởi đầu với việc OpenAI cho ra mắt ChatGPT hồi cuối năm ngoái đã khiến nhu cầu GPU nghiên cứu AI của Nvidia bùng nổ ở Trung Quốc. Nhưng khi bị Mỹ cấm vận, đương nhiên chợ đen không được quản lý sẽ hình thành. Từ các startup đến các trường đại học và đơn vị nghiên cứu đều sẵn sàng trả thêm tiền để sở hữu những con chip mạnh nhất, miễn là có đơn vị sẵn sàng làm việc để giúp các đơn vị Trung Quốc qua mặt lệnh cấm vận của Mỹ.

Phóng viên Reuters đã tới thăm khu vực Hoa Cường Bắc, Thâm Quyến, khu chợ điện tử nổi tiếng nhất Trung Quốc. Họ gặp được 2 cửa hàng khẳng định rằng họ có thể nhập số lượng hạn chế những chip A100, GPU nghiên cứu AI mạnh nhất của kiến trúc Nvidia Ampere với giá 20 nghìn USD một chiếc. Mua chính hãng, mỗi GPU nghiên cứu AI này chỉ có giá 10 nghìn USD.

Tương tự, nhà sáng lập một startup đặt trụ sở tại Hong Kong cho biết, đặt mua 2 đến 4 chiếc Nvidia A100, anh này nhận được báo giá 19.150 USD một chiếc. Bên cạnh cái giá gấp đôi giá bình thường nếu không bị cấm vận, những GPU nghiên cứu AI này đều không có bảo hành.

Cùng với đó, 10 cửa tiệm trả lời phóng viên Reuters, rằng họ có thể đặt hàng số lượng hạn chế card A100, và còn khoe trong số những khách hàng của họ, có cả đơn vị đại diện cho chính quyền Thâm Quyến nữa. Đương nhiên, không cửa hàng nào hé lộ nguồn gốc xuất xứ của những GPU mạnh nhất hành tinh hiện giờ.

Trước đây, đọc tin tức trên các nguồn phương Tây, hẳn anh em cũng đã vài lần xem được những vụ việc công dân Trung Quốc buôn lậu linh kiện máy tính vào lãnh thổ nước này.

Có một vụ hồi tháng 5 vừa qua, một kiện hàng được ghi là tôm hùm, vận chuyển chung chuyến hàng 280 kg tôm hùm đã bị nhà chức trách Trung Quốc phát hiện ra có 70 card Nvidia Quadro K2200 bên trong. Một lần khác, có người buôn lậu buộc 239 con chip CPU quanh bụng để bay về Trung Quốc. Trong khi đó, cuối năm ngoái, một người phụ nữ giả bụng bầu, giấu 200 chip CPU Intel bên trong. Giữa thời điểm Trung Quốc bị chặn nguồn cung ứng chip bán dẫn từ các công ty Mỹ, việc lợi nhuận từ chợ đen bùng nổ cũng khiến cho những kẻ buôn lậu trở nên sáng tạo hơn nhiều trong những cách giấu những món hàng trốn thuế về quê nhà.

The post MỸ CẤM VẬN, TRUNG QUỐC XUẤT HIỆN CHỢ ĐEN GPU NGHIÊN CỨU AI, GIÁ GẤP ĐÔI CHÍNH HÃNG, KHÔNG BẢO HÀNH appeared first on ROSA Computer.

]]>
https://rosacomputer.com/2023/07/03/my-cam-van-trung-quoc-xuat-hien-cho-den-gpu-nghien-cuu-ai-gia-gap-doi-chinh-hang-khong-bao-hanh/feed/ 0 69