Home page / Technology updates

Microsoft Fabric Data Warehouse tăng tốc bằng GPU: Phân tích dữ liệu nhanh hơn tới 7 lần

Ngày 3/6/2026, Microsoft đã công bố bản xem trước (Early Access Preview) của Fabric Data Warehouse được tăng tốc bằng GPU. Giải pháp này hứa hẹn mang lại hiệu năng phân tích nhanh hơn tới 7 lần, đặc biệt với các workload AI và phân tích phức tạp, mà không yêu cầu doanh nghiệp phải viết lại truy vấn hay thay đổi hệ thống. Đây là một bước tiến quan trọng giúp các ứng dụng, agent và hệ thống AI có thể truy vấn dữ liệu liên tục, từ đó đưa ra quyết định nhanh hơn và làm việc với dữ liệu hiệu quả hơn.

Giới thiệu Fabric Data Warehouse tăng tốc bằng GPU

Fabric Data Warehouse tăng tốc bằng GPU được xây dựng chuyên biệt để cung cấp khả năng phân tích nhanh, có thể dự đoán ở quy mô lớn, đáp ứng nhu cầu của các nhà phân tích, kỹ sư và lập trình viên. Tính năng này thay đổi vai trò của kho dữ liệu từ một hệ thống báo cáo truyền thống thành một lớp thực thi (execution layer) cho các ứng dụng, agent và hệ thống AI.

Bằng cách sử dụng công nghệ điện toán tăng tốc của NVIDIA, Microsoft đã xây dựng một engine giúp các truy vấn SQL quen thuộc chạy nhanh hơn bao giờ hết, đặc biệt khi độ đồng thời, quy mô và độ phức tạp tăng lên. Tầm quan trọng của công trình này đã được cộng đồng nghiên cứu công nhận, bao gồm giải thưởng Bài báo Công nghiệp Tốt nhất tại hội nghị SIGMOD cho nghiên cứu CoddSpeed: Hardware Accelerated Query Processing in Microsoft Fabric.

Việc sử dụng Fabric Data Warehouse tăng tốc bằng GPU rất đơn giản, không cần viết lại truy vấn hay quản lý hệ thống mới. Doanh nghiệp có thể bật tính năng này từ cài đặt workspace, và nó sẽ áp dụng cho tất cả các SQL Analytics Endpoint và Data Warehouse trong workspace đó. Khi người dùng chọn “Run”, các truy vấn đủ điều kiện sẽ tự động được tăng tốc, cho phép các nhóm thực thi nhanh hơn với ít công sức tinh chỉnh thủ công hơn.

Kích hoạt tính năng tăng tốc truy vấn bằng GPU trong Microsoft Fabric.

Phân tích nhanh hơn, ra quyết định tốt hơn

Nhiều khách hàng của Microsoft trong các lĩnh vực dịch vụ chuyên nghiệp, y tế và sản xuất đã nhận thấy giá trị từ Fabric Data Warehouse tăng tốc bằng GPU.

Trong ngành y tế, thông tin chi tiết kịp thời là rất quan trọng, và Fabric Data Warehouse tăng tốc bằng GPU sẽ giúp đảm bảo dữ liệu quan trọng luôn sẵn sàng khi các bác sĩ và nhà lãnh đạo cần đến nhất. Chúng tôi nhận thấy tốc độ truy vấn cải thiện tới 5 lần, cho phép đội ngũ của chúng tôi dành ít thời gian hơn để quản lý hiệu năng và nhiều thời gian hơn để cung cấp những thông tin chi tiết có ý nghĩa.
Shaun McDonald, IT Manager, UNC Health

Trải nghiệm của chúng tôi với Fabric Data Warehouse tăng tốc bằng GPU rất tuyệt vời. Khả năng này tích hợp liền mạch vào kiến trúc hiện có của chúng tôi và đã mang lại những cải thiện hiệu năng đáng kể trên nhiều loại truy vấn, với các workload phức tạp chạy nhanh hơn 3,4 lần ở mức độ đồng thời đơn và ổn định hơn.
Andrew Bradbrook, Director – Systems Architecture, WTW

Tính năng Fabric Data Warehouse tăng tốc bằng GPU tích hợp trơn tru với môi trường Fabric hiện có của chúng tôi và rất dễ để kích hoạt và đánh giá. Chúng tôi quan sát thấy sự cải thiện hiệu năng rõ rệt đối với các workload kho dữ liệu nặng về phân tích, bao gồm cả việc thực thi các truy vấn phức tạp nhanh hơn. Khả năng này đặc biệt có giá trị cho các kịch bản báo cáo quy mô lớn.
Rajkumar Maheshwar, Sr. Manager, Enterprise Data Engineering, Benjamin Moore

Cơ chế hoạt động

Khi người dùng chạy một truy vấn, việc tăng tốc bằng GPU diễn ra hoàn toàn tự động. Các truy vấn đi qua SQL frontend, nơi chúng được phân tích và tối ưu hóa như hiện tại. Sau đó, truy vấn được chuyển đến engine phân tán, nơi nó được chia thành các mảnh và phân phối công việc trên toàn hệ thống.

Điểm khác biệt nằm ở cách thực thi truy vấn. Thay vì gửi toàn bộ công việc đến CPU, trình tối ưu hóa có thể đẩy các phần đủ điều kiện của kế hoạch truy vấn sang GPU. Điều này xảy ra một cách thông minh, giúp tăng tốc các hoạt động như join và aggregation lớn, trong khi phần còn lại vẫn thực thi trên CPU. Nếu một truy vấn không đủ điều kiện để thực thi trên GPU, nó sẽ liền mạch chạy trên CPU, đảm bảo tính đúng đắn.

Kết quả là một hệ thống không có gì thay đổi đối với người dùng: vẫn là bề mặt T-SQL, công cụ và kiến trúc quen thuộc. Điều duy nhất thay đổi là hiệu năng. Bằng cách đưa GPU vào engine thực thi, Fabric Data Warehouse có thể xử lý nhiều dữ liệu hơn song song, giảm độ trễ cho các truy vấn phức tạp và mang lại hiệu năng ổn định, độ trễ thấp cần thiết cho các ứng dụng phân tích, ứng dụng và hệ thống AI hiện đại.

Để định lượng tác động của việc tăng tốc bằng GPU, Microsoft đã chạy các bài kiểm tra benchmark theo tiêu chuẩn ngành với ba nhà cung cấp kho dữ liệu đám mây tương đương và quan sát thấy hiệu năng nhanh hơn tới 7 lần trong các kịch bản phân tích báo cáo, ứng dụng và AI. Đây là những workload thường đẩy các hệ thống đến giới hạn, với nhiều người dùng và agent cùng lúc gửi truy vấn.

Biểu đồ so sánh thời gian chạy truy vấn giữa Fabric Data Warehouse tăng tốc bằng GPU và các đối thủ cạnh tranh ở các mức độ đồng thời khác nhau.

Hình: Thời gian chạy truy vấn ở các mức độ đồng thời (1, 16, 64 người dùng). Fabric Data Warehouse tăng tốc bằng GPU cho thời gian thực thi thấp hơn, với hiệu năng nhanh hơn tới 7 lần ở mức độ đồng thời cao.

Ở quy mô dữ liệu 100 GB, điều nổi bật không chỉ là tốc độ của các truy vấn riêng lẻ, mà còn là cách hệ thống hoạt động dưới tải. Khi độ đồng thời tăng lên, hầu hết các kho dữ liệu đều chậm lại và trở nên khó dự đoán hơn. Ngược lại, kho dữ liệu tăng tốc bằng GPU của Fabric vẫn duy trì hiệu năng ổn định, hoàn thành toàn bộ workload 22 truy vấn trong khoảng năm giây dù chỉ có một người dùng hay 64 người dùng đồng thời.

Xây dựng trên nền tảng điện toán tăng tốc của NVIDIA

Nền tảng điện toán tăng tốc của NVIDIA là yếu tố cốt lõi của khả năng này. Microsoft sử dụng các kernel CUDA tùy chỉnh cho các hoạt động quan trọng như join, aggregation, scan và tính toán số học, đồng thời tận dụng LibTorch để quản lý bộ nhớ và các hoạt động đa dụng. Điều này cho phép khai thác khả năng xử lý song song khổng lồ của GPU để tăng tốc các workload phân tích trong thực tế mà vẫn duy trì tính đúng đắn và độ tin cậy của cơ sở dữ liệu.

Các phép join SQL phức tạp và quét dữ liệu quy mô lớn cung cấp năng lượng cho các workload AI agentic thường biến các hệ thống xử lý dữ liệu truyền thống thành một nút thắt cổ chai, đặc biệt là dưới áp lực đồng thời cao từ người dùng. Bằng cách giảm tải một cách thông minh các hoạt động tính toán chuyên sâu cho nền tảng điện toán tăng tốc của NVIDIA, Microsoft Fabric Data Warehouse hoạt động nhanh hơn 6 lần so với Fabric Data Warehouse chỉ dùng CPU. Các nhóm dữ liệu giờ đây có thể chạy các truy vấn T-SQL nặng về tài nguyên với độ trễ cực thấp, mở ra các ứng dụng AI sản xuất nhanh hơn và có khả năng mở rộng tốt hơn.
Todd Mostak, Senior Director, Analytics and Data Intelligence, NVIDIA

Kỷ nguyên mới cho ngành phân tích dữ liệu

Khi các ứng dụng, agent và hệ thống AI ngày càng phụ thuộc vào dữ liệu, hiệu năng không còn chỉ là một vấn đề kỹ thuật. Nó trở thành một phần của trải nghiệm người dùng. Mọi truy vấn đều quan trọng và mọi sự chậm trễ đều có thể nhận thấy. Fabric Data Warehouse tăng tốc bằng GPU giải quyết sự thay đổi này bằng cách mang đến một mô hình thực thi mới cho ngành phân tích, một mô hình mang lại hiệu năng có thể dự đoán ở quy mô lớn và cho phép một lớp kịch bản sử dụng mới. Đây không chỉ là một cải tiến về tốc độ, mà là một sự thay đổi cơ bản trong cách các hệ thống phân tích được xây dựng và sử dụng, cung cấp năng lượng cho các ứng dụng và agent do AI điều khiển.

Bắt đầu

Fabric Data Warehouse tăng tốc bằng GPU sẽ sớm khả dụng dưới dạng bản xem trước truy cập sớm (early access preview) tại bốn khu vực. Doanh nghiệp có thể đăng ký ngay hôm nay để có quyền truy cập và bắt đầu xây dựng ứng dụng cũng như cung cấp thông tin chi tiết từ AI và BI nhanh hơn bao giờ hết.

👋 Hi! Bạn cần tư vấn gì về dịch vụ Microsoft?