홈페이지 / 기술 업데이트

Microsoft nâng cấp Fabric Data Factory: Tăng tốc tích hợp dữ liệu và AI

Tại sự kiện Microsoft Build 2026 vừa qua, Microsoft đã công bố hàng loạt nâng cấp quan trọng cho Fabric Data Factory, nền tảng tích hợp dữ liệu hợp nhất trong Microsoft Fabric. Các cải tiến này giúp doanh nghiệp tăng tốc độ chuyển đổi dữ liệu thành thông tin giá trị, củng cố bảo mật cho các workload trọng yếu, và đơn giản hóa việc xây dựng ứng dụng AI thế hệ mới.

Fabric Data Factory hợp nhất các tính năng đã được kiểm chứng của Azure Data Factory, trải nghiệm low-code hiện đại và tích hợp sâu với AI vào một nền tảng SaaS duy nhất. Kết quả không chỉ là việc tích hợp dữ liệu dễ dàng hơn, mà còn là một nền tảng sẵn sàng cho lập trình viên để xây dựng các ứng dụng AI, agent và phân tích thế hệ tiếp theo.

Sơ đồ tổng quan các khả năng của Fabric Data Factory

Bảo mật và quản trị cấp doanh nghiệp

Fabric Data Factory cung cấp các tính năng bảo mật, quản trị và giám sát vận hành cấp doanh nghiệp, cho phép các nhóm tích hợp dữ liệu nhanh chóng mà không phải hy sinh các cơ chế kiểm soát. Các công bố mới tại Build 2026 tập trung vào việc tăng cường khả năng giám sát và bảo mật.

Bản xem trước (Preview):

  • Chẩn đoán nâng cao cho Dataflow Gen2: Cung cấp log end-to-end chi tiết hơn cho các lần chạy Dataflow Gen2 đi qua on-premises data gateway (OPDG), giúp các nhóm xác định lỗi nhanh hơn và đảm bảo các tác vụ làm mới dữ liệu quan trọng đúng tiến độ.

Phát hành chính thức (GA):

  • Nạp dữ liệu an toàn vào Fabric Data Warehouse: Tính năng Copy jobCopy activity hiện hỗ trợ workspace staging trong các cấu trúc mạng được bảo vệ nghiêm ngặt nhất, bao gồm các workspace sử dụng private link, bật bảo vệ truy cập ra ngoài (outbound access protection) và định tuyến qua VNet data gateway hoặc OPDG.

Hợp nhất dữ liệu với OneLake và Mirroring

Fabric Data Factory cho phép khách hàng hợp nhất toàn bộ tài sản dữ liệu của mình với OneLake, giảm thiểu việc sao chép dữ liệu nhiều lần. Các cải tiến về mirroring (sao chép dữ liệu gần thời gian thực) giúp kết nối an toàn và riêng tư hơn.

  • Mirroring với Workspace Private Link: Hỗ trợ cho Azure SQL DB, SQL Server (2016–2022), SAP Datasphere và SharePoint List, cho phép đưa các nguồn dữ liệu doanh nghiệp quan trọng này vào OneLake qua các mạng riêng tư, được quản trị.
  • Tích hợp mirroring mở với Stelo: Cho phép streaming dữ liệu thay đổi (change data) theo thời gian thực vào Fabric mà không cần xây dựng lại pipeline, giúp sao chép dữ liệu có tác động thấp và gần như real-time từ nhiều nguồn khác nhau.

Chuyển đổi dữ liệu hiệu suất cao

Fabric Data Factory kết hợp trải nghiệm self-service của Dataflow Gen2 với các workflow SQL code-first của dbt (công cụ chuyển đổi dữ liệu dựa trên SQL), giúp cả chuyên viên phân tích và kỹ sư dữ liệu có thể làm việc với công cụ tốt nhất.

  • Dataflow – Execute Query API (Streaming API): Thực thi các truy vấn Power Query theo chương trình với độ trễ thấp trên các nguồn dữ liệu trực tiếp.
  • Mapping Data Flows (MDF) Transform: Các biến đổi của Mapping Data Flow từ Azure Data Factory đã được tích hợp vào Dataflow Gen2 (khả dụng từ tuần 8/6/2026), mang lại khả năng data engineering trên Spark ở quy mô lớn bằng low-code.
  • Cải thiện hiệu năng Warehouse → Lakehouse: Tối ưu hóa việc di chuyển dữ liệu từ Warehouse sang Lakehouse cho các mô hình lakehouse hiện đại.
  • My Queries: Cho phép người dùng quản lý các truy vấn thường dùng ở một nơi, giảm trùng lặp và tăng tốc quy trình chuẩn bị dữ liệu.
  • Modern Get Data trong Power BI Desktop: Hiện đại hóa trải nghiệm Power Query, giúp người dùng tìm và kết nối dữ liệu nhanh hơn thông qua OneLake Catalog.

Điều phối pipeline thông minh và linh hoạt

Microsoft đã giới thiệu hàng loạt cải tiến cho việc điều phối pipeline, tích hợp Apache Airflow và hỗ trợ từ Copilot, giúp các nhóm làm việc hiệu quả trên một nền tảng duy nhất.

  • Pipeline Activity mới: Bao gồm các activity để làm mới SQL analytics endpoint, tích hợp phê duyệt từ người dùng (Approval Activity) và làm mới Materialized Lakeview.
  • Cải tiến Pipeline: Hỗ trợ thử lại có điều kiện (Conditional Retries), canvas được cập nhật cho các pipeline lớn, và hỗ trợ tham chiếu Connection/Item để đơn giản hóa việc chuyển đổi giữa các môi trường.
  • Cải tiến Airflow: Hỗ trợ Workspace Identity, thư viện biến dùng chung và đặc biệt là Airflow Copilot—trợ lý AI sử dụng ngôn ngữ tự nhiên để soạn thảo và gỡ lỗi các DAG của Airflow.

Mở rộng kết nối và di chuyển dữ liệu

Copy job trong Fabric Data Factory tiếp tục được mở rộng để hỗ trợ nhiều nguồn và đích hơn, các mẫu ghi nhận thay đổi dữ liệu (change data capture – CDC) thông minh hơn, và khả năng trích xuất dữ liệu gốc từ SAP.

  • CDC cho SQL: Hỗ trợ CDC sẵn sàng cho môi trường production trên Azure SQL DB, Azure SQL MI và SQL Server.
  • Hỗ trợ nhiều đích hơn: Copy job hiện hỗ trợ Google BigQuery (GBQ), MySQL và PostgreSQL làm đích, thúc đẩy di chuyển dữ liệu multi-cloud.
  • Hỗ trợ SAP: Copy job với add-on ABAP cho phép trích xuất dữ liệu thông lượng cao, nguyên bản từ SAP mà không cần các giải pháp tùy chỉnh phức tạp.

Sẵn sàng cho kỷ nguyên AI Agent

Fabric Data Factory hiện đã sẵn sàng cho AI agent. Các agent và trợ lý Copilot có thể soạn thảo, vận hành và chẩn đoán mọi thành phần của Data Factory thông qua một bộ kỹ năng (skill) duy nhất.

  • Data Factory Skills (Preview): Cung cấp các skill để AI agent có thể tương tác với Pipelines, Copy job, Connections & Gateways, cùng với các skill đã có cho Dataflow Gen2.
  • Hỗ trợ Airflow cho Data Factory MCP: Mở rộng khả năng soạn thảo và chẩn đoán do agent điều khiển cho các DAG Airflow, hợp nhất trải nghiệm AI trên cả low-code và pro-code.

Lộ trình chuyển đổi từ Azure Data Factory

Microsoft cam kết cung cấp một trải nghiệm nâng cấp liền mạch từ Azure Data Factory (ADF) lên Fabric Data Factory. Một trong những cập nhật quan trọng nhất là việc hỗ trợ di chuyển các tài sản Mapping Data Flow (MDF) hiện có lên Fabric Data Factory thông qua một công cụ có hướng dẫn, đã khả dụng từ tuần 8/6/2026. Điều này giúp các doanh nghiệp tự tin áp dụng Fabric Data Factory làm nền tảng tích hợp dữ liệu thế hệ mới của mình.

👋 Hi! Bạn cần tư vấn gì về dịch vụ Microsoft?