CMS/DP-601T00A : Implementing a Lakehouse with Microsoft Fabric
4 days (24 hours) Intermediate Online NoSQL ve Büyük Veri
Bu DP-601 eğitimi, veri modelleme, çıkartma ve analiz konularında bilgi sahibi olan veri profesyonelleri için tasarlanmıştır. Bu eğitim, Lakehouse mimarisi, Microsoft Fabric platformu ve bu teknolojileri kullanarak uçtan uca analitik yetenekleri etkinleştirmek isteyen profesyoneller için idealdir. Bu kurs kapsamında, Microsoft Fabric üzerinde veri lakehouse'ları nasıl uygulayacağınızı öğreneceksiniz. Lakehouse'ın temelini anlayarak Fabric üzerinde veri mühendisliğini keşfedeceksiniz. Ayrıca, Apache Spark'ın dağıtılmış veri işleme için güçlü yeteneklerini keşfedecek, Delta Lake tabloları üzerinde çalışarak verimli veri yönetimi, sürümleme ve güvenilirlik için temel teknikleri öğreneceksiniz. Dataflows Gen2 ve Data Factory boru hatları kullanarak veri alımı ve orkestrasyonunu keşfedeceksiniz. Bu kurs, Lakehouse konseptine odaklanarak Microsoft Fabric üzerinde veri mühendisliği alanındaki temel becerilerinizi geliştirmek için tasarlanmıştır. Apache Spark'ın dağıtılmış veri işleme yeteneklerini keşfetmenin yanı sıra, Delta Lake tabloları üzerinde çalışarak verimli veri yönetimi, sürümleme ve güvenilirlik için temel teknikleri öğrenme fırsatı bulacaksınız. Aynı zamanda Dataflows Gen2 ve Data Factory boru hatları kullanarak veri alımı ve orkestrasyonunu da detaylı bir şekilde ele alacaksınız.
Eğitim İçeriği
Module 1: Introduction to Fabric and Lakehouses
- Introduction to end-to-end analytics using Microsoft Fabric
- Data teams and Fabric
- Enable and use Microsoft Fabric
- Get started with lakehouses in Microsoft Fabric
- What is a lakehouse?
- Work with a Fabric lakehouse
- Explore, transform, and visualize data in the lakehouse
Module 2: Work with data in a Lakehouse using Apache Spark
- Use Apache Spark in Microsoft Fabric
- Prepare to use Apache Spark
- Run Spark in Fabric
- Load data in a Spark Dataframe
- Transform data in a Spark Dataframe
- Partition the output file
- Work with data using Spark SQL
- Query data using the Spark SQL API
- Visualize data
- Work with Delta Lake tables in Microsoft Fabric
- Understand Delta Lake
- Create Delta tables using code in Spark
- Managed vs external tables
- Work with Delta tables in Spark
- Data versioning and time travel
- Use Delta tables with streaming data
Module 3: Ingest, transform, and orchestrate data in Fabric
- Ingest Data with Dataflows Gen2 in Microsoft Fabric
- Understand Dataflows (Gen2)
- Dataflow (Gen2) benefits and limitations
- Explore Dataflows (Gen2) in Microsoft Fabric
- Integrate Dataflows (Gen2) and pipelines in Microsoft Fabric
- Use Data Factory pipelines in Microsoft Fabric
- Pipelines in Microsoft Fabric
- Common Activities copy data
- Common activities pipeline templates
- Run and monitor pipelines
Öncesinde Önerilenler
-
Data Engineer
Büyük Verinin İşlenmesi, Yönetimi, Veri Kalitesini Arttırma, Bulut Bilişim ve Veri Bilimi için Kodlama, Spark ve Hadoop gibi Dağıtık Mimariler ile Çalışma.
- C/STATI : Betimleyici ve Çıkarımsal İstatistik Temelleri
- C/STATF : İstatistik Esasları
- C/STATF+ : İstatistik Esasları (Genişletilmiş)
- MS/20761C : Querying Data with Transact-SQL
- C/TVTS : T-SQL ile Veri Tabanı Sorgulama (Microsoft SQL Server)
- MS/20777A : Implementing Microsoft Azure Cosmos DB Solutions
- C/PBSSBI : Power BI ile Self Service BI
- C/IRFDS : R Dili ve R ile Veri Analizi
- C/PDE : Python Dili Esasları
- C/IPFDS : Python Dili ve Python ile Veri Analizi
- C/PVA : Python ile Veri Analizi
- MS/20762C : Developing SQL Databases (Microsoft SQL Server)
- CMS/20764C : Administering a SQL Database Infrastructure
- MS/DP-300 : Administering Relational Databases on Microsoft Azure
- MS/20765C : Provisioning SQL Databases
- MS/10987C : Performance Tuning and Optimizing SQL Databases
- CMS/20767B : Implementing a SQL Data Warehouse
- MS/20768C : Developing SQL Data Models
- MS/10990C : Analyzing Data with SQL Server Reporting Services
- C/DMDQ : Veri Yönetimi ve Veri Kalitesi
- C/ADMT : İleri Veri Modelleme Teknikleri
- CMS/DP-203 : Data Engineering on Microsoft Azure
- C/AZSC-Synapse : Fundamentals of Azure Synapse Analytics
- C/BDA-Synapse : Data Analytics Solutions Using Azure Synapse Analytics
- MS/DP-500 : Designing and Implementing Enterprise-Scale Analytics Solutions Using Microsoft Azure and Microsoft Power BI
-
Data Scientist
Yapay Zeka, Makine Öğrenimi, Derin Öğrenme Teknikleri ile Büyük Veri Kümelerinden Desen ve Eğilim Keşfetme
- C/STATI : Betimleyici ve Çıkarımsal İstatistik Temelleri
- C/STATF : İstatistik Esasları
- C/STATF+ : İstatistik Esasları (Genişletilmiş)
- MS/20761C : Querying Data with Transact-SQL
- C/TVTS : T-SQL ile Veri Tabanı Sorgulama (Microsoft SQL Server)
- C/PBSSBI : Power BI ile Self Service BI
- C/IRFDS : R Dili ve R ile Veri Analizi
- C/PDE : Python Dili Esasları
- C/IPFDS : Python Dili ve Python ile Veri Analizi
- C/PVA : Python ile Veri Analizi
- C/DMDQ : Veri Yönetimi ve Veri Kalitesi
- C/ADMT : İleri Veri Modelleme Teknikleri
- MS/AI-900 : Microsoft Azure AI Fundamentals
- MS/AI-100 : Designing and Implementing an Azure AI Solution
- MS/DP-100 : Designing and Implementing a Data Science Solution on Azure
- C/MOE : Makine Öğrenimi Esasları
- C/ADSB : Accelerated Data Science for Business
- C/AZSC-Synapse : Fundamentals of Azure Synapse Analytics
- MS/DP-500 : Designing and Implementing Enterprise-Scale Analytics Solutions Using Microsoft Azure and Microsoft Power BI
-
BI Professional
Veri kaynaklarının Keşfi, Veri Kalitesini Arttırma, ETL, Veriambarı Tasarım Prensipleri, Veri Modelleme ve Raporlama
- C/ERIT : Etkileyici Raporlama ile Karar Verme Gücünü Arttırın
- C/STATI : Betimleyici ve Çıkarımsal İstatistik Temelleri
- C/STATF : İstatistik Esasları
- C/STATF+ : İstatistik Esasları (Genişletilmiş)
- MS/20761C : Querying Data with Transact-SQL
- C/TVTS : T-SQL ile Veri Tabanı Sorgulama (Microsoft SQL Server)
- MS/20762C : Developing SQL Databases (Microsoft SQL Server)
- C/QSDEV : Qlik Sense Geliştirici
- C/PBI : Power BI ile Veri Analizi
- MS/DA-100 : Analyzing Data with Power BI
- C/PBSSBI : Power BI ile Self Service BI
- CMS/20767B : Implementing a SQL Data Warehouse
- MS/20768C : Developing SQL Data Models
- MS/10990C : Analyzing Data with SQL Server Reporting Services
- C/AZSC-Synapse : Fundamentals of Azure Synapse Analytics
- C/BDA-Synapse : Data Analytics Solutions Using Azure Synapse Analytics
- MS/DP-500 : Designing and Implementing Enterprise-Scale Analytics Solutions Using Microsoft Azure and Microsoft Power BI
Sonrasında Önerilenler
-
Data Engineer
Büyük Verinin İşlenmesi, Yönetimi, Veri Kalitesini Arttırma, Bulut Bilişim ve Veri Bilimi için Kodlama, Spark ve Hadoop gibi Dağıtık Mimariler ile Çalışma.
-
Data Scientist
Yapay Zeka, Makine Öğrenimi, Derin Öğrenme Teknikleri ile Büyük Veri Kümelerinden Desen ve Eğilim Keşfetme
-
BI Professional
Veri kaynaklarının Keşfi, Veri Kalitesini Arttırma, ETL, Veriambarı Tasarım Prensipleri, Veri Modelleme ve Raporlama