C/IRFDS : R Dili ve R ile Veri Analizi
3 gün (18 Saat) Orta Sınıf / Online İş Zekası ve İleri Analitik
R dili 1993 yılından bu yana istatistiksel hesaplamalar, tahmine dayalı analizler, veri görselleştirme ve raporlama alanları söz konusu olduğunda en çok tercih edilen dildir. Karmaşık istatistiksel hesaplamalar yapabilme, sonuçları çok geniş yelpazedeki görsellerle sunabilme yeteneği olduğu için özellikle akademik camia tarafından tercih edilmekte ve desteklenmektedir. "R Dili ile Veri Analizine Giriş" eğitimi ile R dili ve ilgili araçlar ile çeşitli veri kaynaklarına bağlanacak, verileri düzenleyecek ve veri görselleştirmeye odaklanacağız.
Eğitim İçeriği
Module 1: Veri Analitiği Tipleri ve Veri Analizi Süreçleri
- Veri Analitiği Tipleri ve İstatistiksel Yaklaşım
- Descriptive, Diagnostic, Predictive, Prescriptive
- Veri Analizi Süreci
- Capture, Integrate, Organize, Analyze, Act
- Veri Yönetiminde Evrim, Trend Konular, İhtiyaçlar, Zorluklar ve Çözümler
- Operasyonel Veritabanları, Veri Ambarları, Veri Gölleri
- Veri, Büyük Veri, NoSQL Kavramları
Module 2: Çalışma Ortamını Hazırlama
- R Dünyasına Giriş
- Anaconda Kurulumu
- Jupyter Notebook ile Çalışma
- R Console ve R Studio ile Çalışma
- Help Kullanımı
- Paket Kavramı ve Paket İndirme, Çalışma Ortamına Alma
- Markdown Dili Esasları
Module 2: Operatorler
- Matematiksel Operatorler
- Karşılaştırma Operatorleri
- Atama Operatorleri
- Mantıksal Operatorler
- Kontol Operatorleri
- Üyelik Operatoru
Module 3: Tip Dönüşümü
- Açık ve Örtülü Tip Dönüşümü
- Dışarıdan Değer Alma
- String Fonksiyonları
- Regex ifadeleri ile Çalışma
- String Formatlama
Module 4: Tarih ve Zaman Veri Tipleri İle Çalışma
- Tarih, Zaman ve Zaman Farkı ile ilişkili Tipler
- Tarih Üretme ve Güncelleme
- Zamanda Hareket Etme
- İstenen Formatta Yazdırma
Module 5: Kara Yapıları ve Döngüler
- if, else if, else Yapısı
- ifelse Yapısı
- for Döngüsü
- while Döngüsü
- repeat Döngüsü
Module 6: Hata Yönetimi
- Hata Türleri
- try ile Hata Yönetimi
- tryCatch ile Hata Yönetimi
Module 7: Fonksiyonlar
- Fonksiyon Tanımlama (multi-line, inline)
- Parametre Tanımlama ve Kullanım Esasları
- İç İçe Fonksiyonlar
- Recursive Çağıran Fonksiyonlar
Module 8: Container Tiplerin Detaylı İncelenmesi
- Vector Tipi Çalışma Esasları
- Matrix ve Array Tipleri ile Çalışma Esasları
- List Tipi ile Çalışma Esasları
- Data.Frame ile Çalışma
- Hazır Veri Kümeleri ile Çalışma
Module 9: Veri Kaynaklarına Bağlanma ve dplyr Kütüphanesine Giriş
- csv, json ve Excel Dosyaları ile Çalışma
- SQL Server ile Çalışma
- dplyr Kütüphanesine Giriş
- select, filter, group_by, arrange, join vs. Fonksiyonlarının Kullanımı
Module 10: Veri Görselleştirmeye Giriş
- graphics Nesnelerinin Kullanımı
- plot, hist, barplot, pairs vs. ile Veri Görselleştirme
- ggplot2 Kütüphanesi ile Çalışma Esasları
Öncesinde Önerilenler
-
Data Engineer
Büyük Verinin İşlenmesi, Yönetimi, Veri Kalitesini Arttırma, Bulut Bilişim ve Veri Bilimi için Kodlama, Spark ve Hadoop gibi Dağıtık Mimariler ile Çalışma.
- C/STATI : Betimleyici ve Çıkarımsal İstatistik Temelleri
- C/STATF : İstatistik Esasları
- C/STATF+ : İstatistik Esasları (Genişletilmiş)
- MS/20761C : Querying Data with Transact-SQL
- C/TVTS : T-SQL ile Veri Tabanı Sorgulama (Microsoft SQL Server)
- MS/20777A : Implementing Microsoft Azure Cosmos DB Solutions
- C/PBSSBI : Power BI ile Self Service BI
-
Data Scientist
Yapay Zeka, Makine Öğrenimi, Derin Öğrenme Teknikleri ile Büyük Veri Kümelerinden Desen ve Eğilim Keşfetme
Sonrasında Önerilenler
-
Data Engineer
Büyük Verinin İşlenmesi, Yönetimi, Veri Kalitesini Arttırma, Bulut Bilişim ve Veri Bilimi için Kodlama, Spark ve Hadoop gibi Dağıtık Mimariler ile Çalışma.
- C/IPFDS : Python Dili ve Python ile Veri Analizi
- C/PVA : Python ile Veri Analizi
- MS/20762C : Developing SQL Databases (Microsoft SQL Server)
- CMS/20764C : Administering a SQL Database Infrastructure
- MS/DP-300 : Administering Relational Databases on Microsoft Azure
- MS/20765C : Provisioning SQL Databases
- MS/10987C : Performance Tuning and Optimizing SQL Databases
- CMS/20767B : Implementing a SQL Data Warehouse
- MS/20768C : Developing SQL Data Models
- MS/10990C : Analyzing Data with SQL Server Reporting Services
- C/DMDQ : Veri Yönetimi ve Veri Kalitesi
- C/ADMT : İleri Veri Modelleme Teknikleri
- CMS/DP-203 : Data Engineering on Microsoft Azure
- C/AZSC-Synapse : Fundamentals of Azure Synapse Analytics
- C/BDA-Synapse : Data Analytics Solutions Using Azure Synapse Analytics
- MS/DP-500 : Designing and Implementing Enterprise-Scale Analytics Solutions Using Microsoft Azure and Microsoft Power BI
- CMS/DP-601T00A : Implementing a Lakehouse with Microsoft Fabric
- C/DAWS : Big Data Analysis with Spark
- C/PSS : PySpark ile Spark SQL
- C/VBL : Veri Bilimcileri için Linux
- C/VMUP : Veri Mimarisinde Ustalaşma Programı
-
Data Scientist
Yapay Zeka, Makine Öğrenimi, Derin Öğrenme Teknikleri ile Büyük Veri Kümelerinden Desen ve Eğilim Keşfetme
- C/IPFDS : Python Dili ve Python ile Veri Analizi
- C/PVA : Python ile Veri Analizi
- C/DMDQ : Veri Yönetimi ve Veri Kalitesi
- C/ADMT : İleri Veri Modelleme Teknikleri
- MS/AI-900 : Microsoft Azure AI Fundamentals
- MS/AI-100 : Designing and Implementing an Azure AI Solution
- MS/DP-100 : Designing and Implementing a Data Science Solution on Azure
- C/MOE : Makine Öğrenimi Esasları
- C/ADSB : Accelerated Data Science for Business
- C/AZSC-Synapse : Fundamentals of Azure Synapse Analytics
- MS/DP-500 : Designing and Implementing Enterprise-Scale Analytics Solutions Using Microsoft Azure and Microsoft Power BI
- CMS/DP-601T00A : Implementing a Lakehouse with Microsoft Fabric
- C/DAWS : Big Data Analysis with Spark
- C/PSS : PySpark ile Spark SQL
- C/VBL : Veri Bilimcileri için Linux