Verilerin miktarı, hızı ve karmaşıklığı arttıkça, veri bilimi alanı hızla büyümektedir. Bu alanda, en iyi veri bilimi çözümlerini tasarlamak için yetenek ve uzmanlık talebi her geçen gün artmaktadır. Ancak, bu gelişmeleri yönlendirecek uzmanlık, öğrencilerin çeşitli araçlar, programlama dilleri, bilgisayar çerçeveleri ve kütüphaneleri konusunda sağlam bir temel oluşturmalarını gerektiriyor.
Hızlandırılmış Veri Bilimi Eğitim Kiti
Bu nedenle, NVIDIA Derin Öğrenme Enstitüsü (DLI), nitelikli eğitimciler için Hızlandırılmış Veri Bilimi Eğitim Kitini ücretsiz olarak sunmuştur. Bu ücretsiz kit, Georgia Teknoloji Enstitüsü’nden Polo Chau ve Prairie View A&M Üniversitesi’nden Xishuang Dong gibi veri bilimi ve hızlandırılmış veri analitiği alanında tanınmış araştırmacılar ve eğitimcilerle ortaklaşa geliştirilmiştir.
Veri Biliminin Önemi
Chau, “Veri bilimi, verilerin toplumsal zorlukları çözmek ve çok sayıda karmaşık problemi ele almak için büyük bir potansiyel sunduğunu açığa çıkarıyor. Bu alan, iş, teknoloji, bilim ve mühendislikten sağlığı, hükümeti ve daha birçok alana kadar her türlü sektörde önemli bir rol oynamaktadır,” dedi.
Eğitim Kitinin İçeriği
Bu eğitim materyalleri, veri toplama, ön işleme, makine öğrenimi, ölçeklenebilir ve dağıtılmış bilişim, veri görselleştirme ve grafik analitiği gibi konuları kapsamaktadır. Aynı zamanda, hızlandırılmış bilişimden yararlanmayı vurgulayan ders materyalleri ve örnekler sunmaktadır.
DLI Eğitim Kitleri, eğitimciler için Google Colab kredileri gibi ücretsiz GPU kaynakları, öğrenciler için ise ücretsiz DLI çevrimiçi, kendin ilerle ve sertifika fırsatları ile birlikte gelmektedir.
Hızlandırılmış Veri Bilimi Eğitim Kitinin en son sürümü, Python kütüphanelerini kullanmayı gösteren yeni ders materyalleri ve laboratuvarlar içermektedir. Bu kütüphaneler — pandas, Polars ve NetworkX — hiç kod değişikliği yapmadan, NVIDIA GPU’larında CPU’lara kıyasla 10 kat ile 500 kat daha hızlı performans sunmaktadır.
Ayrıca, bu içerik, toplumsal adalet ve veri önyargısı gibi kültürel açıdan duyarlı konuları, yanı sıra temsil edilmeyen gruplardan gelen önemli bireylerin zorluklarını da ele almaktadır.
Hızlandırılmış Veri Bilimi Eğitim Kiti, şu konuları içeren odaklanmış modüller sunmaktadır:
- Veri Bilimine ve RAPIDS’e Giriş
- Veri Toplama ve Ön İşleme (ETL)
- Veri Etiği ve Veri Setlerinde Önyargı
- Veri Entegrasyonu ve Analitiği
- Veri Görselleştirme
- Hadoop, Hive, Spark, HBase ve RAPIDS ile Ölçeklenebilir Bilişim
- Dask ve UCX ile Ölçeklenebilir Bilişim
- Makine Öğrenimi (Sınıflandırma)
- Makine Öğrenimi (Kümeleme ve Boyut Azaltma)
- Sinir Ağları
- Grafik Analitiği
- Akış Verisi
- Genomik
- Metin Analitiği
- CPU ile GPU-hızlandırılmış Veri Bilimi
- Veri Bilim Ekipleri, Kod Yedekleme ve Versiyon Kontrolü
- Takım Projesi (Sahte Haber Tespiti)
Tüm modüller, sunum slaytları, sunum notları ve quiz/sınav problem kümeleri içermektedir. Çoğu modül, Python ve etkileşimli Jupyter not defteri formatında içerik ve örnek çözümlerle uygulamalı laboratuvarlar da sunmaktadır. Bazı modüller için ders videoları eklenmiş olup, gelecekte daha fazla video eklenmesi planlanmaktadır.
Dong, “Veri bilimi, sadece her sektörü etkilediği için değil, aynı zamanda cinsiyet, ırk, yaş ve insanlığın diğer etik unsurlarıyla ilgili önemli sosyal meselelere de değindiği için böyle önemli bir çalışma alanıdır,” dedi. Bu, DLI tarafından sunulan dördüncü Eğitim Kitidir ve bugüne kadar 10.000’den fazla nitelikli eğitimciye ulaşmıştır. NVIDIA Eğitim Kitleri hakkında daha fazla bilgi edinin.
Bu yazı ilk olarak 2 Eylül 2021 tarihinde yayımlanmış, ancak yeni Hızlandırılmış Veri Bilimi Eğitim Kiti ile güncellenmiştir.