DATA INTERPRETER

(30 Ekim 2017) Tableau Desktop ile birden fazla veri kaynağına veri yapılarını ve sorgulama dillerini/yöntemlerini bilmeden bağlanmanın mümkün olduğunu biliyoruz. Kurumların elinde var olan çok çeşitli veri tabanı teknolojilerinin yanında, halen en çok kullanılan veri kaynaklarının başını Excel dosyalar çekmekte. Bu dosyalar kurum içinde oluşturulmuş bir takım özel rapor dosyaları olabileceği gibi, ham veri içeren listeler veya dış kurumlardan gelen belirli rapor şablonları şeklinde de olabilmekte. Çoğunlukla Excel dosyalar ile çalışılırken, merge edilmiş alanlar, rapora eklenmiş notlar ve bir takım özel formatlama işlemleri sebebiyle bir excel dosyayı raporlanabilir formata getirmek için kullanıcılar dosyalar üzerinde yapısal değişiklikler yapmak zorunda kalmaktadır. Tableau, kullanıcılarını bu dertten kurtaracak Data Interpreter denen bir özelliğe sahip. Data Source tab'ında bir Excel dosyaya bağlanıldığında Sheets başlığının hemen altında bir checkbox yanında "Use Data Interpreter" şeklinde bir seçenek görürüz. Bu checkbox tıklanarak Data Interpreter aktive edilebilir. Aşağıdaki excel dosyaya bağlandığımızda, Data Interpreter dosyayı bu özel formattan nasıl arındırıyor bunu birlikte inceleyelim.
Excel dosyaya bağlanalım ve Data Interpreter'i aktive etmeden önce view data simgesine tıklayarak verinin nasıl görüntülendiğini inceleyelim.
Aşağıda gördüğümüz gibi Tableau şu an kolon başlıklarını, merge edilmiş alanları ve rapor içerisindeki notları ayrıştıramadığı için elde ettiğimiz veri raporlanabilir formatta bir veri değil.
"Use Data Interpreter" seçeneğine tıklayıp tekrar view data dediğimizde artık elde ettiğimiz verinin raporlamaya hazır olduğunu görüyoruz.
Sol üstte tıklayarak data interpreter'i aktif hale getirdiğimiz checkbox'ın hemen yanında "Cleaned with Data Interpreter" iberesi ile, verinin Data Interpreter ile temizlendiği ve formatının düzenlendiğini anlıyoruz. Bunun hemen altında da Review the results linkini göreceğiz. Bu linke tıklayarak Tableau'nun data interpreter çalıştıktan sonra veri dosyası üzerinde ne gibi çalışmalar yaptığını özetleyen bir rapora ulaşabiliriz. Aşağıdaki görüntüde görüldüğü üzere, Review the results linkine tıklandıktan sonra açılan dosyanın ilk sheetinde data interpreter'in hücreler üzerinde yapması muhtemel operasyonların tanımlarını görüyoruz. Bazı alanlar kolon başlıkları olarak tanınıyor, bazı alanlar excel üzerinde merge edilmiş hücrelerden ayrıştırılarak oluşturuluyor, bazı hücreler veri alanı olarak değerlendirilmediği için tamamen temizlenip çıkarılıyor vs gibi aksiyonlar görüyoruz burada.
İkinci sheete tıkladığımızda da, bir önceki sheet içerisinde tanımlanmış operasyonların hangi hücreler üzerinde uygulandığını görebiliyoruz.
Excel dosyaya bağlanarak elde ettiğimiz veri artık yapısal olarak kullanıma hazır. Sağ taraftaki data source tasarım bölümüne sürüklediğimizde de, dosyaya ilk bağlandığımız andaki karmaşa ve format bozukluğunun artık giderilmiş olduğunu görebiliyoruz.
Data interpreter ile ilgili son bir kaç not:

   1. Kolon sayısı 2000 üzerinde olan veri kaynaklarını desteklemiyor. Kolon sayısı çok fazla olan veri kaynakları için satır sayısı da önemli bir kriter haline gelebiliyor.

   2. Eğer Tableau Desktop verinin temizlenip formatlanması için ekstra desteğe ihtiyaç görümüyorsa Data Interpreter seçeneği görüntülenmeyecektir.

   3. Data Interpreter veri değerlerini güncelleyecek herhangi bir değişiklik yapmaz. Yalnızca kolon başlıkları, veri alanları ve veri alanı olmayan hücreleri tespit edip bunları ayrıştırarak, bağlanılan veriyi raporlanabilir bir formatta sunmayı amaçlamaktadır.