Son Yılların Yükselişteki Mesleği Veri Bilimcisi (Data Scientist) Nedir, Ne Değildir?

Veri bilimi, veri analisti (data scientist) ve benzeri iş kollarını da doğurmuş durumda ve iş hayatında yavaş yavaş önemli yer kaplıyorlar. Buyrun açıklayalım.
Son Yılların Yükselişteki Mesleği Veri Bilimcisi (Data Scientist) Nedir, Ne Değildir?
iStock

Veri bilimi nedir?

eldeki datayı (big data) ürünlere ve şirketin yönetimi için öngörülere çevirebilme işi. ürüne örnek, artık bir şey satılan her web sitesinde gördüğünüz "bunu beğenen bunu da beğendi" gibisinden işler, öngörüye örnek de bugüne kadarki kullanımlara bakarak ilerde şirketin ne tarafa giderse (ürün kataloğu, ya da kampanya analizleri vs) daha verimli olacağı gibi şeyler.

ama valla artık nasıl bir patlamaysa herkes veri bilimci arıyor. hayatımda ilk defa adını duyduğum kentucky'de, 59.000 nüfuslu bir şehirdeki bir iç giyim üreticisinden iş teklifi alacaksın deselerdi inanmazdım.

şirketlerin kafasındaki mantık şu şekil: web siten var mı, var. demek elinde kullanıcı logları var. o big data sayılır, elimizdeki en büyüğü o zaten. o veriyi adam gibi işleyecek birilerini alalım, herkes yapıyor biz niye yapmayalım?

Kimlere veri analisti denir?

veri bilimi, ne olup ne olmadığı hakkında inanılmaz bir kavram karmaşası ve şirket hr'larında akıl karışıklığı olan bir iş kolu.

iş ilanını data scientist olarak çıkaran bir şirkette icra ettim ve ayrılırken 'kusura bakmayın, bu işin data science ile alakası yok' dedim. iş ilanını data analyst olarak çıkaran başka bir şirkete gidiyorum şimdi, fakat işin kendisi data science.

title olarak popüler bir title fakat beni ilgilendiren asıl şey içeriği.

* adı üstünde veri ile çalışabilen, bunun için istatistik bilgisi olan

* veri temizleme ve veriyi evcilleştirme işlemini ciddiye alan ve işin %90'lık kısmının ve işin en önemli kısmının bu olduğunun farkında olan

* problemin ortaya konulmasıyla birlikte nasıl bir veriye ve yönteme ihtiyacı olduğunu anlayıp, anlatabilen

* veriyi görür görmez hangi programlama dili, hangi paket, hangi araç, hangi visualization kullanılacak, nereden başlanacak, nereye gidilecek anlayabilen

* veriyle çalışırken sürprizlere açık olan, o sürprizleri fırsata çevirebilecek

* machine learning, artificial intelligence alanında ilgi ve bilgi sahibi, endüstriyel uygulamalarından haberdar

* büyük veriyle çalışmak için gerekli platformlardan haberdar ve bunları kullanabilen

* genel anlamda algoritma geliştirebilen

* sonuçları yorumlayabilen, sonuçlara dayanarak karar verebilen ya da karar vericileri ikna edebilip, yönlendirebilen

* eğer ki pozisyon yazılımcılarla diyalog içeriyorsa, yapılacakları yazılımcılara da anlatabilen

* kendini sürekli yenilemek zorunda olan, özellikle de işlerin gittiği bu hıza yetişebilmek için yenilikleri, konferansları, yayınları takip etmek durumunda olan

kişilere deniyor.


bir de boktan taraflarına bakalım

* işi yapmak kadar anlatabilmek de önemli. yani devasa teknik detayları olan bir çalışmanın sonucunu çoğu kez bilal'e anlatacaksınız, ki zurnanın zırt dediği yer de burası. aklınız level üstüne level atlamışken, karşınızda en basit istatistik konsepti bilmeyen bir adama iki histogramın aynı şey olmadığını anlatmak zorunda kalmak emin olun işin kendisini yapmaktan daha zor. çünkü onun için şekil itibarı ile ikisi de birbirine benziyorsa, siz bir aydır aynı şeyi yapmışsınızdır. (bkz: organize işler filoloji esprisi)

* o sebepten işin adı science da olsa, bilimsel detayları ve etiği boş vermek gerekiyor, işin güzelim detaylarını atlayıp bilal'i ilgilendiren kısmı üç beş güzel görselle ve üç beş süslü kelimeyle (bkz: corporate language) özetlemek zorunda olmak cidden çok sinir bozucu.

* yukarıdaki maddeyle bağlantılı olarak, yöneticilerin beklentisi tam olarak şunu bilmek, bize veriden para kazandırabilir misin?

hayır cicim, gucci nasıl ki parayı pamuk tarlasından kazanmıyorsa, sen de parayı veriden kazanmayacaksın, çünkü google değilsin. verinin sana getireceği, ne yaptığını bilerek yapman, müşterinin karşısına son gelişmeleri takip etmeyen, kendini modernize edememiş bir avanak olarak değil, çağını yakalayabilen bir firma olma güveniyle çıkman, sana veriyle ne yaptığını sordukları zaman apışıp kalmaman. veriden para kazanmak için ciddi yatırım ve dönüşüm yapman gerekiyor. o yatırımı yapmadan bir veri bilimciyi ise alıp sihirli değnek bekleyenlerle çalışmak bu işin başka bir sinir bozucu tarafı.

* bu işin en boktan tarafı ise şu: verinin yalan söylemediğini gören hımbıl çalışma arkadaşları o yalanı sizin söylemenizi bekleyebilir. döngü şöyle işler:

veri uzmanı epey meşakkatli bir süreçle veriyi konuşturduktan sonra, sonuçlar birilerinin işine gelmez. (ki böyle birileri illaki vardır. işin niteliğine göre artık, analizin bir noktasında illaki olmaması gereken bir şeye toslarsınız.)

bu kişiler önce veri uzmanını ikna etmeye çalışır, aramızda kalabilir mi? minvalinden ricalar başlar.

bu noktada yönetim ile iş arkadaşları arasında, farklı departmanlar arasında, bizzat kendi yöneticiniz ile onun üstü arasında vs. vs. gibi boktanlık skalası değişebilen bir yerde, arada kalırsınız.

işin bir kısmı raporlama olduğundan ve belli bir şeffaflık gerektiğinden, sonuçları manipüle etmek ya da kendi isminize leke getirmemek gibi iki seçeneğiniz vardır, genelde bir üçüncüsü yoktur. (sonuçları excel'e taşıdıktan sonra manipüle edenini bizzat gördüm.)


üçüncü bir seçenek varsa, şuna benzer:
durum çok vahim değildir, sonuçlar direkt etkilenmiyordur, şirkete getirisi götürüsü direk olan bir şey değildir, ve tesadüfen rastlanılmış olup esasen raporlanması istenen şey değildir. o zaman görmezden gelmek kimseye zarar vermez.

diğer durumlarda ise veri uzmanı kendini yeminli tercüman gibi düşünmeli ve öyle davranmalı. verinin dilini teknik altyapısı olmayan insanlara tercüme ediyorsunuz, ve birisi kıçını yaydı, işini düzgün yapmadı ise, bu sizin de işinizi düzgün yapmayacağınız anlamına gelmez, çünkü tercümanın bile isteye bir cümleyi yanlış çevirmesi nasıl bir şerefsizlikle, sizin de sonuçları manipüle etmeniz öyle bir şerefsizliktir.

durumu anlatmaya çalışırsınız, sizin de sadece sizden isteneni yaptığınızı, sonuçları değiştiremeyeceğinizi, saklayamayacağınızı, vs. vs.

bundan sonraki aşama tam olarak şöyle gelişir, 'bu analist bişey bilmiyor, analizleri hep yanlış'

ya da kullandığınız kodlar istenir, ya da 'biz analizimizi kendimiz yapacağız' denir.

sizi ekarte etmek için türlü yollar denenir.

işin başındaysanız, bir işe yeni girdiyseniz, girdiğiniz işteki çalışma kültürüne bağlı türlü entrikalarla karşılaşabilirsiniz.

verinin söylediği işine gelmeyen kişi eğer bilgi akışınızın bir parçası ise, sizi bilerek yanlış yönlendirebilir. (burada yine yaptığı analizler de hep yanlış çıkıyor caaanım çakallığı söz konuş.) tabi görev bittikten sonra asla sizi tanımayacaktır, size öyle bir bilgiyi verdiğinden haberi olmayacaktır.

eğer bu konularda zaten feleğin çemberinden geçmiş iseniz, rapor sunduğunuz kişilerle direk iletişim isteyebilirsiniz. yöneticilerin çoğu tembeldir, buna genelde yanaşmazlar.

bilgi akışını mümkün mertebe yazılı tutun. size kim ne dediyse, e-mail yazın, skype yapın, bunun zekice bir yolunu bulun ve o bilgiyi o kişiden aldığınızla ilgili yazılı bir dokümanınız olsun işte.

diyelim ki bu durumu yazılı bir hale getirmeye başladınız, kolay lokma olmadığınız anlaşıldı. mücadele bitti mi? bitmedi.

ekranınız denetlenecek, ne yaptığınızı görmek için habire sudan bahanelerle yanınıza gelinecek. günde beş vakit ne yaptığınız, hangi aşamada olduğunuz, o ekrandakinin neyin verişi olduğu, o grafikte neyi gösterdiğiniz vs. ahiret sorusu sorar gibi sorulacak. velev ki anlattınız, sizin fikriniz yöneticiye sizden önce o kişinin adıyla gidecek. ve bu vesileyle analizlerinize dahil olmasının yolu açılacak. yani hatasını bulduysa da kendisi buldu, size o fikri kendisi verdi olacak. yönetici asla düşünmeyecek: 'yahu bu analist gelmeden önce bu herif x sene burada çalıştı, bunu niye şimdi fark etti?'

ekran kilidi candır, masadan kalktığınız anda ekranınızı kilitleyin. şifre candır, şifrelerinizi yanınızda taşıyın. şeffaflık candır, raporu çıkarır çıkarmaz attığınız ve ilgili herkesin erişebileceği bir ortak dosya talep edin, şirketlerin genelde bu tip paylaşım dosyaları olur. analizlerinizi bitmeden kimseye anlatmak zorunda değilsiniz, çevrenizde sivrisinek gibi dönen birisi varsa kibarca kovun.

raporlama yaptığınız kişiden başka kimseye rapor sunmak zorunda değilsiniz, sizden bunu isteyenler olduğunda cicim ben de emir kuluyum argümanından yürüyün, raporunuzu ortak alana koyduktan sonra haber verin. ikinci üçüncü şahıs emirlerini dinlemeyin.

kısacası, keyifli olduğu kadar lanetli de bir iş koludur.

bir de sözüm yöneticilere: sizi ne kandırıyorlar, ne kandırıyorlar. en güvendiğiniz adamınız, en iyi kıvıran adamınız, 'ben buna muhtacım' dediğiniz adamınız var ya, sizi işte en çok o kandırıyor. analistleri, business intelligence'cıları, veri bilimcilerini, artık departmanınızın adı neyse, işte onları ne yapın edin izole edin. ayrı dükkan mı açarsınız, evlerinden mi çalıştırırsınız, aya mı gönderirsiniz, artık hangisi en uygun çözümse.

tecrübe konuştu.

Son Dönemdeki Bilişim Forumlarının Popüler Konusu Big Data Nedir?