Hayatın Kendisine de Direkt Uyarlayabileceğiniz Şaşırtıcı Bulgu: Benford Yasası

Özellikle denetim ve doğa verileri alanlarında sıklıkla kullanılan ancak okullarda fazla duymadığımız bu ilginç yasayı inceleyelim.
Hayatın Kendisine de Direkt Uyarlayabileceğiniz Şaşırtıcı Bulgu: Benford Yasası

nedir, ne değildir?

göllerin sayısı okyanuslardan, karıncaların sayısı fillerden, çimenlerin sayısı ağaçlardan fazladır. yani doğanın olağan akışı içinde oluşan küçük şeylerin sayısı büyük şeylerden fazladır. insan davranışı da doğanın olağan akışının bir parçasıdır. dolayısıyla insan davranışı sonucu oluşan şeylerin içinde de küçük şeyler, büyük şeylerden fazladır. yoksulların sayısı zenginlerden fazladır, fiat marka otomobillerin sayısı mercedeslerden fazladır. bir kütüphanedeki kitapların çoğunluğunun ilk sayfaları diğerlerinden daha fazla yıpranmıştır, çünkü bir kitaba başlayıp bitiremeyenler bitirenlerden fazladır. cahillerin sayısı da okumuşlardan fazladır.

bütün bunları 1938 yılında matematiksel olarak formülize eden kişi fizikçi frank benford'dur.
bu kurala da benford yasası denir. bu kurala göre, sayılar doğal olarak oluşmuşsa, bu sayıların ilk hanelerinde küçük rakamlar büyüklerden belli oranlarda daha fazla bulunur.

Frank Benford

aşağıdaki grafikten anlaşılacağı üzere, bu yasa şunu der

her nereden toplanırsa toplansın, rakam içeren bilgi yığınında, tutar, para, büyüklük, uzunluk, hava sıcaklığı gibi değerlerin hepsinde, ilk rakamlarını ayırıp sayın.
bir (1)’le başlayan sayıların adedi toplam sayı adedinin yüzde 30.10’u kadardır.
iki (2) ile başlayan sayıların adedi toplam sayı adedinin yüzde 17.6’sı kadardır.
üç (3) ile başlayan sayıların adedi toplam sayı adedinin yüzde 12.5’u kadardır.
böyle azalan oranda 9’a kadar olan sayıların oranı toplam %100’ü verir.
yani her veri seti bu oranlara uyar. doğada bilmediğimiz düzenler, gezegenler vs. 

peki ne yapalım?

eğer size bir sürü rakam verilmişse böyle bir test yaparak rakamların uyduruk olup olmadığını anlayabilirsiniz. eğer 9’la başlayan sayılar yüzde 30 oranında mevcutsa, burada büyük sorunlar var demektir. 

eğer sayıştay’da denetçiyseniz ve gerçek zararlar (türkiye’de olmaz ama) ortaya çıkmasın diye sizin denetim yapmanızı ve sonuçları halka açıklamanızı devletin en yüksek yetkilileri engelliyorsa, vakit geçirmek için muhasebe rakamlarına bu yasayı uygulayarak eğlenebilirsiniz.  iyi eğlenceler.

tuhaf bir örneği

hanımın telefon hafızası dolunca videoları bilgisayara aktardım ve boyutlarına göre sıralayınca, "dur ulan bakalım benford yasasına uyacak mı videolar" diye düşünüp on dakikamı ayırdım. sıkı durun, matematik "bi de beni şöyle çeksene" ve "oğluşumun ilk adımı" garabetlerinde bile yaşıyor.

bu analizi yaparken 10mb ile 100mb arası boyutları ele aldım, çünkü daha küçük boyutlarda iphone'un hareketli resimleri ve daha büyük olanlarda doğum günü, özel bir gezi gibi kasten çekilmiş videolar var. ama 10-100mb aralığı istatistik için uygun olan, 10 saniye ile 90 saniye civarı daha rastgele nitelikte videoları içeriyor.

1 ile başlayan (10mb-19,99mb aralığı) = 292 video
2 ile başlayan (20mb-29,99mb aralığı) ifade ediyor vd.

rakam = video sayısı --> toplama oranı ---> benford ölçeği

1 = 292 --> %29,08 --> %30,10
2= 187 --> %18,63 --> %17,60
3=136 --> %13,55 --> % 12,50
4=124 --> %12,35 --> %9,70
5=82 --> %8,17 --> %7,90
6=59 --> %5,88 --> %6,70
7=46 --> %4,58 --> %5,80
8=42 --> %4,18 --> %5,10
9=36 --> %3,59 --> %4,60

toplam 1004 video.

bitmedi, bu da karşılaştırmalı grafik:

bir kere daha gördük ki; matematik her yerde.

bu analizde emeği geçen; başta sevgili eşim, "bi de beni böyle çek" diyen arkadaş çevresi, düşe kalka yürüyen ve ilk gülümsemelerini ben işteyken annesine yapan evlatlarıma canı gönülden teşekkür eder. bok gibi isimlendirme sistemine sahip ios işletim sistemi mühendislerine ve dolan hard diskime teessüf ederim. sayenizde uygulayarak öğrendim bu cici yasayı.