İnsan ticareti mağdurlarının sentetik veri seti, gizlilikten ödün vermeden büyük verilerin çalışmasına izin verebilir – TechCrunch

0
32

İnsan kaçakçılığıyla etkili bir şekilde mücadele edebilmek için, onunla mücadele edenlerin bunu anlaması gerekiyor – ve bu günlerde bu, veri anlamına geliyor. Ne yazık ki, bariz nedenlerden dolayı, bu gizli bilgiler bir şekilde bol olsa da, uygun bir insan ticareti mağdurları endeksi yoktur. Microsoft ve Uluslararası Göç Örgütü, gerçek trafik verilerinin tüm önemli özelliklerine sahip, ancak tamamen yapay olan yeni bir sentetik veritabanı ile ileriye doğru bir yol bulmuş olabilir.

Her mağdur tartışmasız bir şekilde bireysel olmakla birlikte, hangi ülkelerin giderek daha fazla insan ticaretinin kaynağı veya aracı olduğu, hangi yol ve yöntemlerin kullanıldığı ve mağdurların nereye vardığı gibi temel üst düzey sorular bir istatistik meselesidir. Önleme için çok önemli olan eğilimleri ve kalıpları belirlemeye yönelik kanıtlar, çoğu kişinin yayınlamamayı tercih ettiği bu binlerce bireysel hikayede kilitli.

IOM program koordinatörü Harry Cook, veri setini açıklayan bir haber bülteninde, “Belirlenmiş insan ticareti vakalarına ilişkin idari veriler, mevcut ana veri kaynaklarından birini temsil ediyor ancak bu tür bilgiler oldukça hassas” dedi. “IOM, kurbanların güvenliğini ve gizliliğini korurken bu tür verileri analiz için paylaşmanın kritik zorluğunda ilerleme kaydetmek için son iki yılda Microsoft Research ile çalışmaktan mutluluk duyuyor.”

Tarihsel olarak, suç veritabanları ve tıbbi bilgiler gibi şeyler için strateji, özgürce redaksiyon yapmaktır, ancak bu “anonimleştirme” yönteminin, verileri yeniden yapılandırmaya yönelik herhangi bir ciddi girişime karşı etkisiz olduğu gösterilmiştir. Kamuya açık ve sızdırılmış çok sayıda veri tabanı ve anında işlem gücü ile, düzeltilmiş bilgiler oldukça güvenilir bir şekilde sağlanabilir.

Microsoft Research tarafından alınan seçenek, kaynağın tüm önemli istatistiksel ilişkilerini koruyan ancak tanımlanabilir bilgilerin hiçbirini içermeyen sentetik bir veri kümesi için temel olarak orijinal verileri kullanmaktır. Ve bu sadece “Jane Doe”yu “Janet Doeman”a ve memleketini Cleveland’dan Queens’e dönüştürmek değil. Bunun yerine, benzer veya örtüşen verilere sahip en az on kişiden oluşan gruplar, onları istatistiksel olarak doğru bir şekilde temsil eden ancak tek tek tanımlamak için kullanılamayan bir dizi nitelik oluşturmak için birleştirilir.

Resim Kredisi: Microsoft Research / IOM

Doğal olarak bu, orijinal verilerin ayrıntı düzeyine sahip değildir, ancak hassas kaynağın aksine, bu veriler gerçekten kullanılabilir. Bazı görev güçlerinin analiz edip “tamam bir sonraki kaçakçılık operasyonu buradan yola çıkacak…” demesi şart değil, daha ziyade birinci elden kanıtlara dayanan bu veriler, bunu bir politika ve diplomaside ele almak için gerçek bir kayıt olarak gösterilebilir. seviye. Daha önce, X Ülkesinin veya Z Hükümetinin bu konularda ihmalkar veya suç ortağı olduğunu daha genel bir şekilde söylemek zorunda kalınmışken, bunu destekleyecek sağlam verilere sahip olmak, “seks ticareti mağdurlarının yüzde 36’sı sizin yetki alanınızdan geçiyor. ”

Verilerin güçlü silah taktiklerinde kullanılması gerektiğinden değil – yalnızca bir dizi bağlantısız olay değil, insan sefaletindeki küresel ticareti bir sistem olarak anlamak başlı başına değerlidir. Verileri inceleyebilir ve burada kullanmak için istekte bulunabilir ve programın GitHub’ında onu oluşturma süreci hakkında daha fazla bilgi edinebilirsiniz.

CEVAP VER

Lütfen yorumunuzu giriniz!
Lütfen isminizi buraya giriniz