Bu tekniğin kötüye kullanılabileceği birçok yol var.
Yazılım mühendisi Paul Butler'ın yakın tarihli bir blog yazısında, Unicode karakterleri, özellikle emojilerdeki verileri gizlemek için yeni bir tekniğe ışık tuttu. Görev, kavramı ve yanlış kullanım potansiyelini açıklar ve bu yöntemi denemek için bir araç sağlar.
Unicode'un metni bir dizi kod noktası olarak temsil etme sistemi etrafında döner ve her kod noktası Unicode Konsorsiyumu tarafından anlam atanan bir sayıdır. Çoğu kullanıcı, Latin tabanlı komut dosyalarındaki kod noktaları ve görünür karakterler arasındaki bire bir eşlemeye aşina olsa da, durum, birden fazla kod noktasının tek bir ekran karakterini temsil edebileceği diğer yazma sistemleriyle daha karmaşık hale gelir.
Bu veri kodlama yönteminin anahtarı Unicode'un varyasyon seçicilerde yatmaktadır. VS-1 ila VS-256 etiketli bu 256 özel kod noktasının görünür bir temsili yoktur, ancak önceki karakterin sunumunu değiştirebilir. Çoğu Unicode karakterinin ilişkili varyasyonları yoktur, ancak Unicode standardı, anlamları işleme yazılımı tarafından bilinmese bile, bu seçicilerin metin dönüşümleri sırasında korunmasını zorunlu kılar.
Bu koruma özelliği akıllı bir kodlama şemasına kapı açar. 256 varyasyon tek bir veri baytını temsil edebileceğinden, herhangi bir Unicode kod noktası içinde bir bayt gizlemek mümkün hale gelir. Bu kavramı daha da ileri götürerek, birden fazla varyasyon seçiciyi birleştirerek, tek bir karakterde sınırsız verileri etkili bir şekilde kodlayan herhangi bir rastgele bayt dizesini temsil edebilir.
Bu keşif büyüleyici olasılıklar sunsa da, yanlış kullanım konusunda ciddi endişeler doğurmaktadır. Bilgisayar korsanları insan içerik filtrelerini atlamak için bu yöntemden yararlanabilirler. Kodlanan veriler oluşturulduktan sonra görünmez hale geldiğinden, moderatörler varlığını algılamaz ve kötü niyetli aktörlerin ılımlılık sistemlerinden sonra zararlı veya yasaklanmış içeriği kaydırmasına izin verir.