YAPAY ZEKADA SİBER GÜVENLİĞİN YERİ

9 minute read

Giriş: Yapay Zeka Nedir?

Yapay zeka, adından da anlaşılacağı üzere, insanın zihinsel ürünü olan zekayı yapay olarak elde etme çalışmalarının bütünüdür. Yapay zeka kavramını, insanlara atfedilen eleştirel düşünme, karar verme, geçmiş deneyimlerden öğrenme gibi bilişsel faaliyetlerin matematiksel modellemeler ve algoritmalar yoluyla makinelerden elde edilmesi, kısaca “düşünen makineler” oluşturma çabaları olarak ifade edebiliriz.

Yapay zeka fikri, ilk olarak matematikçi Alan Turing’in 1950 yılında yayımlamış olduğu “Computing Machinery and Intelligence” (Bilgi İşlem Makineleri ve Zeka) adlı makalesi ile ortaya atılmıştır. Makalenin temel fikri “Makineler düşünebilir mi?” üzerine kuruludur ve bir makinenin zeki olarak kabul edilebilmesi için gerekli temel ölçütleri ortaya atarak Turing Testi ’ni önerir. Turing Testi’ nde, bir makine, insan ve jüri üyeleri bulunur. Sorulan sorularla jüri, kimin makine, kimin insan olduğunu ayırt etmeye çalışır. Eğer insan ve makine birbirinden ayırt edilemezse, makine Turing Testi’ ni geçmiş kabul edilir. 2014 yılında Eugene Goostman isimli bir chatbot, jürinin yaklaşık %33’ünü insan olduğuna ikna ederek Turing Testi’ ni geçmiş olarak kabul edilmektedir (“Eugene Goostman”, 2014).

Yapay zekanın bir kavram olarak ilk kez ele alınması, 1956 yılında gerçekleştirilen Dartmouth Konferansı’nda John McCarthy’ nin “yapay zeka” terimini kullanması ile ortaya çıkmıştır. Bu tarihten itibaren yapay zeka çalışmaları hız kazanmıştır. 1990’larda yeni algoritmaların ve daha büyük veri setlerinin ortaya çıkışıyla birlikte makine öğrenmesi ve derin öğrenme gibi alanlar hızla gelişmeye başlamıştır. Özellikle 2010 civarlarında yapay sinir ağlarının hızlı gelişimiyle doğal dil işleme, görüntü tanıma vb. yapay zeka uygulamaları önemli hale gelmiştir. Geçtiğimiz son yıllarda donanım alanındaki gelişmeler ve daha büyük veri setlerine erişim ile birlikte yapay zeka alanında hiç olmadığı kadar ivmeli bir artış yaşanmıştır. 2022 tarihinde piyasaya sürülen ChatGPT ile birlikte yapay zeka, daha önce görülmemiş bir popülerlik elde etmiştir.

Yapay Zekanın Günümüzdeki Yeri ve Uygulama Alanları

Her geçen gün ivmeli artış gösteren ve devasa boyutlara ulaşan verilerin dijital sistemlere entegrasyonu önemli bir konu haline gelmektedir. Gerçek dünya verilerinin sanal dünyaya aktarılması noktasında yapay zeka önemli bir rol oynamaktadır. Büyük ve karmaşık verilerin sınıflandırılması, önemli — önemsiz şeklinde ayrıma gidilmesi hususunda yapay zeka uygulamaları insan işlerini kolaylaştırmaktadır. Büyük verinin işlenmesinin yanı sıra teknik işlerde otomasyona gidilmesi de yapay zekanın insan hayatını kolaylaştıran önemli bir uygulamasıdır. İnsan hayatını kolaylaştırma noktasında önemli bir rol oynayan yapay zekanın günümüzdeki uygulamaları her sektörde kendine yer edinmeye başlamıştır. Yapay zekanın robotik, sağlık, finans sektörü vb. birçok alanda uygulamaları bulunmaktadır. Özellikle iletişim, kritik düşünme, problem çözme gibi alanlarda insanlara etkili çözümler sunmaktadır.

Uzman sistemler (expert system), yapay zekanın uygulama alanlarından biri olarak karşımıza çıkmaktadır. Uzman sistemler, belirli bir uzmanlık alanında kişilere yardımcı olmak, karmaşık problemlerde karar desteği sağlamak amacıyla tasarlanmıştır. Kullanıcı arayüzü, çıkarım motoru ve bilgi tabanı olmak üzere üç temel bileşenden meydana gelmektedir. Özellikle tıp alanında teşhis ve karar süreçlerinde yardımcı amaçlı kullanılmaktadır.

Yapay zekanın bir diğer önemli uygulama alanı NLP (Natural Language Processing — Doğal Dil İşleme) olarak karşımıza çıkmaktadır. Doğal dil işleme, özellikle IVR (Interactive Voice Response) uygulamalarında kullanılmaktadır. Bu kapsamda çağrı merkezleri ve çeviri uygulamalarında karşımıza çıkmaktadır.

Yapay zekanın bir diğer önemli kullanım alanı ise siber güvenlik sektörü üzerindedir. IDPS sistemlerinin otonom hale getirilmesi, otomasyon alanındaki önemli bir uygulamasıdır. Yapay zeka uygulaması olan Intelligent Agents (Aklıllı Ajan) ile birlikte siber ataklara karşı, özellikle DDOS ataklarına karşı, önlemler alınabilmektedir. Intelligent agents sistemleri, bir siber saldırıyı bilgi toplama, sömürü aşamalarında tespit edebilmektedir. Yapay zeka ile birlikte network anomali tespiti ile makine öğrenmesi kullanarak malware (zararlı yazılım) analizi yapılabilmektedir. Malware analizinde, ANN (Artificial Neural Network — Yapay Sinir Ağı) tabanlı deneysel simülasyon ile zararlı yazılımın yaklaşık yüzde doksanı tanımlanabilmiştir. Her ne kadar yapay zeka siber güvenlik sektöründe kullanılmaya başlansa bile, sistemlerin tam olarak otonom hale getirilememesi bu sistemlerin insan gözetiminde bir destek sağlama amacıyla kullanılmasını gerektirmektedir.

Yapay Zekada Kullanılan Teknikler

Yapay zeka, makine öğrenmesini ve onun altında da derin öğrenmeyi kapsayan geniş bir çerçevedir. Özellikle makine öğrenmesi, birçok yapay zeka uygulamasının temeli olarak kullanılmaktadır. Makine öğrenmesinde temel olarak üç algoritma yer almaktadır (Khandelwal, 2022). Bu algoritmalardan ilki olan Supervised Learning, etiketlenmiş verileri kullanarak çıktı üreten algoritmalardır. Etiketlenmiş verileri kullanarak verilen örneklerden çıkarım yapar. Sınıflandırma problemlerinde dolandırıcılık tespiti ve spam tespitinde bu algoritma kullanılmaktadır. Bir diğer makine öğrenmesi algoritması olarak Unsupervised Learning, etiketlenmemiş verilerdeki pattern ve ilişkileri gruplandırarak tanımlama yapmaktadır. Anomali tespitinde sıklıkla kullanılmaktadır. Üçüncü olarak Reinforcement Learning, çevre ile etkileşim kurarak öğrenen bir makine öğrenmesi algoritmasıdır. Robotik, kendi kendine süren arabalar gibi alanlarda sıklıkla kullanılmaktadır.

Derin öğrenme ise makine öğrenmesinin alt kümesi olarak düşünülebilir. İnsan beynindeki sinir ağlarını taklit ederek çeşitli matematiksel modellemeler ile oluşturulan yapay sinir ağları (neural networks) kullanılır. Gizli katmanlar içeren yapay sinir ağları kullanılarak yeni veriler elde edilir. ANN, GAN vb. birçok derin öğrenme modeli bulunmaktadır. Derin öğrenmenin doğal dil işleme, bilgisayarlı görü, görüntü işleme gibi birçok uygulama alanı bulunmaktadır.

Yapay Zeka Üzerinde Siber Güvenlik

Yapay zekanın yaygınlığı ve kullanımı arttıkça yapay zeka güvenliği konusu da ön plana çıkmaktadır. Kötü niyetli korsanlar yapay zekanın çeşitli zafiyetlerini keşfederek bunları sömürmeye çalışmaktadır. OWASP kuruluşunun yayımlamış olduğu dokümantasyonda yapay zeka güvenlik riskleri hakkında detaylı açıklamalara yer verilmiştir (OWASP, 2023). Bunlardan yararlanarak yapay zeka güvenlik risklerini iki temel başlık altında incelemek mümkündür: veri güvenliği riskleri ve yapay zeka model saldırıları.

Veri Güvenliği ile İlgili Riskler

Yapay zeka verilerden beslenen bir yapıdır. Yapay zekanın eğitildiği veri seti ne kadar fazla ve kapsamlı olursa o kadar iyi çıktılar üretilir. Verilerin bu kadar fazla olması çeşitli güvenlik önlemlerini gerekli kılmaktadır. Yapay zekanın eğitildiği veri seti manipüle edilerek yapay zekanın yanlış çıktılar üretmesine neden olabilir. Dolayısıyla fazla miktardaki bu veri setleri kontrolden geçirilerek yapay zekanın eğitiminde kullanılmalıdır.

Veri güvenliği ile ilgili bir diğer önemli nokta ise hassas verilere kısıtlı erişimin sağlanması gerekliliğidir. Yapay zekadan sorumlu mühendislere gerektiği kadar ve doğru verinin verilmesi önemlidir. Hassas olan verilerin ise herkesin değil, belirli kişilerin hizmetine sunulması gerekmektedir.

Yapay Zeka Model Saldırıları

Yapay zeka modellemelerine yönelik saldırılar farklı gruplara ayrılarak incelenebilir. Bunlardan ilki data poisoning attack (veri zehirleme saldırısı) olarak ele alınabilir. Yapay zekanın kullanmış olduğu verinin etiketi veya direkt kendisi değiştirilerek yapay zeka modelinin davranışı manipüle edilebilir. Böylelikle yapay zeka modeli sabote edilerek saldırgan lehine karar alması sağlanır. Bu saldırı trojan horse saldırısı gibi düşünülebilir. Dışarıdan bakıldığında model normal çalışmaktadır fakat manipüle edilmiş girdiler için model belirli bir karar almaya zorlanır. Son günlerde popülerleşen ChatGPT’ nin çalışması bu yolla manipüle edilebilir. ChatGPT, yapısı gereği internetin her noktasından aldığı büyük miktarda veriyi işleyerek çıktı üretmektedir. ChatGPT’ nin kullanmış olduğu bu verilere çeşitli güvenlik zafiyetleri enjekte edilerek zararlı davranışlar sergilemesi sağlanabilir. Bu noktada kullanılan verinin kalitesi ve korunması önem arz etmektedir.

Bir diğer saldırı çeşidi input manipulation attack (girdi manipülasyon saldırısı) olarak ele alınabilir. Bu saldırı çeşidinde aldatıcı giriş verileri ile modeller yanıltılabilir. Üç farklı yolla bu saldırıyı gerçekleştirmek mümkündür. Modelin girdilerini deneyerek, bir nevi black-box yöntemiyle manipülasyon gerçekleştirilebilir. Örneğin kendi kendine süren arabaların veri setinde hız levhasına kırmızı renk bitleri eklenerek hız levhası dur levhası olarak algılanabilir. İkinci yol, modelin kullandığı parametrelerin analizine dayanarak zararlı olarak tasarlanan girdi verilerinin kullanılmasıdır. Bu yol white-box yöntemine dayanmaktadır. Yapay zeka modelinde kullanılan nöral ağların ağırlıklarını analiz ederek fark ettirmeden girdi değiştirilerek farklı sınıflandırmalar elde edilebilir. Bu yolla örneğin bir kamera görüntüsünde insan olmasına rağmen yokmuş gibi algılanması sağlanabilir. Bir diğer yol ise veri zehirleme yönteminde kullanılan inputları temel almak şeklinde gerçekleştirilebilir. Girdi manipülasyon saldırısının özel bir tipi de prompt injection saldırısıdır. Prompt injection, yapay zeka sisteminin girdi bölümüne zararlı komutlar eklenerek gerçekleştirilir. Burada kullanılan günlük konuşma dilinin esnekliği, girdilerin doğruluğunun kontrolünü zorlaştırmakta, dolayısıyla prompt injection saldırısını tehlikeli hale getirmektedir. Girdi manipülasyon saldırı çeşidinin önlenmesine yönelik farklı önlemler alınabilir. Kullanılan model parametrelerine sınırlı erişim sağlanması, modelleri manipüle edilmiş girdilere karşı daha güçlü yapmak amacıyla eğitim aşamasında zararlı örneklerle eğitmek bunlardan birkaçıdır.

Model inversion attack, bir başka saldırı çeşidi olarak değerlendirilebilir. Bu saldırıda model tersine analiz edilerek modelin eğitildiği veriler tahmin edilebilir. Modelin eğitildiği veriler hassas veya kişisel ise büyük bir problem teşkil edebilir. Model hırsızlığı, diğer bir saldırı türüdür. Modelin davranışının kopyalanması olarak düşünülebilir. Modelin girdi ve çıktıları alınarak yeni bir model eğitiminde kullanılır ve modelin kopyası oluşturulmuş olur.

Yapay zeka güvenliği ile ilgili dikkat edilmesi gereken bir diğer husus, yapay zekanın yazılmasında kullanılan kodların yeniden kullanım problemidir. Veri bilimciler yapay zekayı tasarlarken birçok online projeden yararlanabilir. Kullanılan online proje kodları ise güvenlik açığı içerebilir. Bu noktada veri bilimcilerin yazılım güvenliği hakkında yeterli bilgiye sahip olmaları gerekmektedir. Yazılan kodların sürdürülebilirliğine ise dikkat edilmelidir. Okunması güç olan yazılımlar sonradan incelendiği takdirde güvenlik zafiyetlerini bulmak zor olabilir. Yapay zeka sistemleri farklı birçok tedarik zincirinden oluşabilir. Bu durumda her aşamada yapay zekanın güvenliğine dikkat edilmesi gerekmektedir.

Yapay Zeka Güvenliğinin Sağlanması

Yukarıda incelendiği üzere yapay zeka sistemlerine karşı farklı türde saldırılar gerçekleştirilebilir. Bu saldırıların önlenmesi ve yapay zekanın güvenliğinin sağlanması önemli bir husustur. Bu amaçla alınabilecek en temel önlemlerden birisi, yapay zeka modellerini tasarlayan mühendislere güvenlik eğitimleri verilerek güvenlik farkındalıklarının arttırılmasını sağlamaktır. Güvenli yazılım geliştirme yöntemleri ile sağlam kodlamalar yapılması durumunda, bahsedilen birçok saldırının gerçekleşmesi önlenebilir. Yapay zekanın eğitildiği verilerde gereksiz bilgilerin toplanmaması ile başka bir önlem alınabilir. Bir modelin eğitiminde kullanılan veriler başka bir modelin veri setleri olarak kullanılmamalıdır. Veri depolanması yapılmamalı, veri ile iş bitince veriler silinmelidir. Veriler olabildiğince anonim tutulmalı, veri kaynaklarının güvenilir olduğundan emin olunmalıdır. Yapay zekanın özünde insan davranışları temel alınarak oluşturulduğu unutulmamalı ve insan hakları göz ardı edilmeden uygulamalar gerçekleştirilmelidir.

Yapay Zeka ve Siber Güvenliğin Geleceği

Yapay zeka ve siber güvenlik birbirlerini karşılıklı olarak etkileyen alanlardır. Siber güvenlikte yapay zekanın kullanımı her geçen gün artmaktadır. Düşük tanıma oranı, yavaş çıktı, otomasyon eksikliği gibi teknolojik zayıflıklar henüz tam olarak yapay zekanın kullanımını tek başına sağlayamamış, insan gözetimine olan ihtiyacı doğurmuş olsa da gelecekte bu durumun değişeceği öngörülmektedir. Tam otonomlaşma ile birlikte tekrarlı taskların tamamen yapay zeka tarafından yapılması, siber güvenliğin geleneksel yaklaşımlarının atak tespitinden atak önlemlerine yer değiştirmesi gerçekleşecektir.

Benzer şekilde, yapay zekada siber güvenliğin önemi daha fazla artacaktır. Yapay zeka modelleri geliştikçe bunlara karşı yapılan saldırılar da gelişecek, siber güvenlik uzmanlarının yapay zekayı kendi amaçları doğrultusunda kullanmalarının yanı sıra saldırganların da kendi çıkarları doğrultusunda kullanması ve yapay zeka modellerini daha gelişmiş tekniklerle sömürmesi ile birlikte yapay zeka ve siber güvenlik ilişkisi daha da önemli bir hale gelecektir. İki alanın birbiriyle ilişkisi konusunda farkındalık sağlanmalı ve yaygınlaştırılmalıdır.

Kaynakça

[1] Eugene Goostman. (2023, May 16) In Wikipedia. Retrieved from https://en.wikipedia.org/w/index.php?title=Eugene_Goostman&oldid=1155100915

[2] Khandelwal, R. (2022, July 20). Supervised, Unsupervised, and Reinforcement Learning. Medium.

https://arshren.medium.com/supervised-unsupervised-and-reinforcement-learning-245b59709f68#:~:text=Supervised%20learning%20requires%20a%20labeled,by%20interacting%20with%20the%20environment

[3] OWASP. (2023, February 21). OWASP AI Security and Privacy Guide.

https://owasp.org/www-project-ai-security-and-privacy-guide/