OpenAI, Blockchain Ortamlarındaki Güvenlik Açıklarını Tespit Etmek, Düzeltmek ve Kötüye Kullanmak için EVMbench’i Başlattı

2 min read

14 saat ago Seyhan Tekelioğlu

OpenAI, kripto yatırım firması Paradigm ile işbirliği içinde, yapay zeka ajanlarının akıllı sözleşmelerdeki yüksek şiddetli güvenlik açıklarını tespit etme, yama yapma ve bunlardan yararlanma yeteneklerini değerlendirmek için tasarlanmış yeni bir ölçüt olan EVMbench'i tanıttı. Akıllı sözleşmeler, açık kaynaklı kripto varlıklarda rutin olarak 100 milyar $ üzerinde güvence altına alındığından, bu sürüm, ekonomik açıdan önemli ortamlarda yapay zeka yeteneklerini ölçmede önemli bir adımı işaret ediyor. EVMbench, çoğunluğu Code4rena gibi platformlardaki açık kod denetim yarışmalarından elde edilen 40 güvenlik denetiminden kaynaklanan 120 düzenlenmiş güvenlik açığından yararlanmaktadır. Kıyaslama ayrıca, EVMbench'in kapsamını, aracı stablecoin işlemlerinin önemli ölçüde büyümesi beklenen bir alan olan ödeme odaklı akıllı sözleşme koduna genişleten, yüksek verimli stablecoin ödemeleri için tasarlanmış, amaca yönelik olarak oluşturulmuş bir Katman 1 olan Tempo blok zincirinin güvenlik denetimi sürecinden güvenlik açığı senaryolarını da içermektedir. Üç Değerlendirme Modu

EVMbench, AI ajanlarını, her biri akıllı sözleşme güvenlik yaşam döngüsünün farklı bir aşamasını hedefleyen üç farklı yetenek modunda değerlendirir. ModeDescriptionDetectAgents audit a smart contract repository and are scored on recall of ground-truth vulnerabilities and associated audit rewardsPatchAgents modify vulnerable contracts while preserving intended functionality, verified through automated tests and exploit checksExploitAgents execute end-to-end fund-draining attacks against deployed contracts in a sandboxed blockchain environment, graded via transaction replay and on-chain verification

To support reproducible evaluation, OpenAI developed a Rust-based harness that deploys contracts deterministically and restricts unsafe RPC methods. Tüm istismar görevleri, canlı ağlardan ziyade izole bir yerel Örs ortamında çalışır. EVMbench'teki sınır modeli performansı, görev türleri arasında açık davranışsal farklılıklar ortaya koymaktadır. Yararlanma modunda, GPT‑5.3‑Kodeks 72 puan aldı.

Kaynak: Cyber Security News

Yayin Tarihi: 19.02.2026 03:33

Bu haber otomatik olarak Ingilizceden Turkceye cevrilmistir.

Görüntülenme: 3