Filter by Kategori
Game
Movie
TV
Komik
TeknoApps & OSBerita Teknologi

DeepSeek R1 Terbukti Tidak Aman?!

DeepSeek R1 Terbukti Tidak Aman? Penelitian terbarru yang dilakukan Cisco ternyata menunjukkan adanya celah keamanan pada DeepSeek R1.

DeepSeek, sebuah model bahasa besar (Large Language Model/LLM) yang tengah naik daun, baru-baru ini menjadi sorotan karena isu keamanannya. Berbagai laporan dan temuan menunjukkan bahwa DeepSeek R1 terbukti tidak aman. Ini bisa menimbulkan kekhawatiran serius akan potensi penyalahgunaan dan risiko terhadap data pribadi pengguna.

Sebuah penelitian terbaru oleh para ahli keamanan dari Cisco dan Universitas Pennsylvania, menunjukkan temuan yang mengejutkan tentang DeepSeek.

Dalam eksperimen yang melibatkan 50 perintah berbahaya untuk menghasilkan konten berbahaya, model DeepSeek R1 gagal mendeteksi atau menghentikan satu pun dari perintah tersebut. Para peneliti sangat terkejut dengan tingkat keberhasilan serangan yang mencapai “100 persen”.

“Seratus persen serangan berhasil, ini menunjukkan adanya trade-off,” ucap DJ Sampath, VP Produk, Perangkat Lunak dan Platform AI di Cisco, kepada WIRED

Penemuan ini memperkuat bukti yang ada bahwa langkah-langkah keamanan dan keselamatan yang DeepSeek terapkan tidak sebanding dengan perusahaan teknologi lain yang juga mengembangkan LLM. Sensor terhadap isu-isu sensitif menurut pemerintah Tiongkok juga dapat dengan

Analisis independen yang telah rilis oleh perusahaan keamanan AI, Adversa AI, mengungkapkan bahwa DeepSeek memiliki kelemahan terhadap sejumlah taktik jailbreaking. Taktik-taktik ini bervariasi dari penggunaan bahasa yang sederhana hingga instruksi rumit.

Benarkah DeepSeek R1 Terbukti Tidak Aman?

Benarkah DeepSeek R1 Terbukti Tidak Aman?
Image: Yuslianson

Tim peneliti dari Cisco memilih 50 perintah secara acak untuk mengevaluasi DeepSeek R1 menggunakan kumpulan perintah standar, HarmBench. Mereka menguji perintah tersebut dari enam kategori yang ada dalam HarmBench. Contohnya ancaman umum, kejahatan siber, penyebaran informasi yang salah, dan aktivitas ilegal.

Proses pengujian berlaku pada model yang beroperasi secara lokal, bukan melalui platform online atau aplikasi DeepSeek yang mentransfer data ke Tiongkok.

Selain itu, para peneliti juga menemukan hasil yang mungkin menimbulkan kekhawatiran dari pengujian R1 dengan serangan non-linguistik yang lebih rumit. Pengujian ini melibatkan penggunaan karakter Cyrillic dan skrip khusus untuk mencoba mengeksekusi kode.

Namun, dalam tahap pengujian awal ini, tim Sampath lebih memfokuskan perhatian pada temuan yang berasal dari pengujian standar yang telah diakui secara luas.

Cisco membandingkan kinerja model DeepSeek R1 dengan model lainnya, seperti Llama 3.1 dari Meta, yang menunjukkan tingkat kegagalan serupa. Namun, DeepSeek R1 terancang secara khusus untuk penalaran, sehingga memerlukan waktu lebih lama untuk memberikan jawaban dengan proses yang lebih rumit.

Perbandingan paling relevan adalah dengan model penalaran o1 dari OpenAI, yang menunjukkan performa terbaik di antara semua model. Meta belum memberikan komentar terkait hal ini.

Polyakov dari Adversa AI menyatakan bahwa DeepSeek tampaknya mampu mengenali dan menolak beberapa serangan jailbreak. Namun, saat perusahaan melakukan pengujian terhadap empat jenis jailbreak—yang meliputi pendekatan linguistik hingga metode berbasis kode—batasan yang ada pada DeepSeek dapat dengan mudah dilanggar.

Related Posts

1 of 7