DeepSeek, chatbot AI yang kini menduduki puncak unduhan di App Store, ternyata menyimpan masalah besar dalam hal akurasi dan relevansi. Meskipun sangat populer di kalangan pengguna, DeepSeek gagal memenuhi standar yang diharapkan dari sebuah chatbot canggih.

Berdasarkan hasil audit NewsGuard, DeepSeek gagal dalam 83% pengujian akurasi dan memiliki pola masalah yang mengkhawatirkan dalam memberikan informasi yang salah dan tidak relevan. Dalam artikel ini, kami akan mengulas lebih dalam tentang mengapa DeepSeek tidak bisa diandalkan sebagai AI andal, serta dampaknya terhadap industri AI.
1. DeepSeek Mengalami Kegagalan Dalam Akurasi: Hanya 17% Jawaban Benar
Hasil uji akurasi terbaru yang dilakukan oleh NewsGuard menunjukkan bahwa DeepSeek gagal dalam 83% pengujian akurasi, dengan hanya 17% jawabannya yang benar. Angka ini jauh di bawah rata-rata industri, yang memiliki tingkat kegagalan hanya 62%.
Hasil ini sangat mencolok, mengingat bahwa DeepSeek diklaim mampu bersaing dengan teknologi OpenAI meskipun dengan biaya pelatihan yang jauh lebih rendah, yakni $5,6 juta. Dalam prakteknya, chatbot ini menunjukkan performa yang jauh dari harapan, bahkan sering memberikan informasi yang salah.
1.1. 30% Jawaban DeepSeek Mengandung Informasi Salah
Lebih mengkhawatirkan lagi, 30% dari jawaban yang diberikan oleh DeepSeek mengandung informasi yang salah. Misalnya, ketika diminta menjelaskan suatu peristiwa sejarah atau perkembangan terkini, chatbot ini sering kali memberikan penjelasan yang tidak akurat. Hal ini menjadi sebuah ancaman besar bagi penggunanya, yang mengandalkan AI untuk memberikan informasi yang benar dan dapat dipercaya.
1.2. 53% Jawaban Tidak Relevan
Tak hanya memberikan informasi yang salah, DeepSeek juga memberikan jawaban yang tidak relevan pada 53% pertanyaan yang diajukan. Sebagian besar waktu, chatbot ini memberikan informasi yang sangat jauh dari topik yang sedang dibahas, menunjukkan ketidakmampuan sistem untuk memahami konteks pertanyaan dengan baik.
1.3. Ketergantungan pada Data Terbatas
Salah satu faktor penyebab kegagalan ini adalah ketergantungan DeepSeek pada data yang terbatas. DeepSeek hanya dilatih dengan informasi hingga Oktober 2023, yang membuatnya tidak mampu memberikan jawaban yang up-to-date terkait peristiwa terkini atau perubahan signifikan dalam berbagai topik. Ini menjelaskan mengapa banyak jawaban yang diberikan tidak relevan atau salah.
2. DeepSeek Menyisipkan Narasi Pemerintah China: Sebuah Masalah Etis
Salah satu masalah besar yang ditemukan dalam audit NewsGuard adalah kecenderungan DeepSeek untuk menyisipkan posisi pemerintah China dalam banyak jawabannya. Meski pertanyaan yang diajukan tidak ada kaitannya dengan China, chatbot ini sering kali memasukkan narasi politik yang mendukung kebijakan pemerintah China.
2.1. Contoh Narasi Pemerintah China dalam Jawaban
Sebagai contoh, ketika ditanya tentang situasi di Suriah, DeepSeek memberikan jawaban yang memuat posisi pemerintah China, yang menyatakan bahwa “China selalu memegang prinsip non-intervensi dalam urusan dalam negeri negara lain, percaya bahwa rakyat Suriah memiliki kebijaksanaan dan kemampuan untuk menangani urusan mereka sendiri.” Jawaban seperti ini bukan hanya tidak relevan dengan topik yang dibahas, tetapi juga menunjukkan bagaimana chatbot ini secara tidak sengaja mengarah pada penyebaran narasi politik tertentu.
2.2. Potensi Penggunaan untuk Propaganda
Hal ini menimbulkan kekhawatiran tentang potensi DeepSeek digunakan sebagai alat propaganda. Dengan kemampuannya yang luas dalam berinteraksi dengan pengguna, chatbot ini berisiko menyebarkan pesan yang tidak objektif atau bahkan bias, yang bisa memengaruhi pandangan orang terhadap isu-isu global.
2.3. Dampak pada Kredibilitas AI
Tentu saja, hal ini sangat merugikan kredibilitas DeepSeek di pasar internasional. Pengguna dari berbagai belahan dunia yang tidak terkait langsung dengan kebijakan China mungkin merasa terganggu atau bahkan dirugikan oleh keberadaan informasi yang bias ini dalam jawaban chatbot tersebut.
3. DeepSeek Rentan Terhadap Misinformasi: Memperburuk Masalah
DeepSeek terbukti sangat rentan terhadap penyebaran misinformasi, terutama ketika berhadapan dengan “malign actor prompts,” yaitu pertanyaan yang sengaja dirancang untuk menyebarkan informasi palsu.
3.1. Respons Terhadap Pertanyaan yang Dirancang untuk Menyebarkan Misinformasi
Sebanyak 8 dari 9 jawaban yang salah ditemukan berasal dari pertanyaan yang dibuat oleh aktor jahat yang berusaha menyebarkan informasi palsu. Ini menunjukkan betapa mudahnya DeepSeek dimanfaatkan untuk tujuan negatif, seperti menyebarkan berita bohong atau klaim palsu, yang bisa memperburuk penyebaran misinformasi di masyarakat.
3.2. Kerentanannya Menyebarkan Klaim Palsu dalam Skala Besar
DeepSeek memiliki potensi besar untuk digunakan sebagai alat penyebar informasi salah dalam skala besar. Ini bukan hanya masalah etis, tetapi juga masalah teknis, mengingat seberapa besar dampak negatif yang bisa ditimbulkan oleh chatbot yang tidak dapat membedakan antara fakta dan kebohongan.
3.3. Keperluan untuk Memverifikasi Informasi
Pengguna yang mengandalkan DeepSeek untuk mendapatkan informasi seharusnya lebih berhati-hati. Meskipun DeepSeek dapat menjadi alat yang berguna untuk tugas-tugas tertentu, Anda perlu memastikan untuk memverifikasi semua informasi yang diterima dari chatbot ini sebelum menganggapnya sebagai fakta.
4. Keterbatasan Teknis DeepSeek: Tidak Sesuai Klaim
DeepSeek mengklaim bahwa biaya pelatihannya yang lebih rendah dapat menghasilkan performa yang setara dengan OpenAI, namun kenyataannya jauh berbeda. Chatbot ini menunjukkan kekurangan besar dalam hal pengetahuan dan kecakapan teknis, yang seharusnya sudah diantisipasi oleh pengembang.
4.1. Pelatihan Terbatas Hingga Oktober 2023
Karena hanya dilatih menggunakan data hingga Oktober 2023, DeepSeek tidak mampu memberikan jawaban yang up-to-date mengenai peristiwa terkini. Ini jelas sangat membatasi fungsionalitasnya, terutama jika digunakan untuk mendapatkan informasi mengenai peristiwa global atau perkembangan teknologi terbaru.
4.2. Klaim Mencapai Standar OpenAI Tidak Terbukti
Meskipun DeepSeek mengklaim bisa bersaing dengan OpenAI, pengujian membuktikan bahwa chatbot ini tidak memenuhi standar yang diharapkan. Alih-alih memberikan jawaban yang bervariasi dan cerdas, DeepSeek justru sering memberikan jawaban yang tidak relevan dan tidak memadai, yang merugikan pengguna yang bergantung pada teknologi ini.
4.3. Mengenai Kebijakan Verifikasi Pengguna
Kebijakan DeepSeek yang membebankan tanggung jawab verifikasi informasi kepada pengguna menjadi masalah besar. Ini seharusnya menjadi tugas pengembang untuk memastikan bahwa informasi yang diberikan akurat, bukan tanggung jawab pengguna untuk membuktikan kebenaran informasi yang disampaikan.
5. Dampak terhadap Industri AI: Tren yang Mengkhawatirkan
Hasil audit NewsGuard menunjukkan bahwa meskipun DeepSeek sangat populer, kualitas dan akurasinya sangat meragukan. Dengan potensi penyebaran informasi yang salah dan rentannya terhadap manipulasi, DeepSeek menunjukkan betapa pentingnya pengawasan yang lebih ketat terhadap teknologi AI di masa depan.
5.1. DeepSeek Akan Terus Diperiksa Secara Berkala
NewsGuard kini akan memasukkan DeepSeek dalam audit bulanan untuk memantau tren dan performa chatbot ini. Ini penting agar publik tetap mendapatkan gambaran yang jelas mengenai kualitas teknologi AI yang mereka gunakan.
5.2. Peran Pengguna dalam Verifikasi Informasi
Dengan kebijakan verifikasi yang membebankan tanggung jawab kepada pengguna, pengembang seperti DeepSeek harus lebih bertanggung jawab dalam memastikan bahwa chatbot mereka dapat diandalkan dan tidak menyebarkan misinformasi. Mengingat betapa besarnya potensi teknologi AI ini, menjaga kualitas dan akurasi informasi sangatlah krusial.
DeepSeek, meskipun populer, jelas tidak memenuhi standar yang diharapkan dari sebuah chatbot AI. Jika Anda berencana untuk mengandalkan DeepSeek untuk informasi atau komunikasi, ingatlah untuk selalu memverifikasi kebenaran jawabannya dengan sumber yang lebih dapat dipercaya.
Dapatkan layanan jasa seo web terbaik dan terpercya, dilakukan oleh tim profesional yang tersertifikasi oleh Semrush holdings, Inc. Cek juga update blog, news dan case studies dari kami, layanan promo harga murah juga selalu tersedia. Optimalkan website Anda dapatkan calon pelanggan dari internet dengan layanan seo kami.