Meta Ngaku Latih AI Pakai Buku Bajakan
Hide Ads

Meta Ngaku Latih AI Pakai Buku Bajakan

Anggoro Suryo - detikInet
Kamis, 18 Jan 2024 12:38 WIB
Facebook employees take a photo with the companys new name and logo outside its headquarters in Menlo Park, Calif., Thursday, Oct. 28, 2021, after the company announced that it is changing its name to Meta Platforms Inc. (AP Photo/Tony Avelar)
Foto: AP/Tony Avelar
Jakarta -

Meta mengakui pemakaian dataset Books3, dan banyak material lain untuk melatih large language model (LLM) Llama 1 dan Llama 2.

Pengakuan ini kaitannya dengan gugatan dari sejumlah penulis buku terhadap Meta, yang menuding Meta menggunakan buku-buku yang dilindungi hak cipta untuk mengembangkan Llama 1 dan Llama 2.

Sebagai informasi, Books3 adalah dataset terkenal yang berisi teks dari 195 ribu buku -- yang dilindungi hak cipta --, dengan ukuran file mencapai 37 GB. Dataset ini dibuat oleh peneliti AI Shawn Presser pada tahun 2020 dengan tujuan menyediakan data yang lebih baik untuk melatih algoritma machine learning.

SCROLL TO CONTINUE WITH CONTENT

Banyak buku dari dataset ini berasal dari situs bajakan buku Bibliotik. Dataset ini juga digugat oleh Rights Alliance, grup anti pembajakan asal Denmark, pada tahun 2023 lalu. Dalam gugatan tersebut, arsip digital dataset Books3 harus diblokir menggunakan aturan Digital Millenium Copyright Act (DMCA).

Kemudian dataset Books3 ini banyak dipakai untuk melatih AI, termasuk oleh perusahaan teknologi besar seperti Meta, yang memakai Books3 dan berbagai dataset kontroversial lain untuk melatih produk AI komersialnya.

ADVERTISEMENT

Terkait masalah ini, New York Times pun saat ini sedang menggugat OpenAI dan Microsoft karena dianggap menggunakan jutaan artikel mereka yang dilindungi hak cipta untuk membangun chatbot ChatGPT.

OpenAI pun secara terbuka sudah pernah menyebut bahwa melatih model AI tanpa menggunakan material yang dilindungi hak cipta adalah hal yang tidak mungkin terjadi, dan meminta hakim untuk menolak gugatan permintaan kompensasi dari pemegang hak cipta.

Sementara itu Meta menganggap bahwa pemakaian konten yang dilindungi hak cipta untuk melatih LLM tidak membutuhkan izin, kompensasi, ataupun pemberian kredit terhadap pemilik hak cipta.

Mereka menyangkal tudingan pelanggaran hak cipta dari penggugat, dan menganggap bahwa kopi buku tanpa izin -- seperti yang ada di dataset Books3 -- bisa dipakai secara bebas, demikian dikutip detikINET dari Techspot, Kamis (18/1/2024).




(asj/rns)