Dall-E 2: Menjelajahi Perkembangan Terbaru dalam Penciptaan Gambar oleh AI

  • 0 Comments
  • 36045 Views

Bagi Anda yang memiliki kecintaan pada seni, khususnya lukisan, mungkin nama ini tidak asing di telinga Anda. Ia adalah Salvador Dalí, seorang pelukis ternama asal Spanyol yang dikenal dengan hasil karya surealis dan keahlian menggambarnya juga dipengaruhi oleh master Renaissance. Lalu, kenapa kita menyebutkan nama ini di awal?

Jadi, AI tools berikutnya yang akan kita bahas adalah Dall-E 2. Nama Dall-E sendiri merupakan sebuah lakuran yang diambil dari nama Salvador Dalí dan karakter kartun bernama Wall-E rilisan Pixar. Dall-E 2 masih satu induk perusahaan dengan ChatGPT, yakni OpenAI.

Keterangan : Gambar kucing yang menaiki pegasus

Pada tahun 2021, tepatnya bulan Januari, OpenAI mulai memperkenalkan Dall-E. Lalu, di tahun berikutnya meluncurkan kembali Dall-E 2 dengan hasil gambar yang lebih realistis dan akurat, serta memiliki resolusi 4 kali lebih besar dari versi sebelumnya. Dall-E 2 rilis tepatnya pada tanggal 6 April 2022.

Sederhananya, konsep dari Dall-E 2 ini adalah membantu para pengguna untuk meningkatkan kreativitas. Bagi mereka yang awam, akan lebih mudah mendapatkan gambar sesuai dengan keinginan. Sementara bagi para seniman, diharapkan akan lebih terbantu untuk mendapatkan inspirasi.

Dengan teknologi yang mereka kembangkan, terbentuklah Dall-E 2 ini yang bisa menghasilkan gambar berdasarkan kalimat yang Anda susun. Dall-E 2 memproses kata kunci yang mereka terima, kemudian diubah menjadi sebuah gambar. Keren sekali, bukan? Tetapi, kita juga harus menyebutkan dengan spesifik untuk bisa menghasilkan gambar yang sesuai keinginan. Berikut kami akan berikan contohnya.

Keterangan : gambar kucing yang tidur di sofa alpukat
Keterangan : gambar kucing yang tidur di sofa alpukat, yang dibuat menggunakan pensil

Kesamaan dari kedua gambar itu adalah sama-sama menghasilkan gambar kucing yang tidur di sofa berbentuk alpukat. Tetapi pada gambar kedua, ditambahkan keterangan ‘gambar menggunakan pensil’, maka hasil yang diberikan pun berbeda. Ini teknologi yang sangat canggih. Namun sayangnya, jika Anda memasukkan kata kunci menggunakan bahasa Indonesia, maka hasil gambar yang diberikan kurang sesuai.

Keterangan : Gambar kucing biasa, tidak sesuai dengan deskripsi yang diberikan
Keterangan : Gambar kucing berdasi yang sedang bercermin, sesuai dengan deskripsi

Perhatikan deskripsi yang tertulis pada kedua gambar di atas. Keduanya memiliki makna yang sama, tetapi gambar yang dihasilkan pada gambar pertama (yang menggunakan bahasa Indonesia) hanya menampilkan gambar kucing tanpa dasi atau pun cermin.

Tak hanya untuk kepentingan pribadi, tools ini juga bermanfaat bagi mereka yang merupakan seorang penulis konten. Di mana kesesuaian gambar dengan isi konten adalah salah satu poin penting yang perlu diperhatikan. Sementara, mencari gambar yang tidak terikat hak cipta itu gampang-gampang susah. Sehingga, kehadiran Dall-E 2 ini bisa menjadi solusi yang bagus untuk meningkatkan kualitas konten.

Seorang Research Scientist dari OpenAI, yakni Mark Chen menyatakan bahwa Dall-E 2 tidak hanya mampu menerjemahkan gambar dari sebuah teks, tetapi juga memiliki dua fitur lain.

  1. Variations, fitur yang bisa digunakan untuk mengunggah gambar, kemudian sistem Dall-E 2 akan menghasilkan gambar lain yang memiliki art style atau objek serupa.
  2. Fitur kedua adalah pengguna bisa mengedit gambar yang sudah dihasilkan oleh Dall-E 2. Misalnya, gambar awal adalah kucing, Anda bisa mengeditnya menjadi anjing atau hewan lainnya.

Lantas, bagaimana cara kerja Dall-E 2? Umumnya kecerdasan buatan itu dibuat untuk mengenali dan mengelola data yang ada dengan jumlah yang sangat besar. Jika bicara tentang teknis, tentu akan sangat rumit dan membutuhkan penjelasan yang sangat panjang.

Jadi, Dall-E 2 menggunakan pemodelan difusi yang mana model tersebut melakukan dua proses yang berurutan, yakni membongkar gambar dan membangunnya kembali. Dalam urutan awal, sistem akan mengubah gambar yang ada, menambahkan dengan bentuk yang lain, dan lanjut ke langkah setelahnya. Proses tersebut dilakukan berulang hingga menyebabkan gambar asli kehilangan maknanya.

Setelah proses pertama selesai, sistem akan menjalankan proses secara terbalik. Perlahan noise akan dihilangkan. Lalu, dengan serangkaian langkah, gambar akan dikembalikan. Selanjutnya, noise akan dikurangi lagi dan makna foto akan kembali seperti semula.

Dall-E 2 bisa diakses dengan sangat mudah dan gratis, tetapi itu tidak selamanya. Untuk pengguna awal akan diberikan 50 kredit secara gratis pada bulan pertama dan 15 kredit gratis untuk bulan-bulan berikutnya. Jika Anda membutuhkan lebih banyak, mereka menawarkan 115 kredit (460 gambar) lagi seharga US$15.

Apakah gambar yang dihasilkan Dall-E 2 benar-benar bebas dari hak cipta? Seharusnya jawabannya adalah ya. Sebab, pihak OpenAI sudah memberikan hak penuh kepada para pengguna bahkan jika itu untuk kepentingan komersial; termasuk dicetak ulang, dijadikan ilustrasi buku, dijual dalam jumlah besar, maupun dijadikan merchandise.

Namun, tentu saja hal tersebut menimbulkan pro dan kontra. Beberapa pihak mengkhawatirkan mereka yang adalah seniman, pekerjaan mereka bisa dikorbankan karena AI tools ini. Selain itu, pengguna bebas memasukkan deskripsi, dikhawatirkan mereka memilih karakter yang memiliki merk dagang, seperti Donald Duck, Mickey Mouse, dan lain sebagainya. Ini akan dipertanyakan tentang hak ciptanya.

Terkait hal tersebut, Dall-E tentu sudah memikirkannya. Mereka bekerja sama dengan beberapa peneliti, seniman, developer, dan juga pengguna untuk mempelajari bagaimana resiko yang mungkin ditimbulkan dan pengambilan langkah kedepannya demi meningkatkan kualitas. Berikut adalah beberapa hal yang menjadi fokus perhatian mereka.

  1. Membatasi penyalahgunaan dengan meminimalkan resiko. Dall-E akan menolak jika pengguna mengunggah gambar yang merupakan wajah realistis seseorang atau membuat gambar yang mirip dengan para public figure, termasuk pada selebritas atau tokoh terkemuka.
  2. Mencengah gambar berbahaya dengan memblokir gambar-gambar yang melanggar kebijakan. Seperti konten dewasa, kekerasan, dan juga politik. Selain itu, Dall-E juga membatasi pengguna dengan tidak bisa menghapus konten eksplisit dari data pelatihan yang ada.
  3. Mengurangi bias menggunakan teknik terbaru dari Dall-E, mereka mampu menghasilkan gambar yang mencerminkan keberagaman populasi di dunia dengan lebih akurat.
  4. Adanya pemantauan, baik otomatis menggunakan sistem atau pun manusia, untuk mencegah penyalahgunaan.

Nampaknya semua sudah dikonsep dengan sedemikian matang sehingga bisa menghasilkan sistem yang bermanfaat bagi banyak orang. Namun, apakah Anda pernah terpikirkan sebelumnya, bahwa gambar yang selama ini diciptakan dengan setulus hati, bisa juga dibuat oleh sistem? Mungkin kita harus lebih mempersiapkan diri akan munculnya teknologi canggih lainnya, sebab para peneliti tidak akan berhenti sampai di sini saja.

administrator

Leave A Comment

× Hi, Ada yang Bisa Kami Bantu?