Last Updated on by Linux Jateng

Cara install RapidMiner Linux Mint 20 atau Ubuntu 20.04 dengan mudah disertai review ulasan penggunaan aplikasi data mining di Linux yang bernama Rapid Miner ini.




Table Of Contents

Apa Itu RapidMiner

RapidMiner adalah platform atau tool data science terutama untuk analisis big data terkemuka yang di dalamnya menyediakan tool untuk proses preprocessing dataset, machine learning dan penerapan model prediktif. RapidMiner merupakan software handal dan multi platform untuk menciptakan, mengirimkan, dan memelihara data berteknologi tinggi. Dengan RapidMiner platform yang menawarkan lebih banyak fitur daripada software lain dalam menawatkan solusi visual, ditambah sifatnya open source dan extensible untuk mendukung semua kebutuhan data science.

Diperkirakan jumlah data pada akhir abad ke-21, volume informasi yang akan melebihi 4.22 yottabytes. Dan volume lalu lintas Internet telah melewati tanda satu zettabyte dan dalam beberapa tahun akan beberapa zettabytes. Informasi ini harus diolah dan disajikan dalam bentuk yang dapat dibaca. Untuk itulah diperlukan tool buatan atau pabrikan yang mampu melakukan pengolahan data-data tersebut.

Cara Install RapidMiner Linux

Sebelum instalasi RapidMiner Studio pada sistem operasi Linux, terlebih dahulu pastikan komputer Anda sudah memenuhi prasyarat berikut:

Paket instalasi RapidMiner Studio untuk Linux tidak menyertakan Java Runtime Environment. Sebelum menginstal RapidMiner Studio, gunakan manajer paket distribusi Anda untuk menginstal JRE versi 8 (kecuali jika sudah ada dengan sistem operasi Anda) dan verifikasi bahwa variabel JAVA_HOME menunjuk ke sana atau java (terdapat di folder bin instalasi Java Anda ) ada di PATH.

Ikuti petunjuk sederhana berikut ini untuk menginstal RapidMiner Studio di sistem Linux:

  1. Klik dua kali file zip yang diunduh (misalnya, rapidminer-studio.zip) lalu ekstrak menggunakan aplikasi ekstraksi semacam “Archive Manager“. Esktrak ke dalam folder home Linux Anda.
  2. Folder yang diekstrak berisi file skrip untuk sistem operasi Linux. Harap pastikan bahwa path folder tidak mengandung karakter + atau %.
  3. Buka terminal di dalam folder dimana Anda mengekstrak file rapidminer-studi.zip dan jalankan ./RapidMiner-Studio.sh
  4. Baca persyaratan perjanjian lisensi dan klik “Saya Setuju” untuk melanjutkan. RapidMiner Studio terbuka.
RapidMiner Linux Install

Error Instalasi RapidMiner

Cara instalasi RapidMiner Windows maupun RapidMiner Linux harus menggunakan Java yang sudah terinstal terlebih dahulu. Jika Anda menginstal RapidMiner di Linux menggunakan cara yang dituliskan di atas, tetapi ketika menjalankan RapidMiner Linux terdapat pesan kesalahan sebagaimana berikut maka solusinya dibahas pada paragraf selanjutnya.

tgov@vpslabs:~/rapidminer-studio$ ./RapidMiner-Studio.sh
RAPIDMINER_HOME is not set. Trying the directory '/home/itgov/rapidminer-studio'...
Exception in thread "main" java.lang.NoClassDefFoundError: javax/xml/bind/DatatypeConverter
	at com.rapidminer.license.verification.JarVerifier.createPublicKey(JarVerifier.java:270)
	at com.rapidminer.license.verification.JarVerifier.<clinit>(JarVerifier.java:140)
	at com.rapidminer.launcher.GUILauncher.main(GUILauncher.java:277)
Caused by: java.lang.ClassNotFoundException: javax.xml.bind.DatatypeConverter
	at java.base/jdk.internal.loader.BuiltinClassLoader.loadClass(BuiltinClassLoader.java:581)
	at java.base/jdk.internal.loader.ClassLoaders$AppClassLoader.loadClass(ClassLoaders.java:178)
	at java.base/java.lang.ClassLoader.loadClass(ClassLoader.java:522)
	... 3 more

Perlu diketahui bahwa RapidMiner versi 9 di Linux membutuhkan Java 8, silahkan pastikan dahulu bahwa Java yang terpasang pada mesin sobat adalah Java 8 dengan perintah:



java -version

Jika hasil yang diberikan adalah Java 11 misalnya, akan mendapati keluaran seperti berikut ini:

itgov@vpslabs:~$ java -version
openjdk 11.0.8 2020-07-14
OpenJDK Runtime Environment (build 11.0.8+10-post-Ubuntu-0ubuntu120.04)
OpenJDK 64-Bit Server VM (build 11.0.8+10-post-Ubuntu-0ubuntu120.04, mixed mode, sharing)

Maka silahkan instal terlebih dahulu Java 8 dengan menjalankan perintah berikut ini pada Terminal:

sudo apt install openjdk-8-jdk openjdk-8-jre

Tunggu sampai proses instalasi selesai, setelah itu silahkan konfigurasi agar mesin menggunakan Java 8 sebagai default. Caranya:

sudo update-alternatives --config java

Akan keluar pertanyaan konfirmasi tentang versi Java mana yang akan sobat pilih sebagai default, silahkan masukkan angka saja kemudian tekan enter. Berikut ini adalah contoh tampilan output command di atas:

itgov@vpslabs:~$ sudo update-alternatives --config java
There are 2 choices for the alternative java (providing /usr/bin/java).

  Selection    Path                                            Priority   Status
------------------------------------------------------------
* 0            /usr/lib/jvm/java-11-openjdk-amd64/bin/java      1111      auto mode
  1            /usr/lib/jvm/java-11-openjdk-amd64/bin/java      1111      manual mode
  2            /usr/lib/jvm/java-8-openjdk-amd64/jre/bin/java   1081      manual mode

Press <enter> to keep the current choice[*], or type selection number: 2
update-alternatives: using /usr/lib/jvm/java-8-openjdk-amd64/jre/bin/java to provide /usr/bin/java (java) in manual mode

# Lalu kita periksa kembali versi Java yang berjalan (running)
itgov@vpslabs:~$ java -version
openjdk version "1.8.0_265"
OpenJDK Runtime Environment (build 1.8.0_265-8u265-b01-0ubuntu2~20.04-b01)
OpenJDK 64-Bit Server VM (build 25.265-b01, mixed mode)

Jika versi Java sudah benar sebagaimana output di atas itu, langkah berikutnya langsung saja instalasi kembali RapidMiner sebagaimana langkah-langkah yang dijelaskan di atas.

Review RapidMiner Linux

Jika anda membandingkan RapidMiner (RM) dengan program-program lainnya, RapidMiner Linux memiliki banyak kemampuan pemrosesan yang lebih ekstensif. Di sisi lain, IBM SPSS memiliki “autopilot” mode. Auto-model — Auto Numerik, Auto Classifier) – melalui beberapa kemungkinan model dengan parameter yang berbeda dan memilih yang terbaik. Orang awam sekalipun mampu membangun model aplikasi yang memadai menggunakan RM.

RapidMiner memiliki analog (Loop dan memberikan yang terbaik), tetapi masih memerlukan setidaknya memilih model dan kriteria untuk memilih yang terbaik. data preprocessing otomatis (Auto Data Prep) — lain yang terkenal SPSS dilakukan dengan cara yang berbeda dan sedikit lebih simpel pada RapidMiner. Dalam SPSS maupun GNU SPSS, pengumpulan data dilakukan dengan Otomatis tunggal Persiapan Data node. kotak centang yang menunjukkan apa yang harus dilakukan dengan data. Pada RapidMiner — hal ini dirakit dari atom node dalam sembarang urutan.

Kelebihan RapidMiner

  1. GUI yang baik. RapidMiner Linux menyediakan fungsionalitas jendela aplikasi utamanya menjadi blok-blok yang dapat terintegrasi dengan baik sehingga menyediakan fungsi visual dengan sangat baik sebagai contoh dalam SPSS Modeler hanya ada 50 node, dan di sini ada sebanyak 250 pada load aplikasi dasar saja jadi lebih lengkap.
  2. Tool pemrosesan yang lengkap. Hal ini biasanya diasumsikan bahwa data yang sedang dipersiapkan di tempat lain dapat diproses langsung menggunakan RapidMiner daripada dipreproses di aplikasi lain. Di saat yang sama aplikasi SPSS memiliki lebih sedikit kesempatan untuk pelatihan.
  3. Extended. Ada sebuah bahasa pemrograman R. Sepenuhnya terintegrasi operator WEKA sistem. Hal ini cocok dengan Hadoop (terpisah dibayar ekstensi dengan rumit bernama Radoop).
  4. Arsitektur, data eksternal. RapidMiner Linux mampu menyiapkan platform, load data, dan mulai mencari di mana korelasi, dan apa yang dapat diprediksi.
  5. Selain IDE, ada juga server. Pesatnya aplikasi data mining dalam menciptakan proses, dan mempublikasikan data di server. Sesuatu seperti Cron server yang tahu proses mana yang harus dimulai, seberapa sering frekuensinya, apa yang harus dilakukan jika ada sesuatu yang jatuh di suatu tempat, siapa yang bertanggung jawab untuk masing-masing proses, cara memberikan sumber daya kepada siapa, dan di mana untuk meng-upload hasil.
  6. Dan server juga dapat memproduksi laporan langsung. Anda dapat meng-upload file XLS dan juga melakukan visualisasi grafis di sana.
  7. Perkembangan yang pesat. Apache Spark — yang terintegrasi kemudian.