Postingan

Menampilkan postingan dari April, 2024

Quiz P5 Data Mining

Quiz P5 Data Mining Link G Collab :  Google Collab Quiz P5 Download PDF :  PDF 1.       Pendahuluan Dalam laporan ini, kami akan menganalisis data transkrip nilai mahasiswa untuk mengeksplorasi beberapa aspek, termasuk IPS per semester per mahasiswa, hubungan antara IPS dan lulusan tepat waktu, korelasi antara predikat kelulusan 'Pujian' dengan lulusan tepat waktu, hubungan antara durasi studi dan predikat kelulusan, serta perbandingan prestasi akademik berdasarkan jenis kelamin.   2.       IPS per Semester per Mahasiswa Kami menghitung IPS per semester per mahasiswa dengan mengumpulkan nilai total mata kuliah untuk setiap semester dan kemudian membaginya dengan jumlah SKS yang diambil. Ini memberikan gambaran tentang kinerja akademik mahasiswa dari waktu ke waktu.   Metode: 1.         Menghitung nilai total untuk setiap semester berdasarkan data nilai total mata k...

Before We Go 4

Gambar
Before We Go 4 Link Youtube  :  Video Diskusi

Pre-processing

Gambar
Pre Processing Preprocessing adalah teknik paling awal sebelum melakukan data mining dan digunakan untuk menghilangkan masalah yang mungkin terjadi selama pemrosesan data karena format data yang tidak konsisten. Namun, preprocessing juga mencakup beberapa proses seperti membersihkan, mengintegrasikan, mentransformasikan, dan mereduksi data. Data Cleaning Data cleaning atau membersihkan data berarti bahwa data mentah harus dipilih kembali dan kemudian dihapus atau dihilangkan data yang tidak lengkap, tidak relevan, atau tidak akurat. Dengan melakukan tahap ini, Anda dapat menghindari kesalahpahaman saat menganalisis data. Contoh Implementasi data cleaning : 1. Code untuk implementasi Data Cleaning : 2. Output dari code setelah di run : 3. Kesimpulan Kode : Ketika kita menjalankan kode di atas, DataFrame asli dan yang sudah dibersihkan akan ditampilkan. Kode ini akan menangani nilai yang hilang, menghapus duplikat, memperbaiki tipe data, menangani outlier, dan menstandarisasi data. Data ...

Data Preparation dan Visualization

Gambar
Pengertian Data Preparation Proses mengambil data mentah dan menyiapkannya untuk diserap oleh platform analitik dikenal sebagai persiapan data. Untuk mencapai tahap akhir persiapan, data harus dibersihkan, diformat, dan diubah menjadi format yang dapat dicerna oleh alat analisis. Salah satu tujuan utama persiapan data adalah memastikan bahwa data mentah yang disiapkan untuk pemrosesan dan analisis adalah akurat dan konsisten. Tahapan Melakukan Data Preparation Pengumpulan Data       Data yang sudah di siapkan berupa format csv lalu di implementasikan ke                google colab dengan code dan menghasilkan output pada gambar di bawah : Penemuan Data          Step selanjutnya penemuan data dengan cara berikut : Pembersihan Data           Step selanjutnya pembersihan data dengan cara berikut :         Pada pembersihan data ini saya tidak mendapatkan...

CCC ( Computational, Cognitive, Communication )

CCC (Cognitive Computing, Communication, and Computation) "Komputasi Kognitif, Komunikasi, dan Komputasi" (CCC) adalah bidang yang terdiri dari banyak disiplin ilmu dan mencakup berbagai topik, seperti pemrosesan bahasa alami, komputasi kognitif, komunikasi manusia-mesin, dan komputasi berbasis ilmu kognitif. Penelitian dan pengembangan teknologi dilakukan di CCC dengan tujuan membuat sistem yang lebih cerdas dan dapat berinteraksi dengan manusia secara lebih alami. Ini termasuk penggunaan teknologi seperti kecerdasan buatan, pemrosesan bahasa alami, robotika, dan komputasi berbasis ilmu kognitif untuk membangun sistem yang dapat memahami, memproses, dan berkomunikasi dengan manusia dengan cara yang mirip dengan manusia. CCC memiliki aplikasi dalam berbagai bidang, seperti teknologi informasi, kesehatan, pendidikan, dan banyak lagi, dengan tujuan untuk mengembangkan teknologi yang dapat meningkatkan interaksi manusia-komputer, meningkatkan efisiensi komunikasi, dan memungkink...

SEMMA (Sample, Emplore, Model & Assess)

Gambar
SEMMA (Sample, Explore, Modify, Model, dan Assess) Model proses yang disebut SEMMA (singkatan dari Sample, Explore, Modify, Model, dan Assess) dikembangkan oleh Institut SAS untuk menggambarkan berbagai langkah yang perlu dilakukan untuk melakukan analisis data dan membangun model prediktif. Berikut adalah penjelasan singkat dari setiap langkah dalam model SEMMA: Sample (Sampling): Pertama, sampel dari data yang tersedia dipilih. Ini dapat berupa sampel acak atau sampel yang dipilih berdasarkan kriteria tertentu. Tujuannya adalah untuk memastikan bahwa populasi data diwakili secara akurat dan mengurangi bias. Explore (Exploratory Data Analysis): Pada tahap ini, data yang telah disampling diperiksa lebih lanjut. Ini termasuk melihat data, melakukan analisis statistik deskriptif, dan menemukan pola atau anomali yang menarik. Eksplorasi ini membantu memahami karakteristik data, hubungan antar variabel, dan pola atau anomali yang mungkin bermanfaat untuk pemodelan. Modify (Data Preparat...

CRISP-DM (Cross-Industry Standar Process For Data Mining)

Gambar
Apa itu CRISP-DM? C ross-Industry Standard Process for Data Mining  atau CRISP-DM adalah salah satu model proses datamining ( datamining framework ) yang awalnya (1996) dibangun oleh 5 perusahaan yaitu Integral Solutions Ltd (ISL), Teradata, Daimler AG, NCR Corporation dan  OHRA.  Framework ini kemudian dikembangan oleh ratusan organisasi dan perusahaan di Eropa untuk dijadikan  methodology standard non-proprietary  bagi  data mining . Versi pertama dari methodologi ini dipresentasikan pada 4th CRISP-DM SIG Workshop di Brussels pada bulan Maret 1999 (Pete Chapman, 1999); dan langkah langkah proses datamining berdasarkan model ini di publikasikan pada tahun berikutnya (Pete Chapman,2000). Banyak hasil penelitian yang mengungkapkan bahwa CRISP-DM adalah datamining model yang masih digunakan secara luas di kalangan industry, sebahagian dikarenakan keunggulannya dalam menyelesaikan banyak persoalan dalam proyek proyek data mining.

Proses Atau Tahapan Data Mining

Gambar
Apa itu Data Mining? Data mining adalah metode dalam ilmu komputer yang biasa digunakan dalam proses pencarian  knowledge . Tahapan di dalamnya berguna untuk mencari pola-pola tertentu dari data yang ada pada  database . Biasanya, metode ini banyak ditemukan pada bidang  machine learning  dan statistika. Pada awalnya, metode penambangan data dikembangkan karena kompleksitas kerja komputer yang semakin meningkat. Namun, di sinilah keuntungan adanya data mining adalah proses pengumpulan dan seleksi data yang lebih praktis. Banyak teknik dan metode yang ada untuk melakukan berbagai jenis tugas data mining. Metode ini dikelompokkan dalam 3 paradigma utama data mining: Predictive Modeling, Discovery, dan Deviation Detection Serangkaian proses tahapan data mining tersebut memiliki tahap sebagai berikut (Tan, 2004): Pembersihan data (untuk membuang data yang tidak konsisten dan noise) Integrasi data (penggabungan data dari beberapa sumber) Transformasi data (data diuba...