SlideShare a Scribd company logo
1 of 27
INFORMATION RETRIEVAL
KONTRAK PERKULIAHAN DAN PERTEMUAN 1
Erfian Junianto, S.T., M.Kom
CV Dosen
Nama : Erfian Junianto, ST., M.Kom
NIDN : 0417069001
E-mail : erfian.ejn@ars.ac.id
WhatsApp : 0812-2003-5432
Pendidikan :
• S1 -> Universitas BSI (2012)
• S2 -> Universitas Nusa Mandiri (2014)
Konten
• Pendahuluan
• Kontrak perkuliahan
• Database vs IR
• Contoh IR sederhana (Boolean query)
• Perkembangan IR
Kontrak Perkuliahan
Nama Matakuliah : Information Retrieval
Kredit : 3 SKS
Semester : Gasal 2023/2024
Deskripsi Mata Kuliah
Mahasiswa mempelajari beberapa teknik pengelolaan data teks untuk menemukan kembali
informasi (Information Retrieval) pada data berbentuk teks yang meliputi
• pengolahan awal (preprocessing),
• ekstraksi fitur (fitur extraction),
• perhitungan tingkat kemiripan teks sesuai masukan query,
• dan menampilkan hasil pencarian.
Serta teknik lanjut tentang
• relevance feedback,
• Klasifikasi,
• dan Klasterisasi teks,
untuk membantu pengguna dalam pencarian.
Mahasiswa akan merancang, menganalisis dan mengimplementasikan metode IR (Information
Retrieval ) pada berbagai permasalahan baik secara mandiri maupun kelompok.
Apa itu IR ?
IR is finding material (usually documents) of an unstructured
nature (usually text) that satisfies information need from within
large collections (usually stored on computer) (Manning, 2009)
Proses mencari kembali informasi yang berada pada kumpulan
dokumen yang besar (biasanya berbentuk teks), dan disimpan
dalam computer.
Tujuan IR
• Sistem Temu Kembali Informasi (Information Retrieval) digunakan
untuk menemukan kembali informasi-informasi yang relevan
terhadap kebutuhan pengguna dari suatu kumpulan informasi secara
otomatis.
• Salah satu aplikasi umum dari IR adalah search-engine atau mesin
pencari yang terdapat di internet.
Tantangan
-> Koleksi data yang Besar
-> Tidak Terstruktur
-> Kebutuhan Informasi
Tidak Terstruktur
• Terdiri dari berbagai tipe
• Tidak mementingkan suatu format ataupun urutan tertentu
• Tidak mengikuti aturan tertentu
• Tidak bisa diprediksi
• Dapat meliputi text, video, image, audio
• Contohnya: jurnal, artikel, postingan socmed, blog, e-book, dll
Terstruktur
• Entitas serupa dikelompokkan bersama (relations or classes)
• Entitas dalam grup yang sama memiliki deskripsi yang sama
(attributes)
• Contoh: Relational Database, data Excel
Semi Terstruktur
• Text memiliki heading, paragraph, footnote
• IR juga memfasilitasi pencarian pada semi structured data, missal
pencarian teks/kalimat yang mengandung suatu kata tertentu.
Database vs IR
Perbedaan Database dengan Information Retrieval:
1. Data pada database terstruktur, sedangkan IR tidak terstruktur. Struktur
dalam arti memiliki table, field, record, entity, dan lain-lain.
2. File pada database clear semantic (satu kesatuan, menyeluruh),
sedangkan IR tidak ada field.
3. Query pada database dapat dijelaskan (contoh: SQL), sedangkan IR
merupakan teks bebas seperti bahasa alami, bahasa manusia sehari-hari.
4. Ukuran kesamaannya pada database pasti, sedangkan IR butuh ukuran
keefektifan tertentu, partial (diambil ukuran kesamaan terbaik).
5. Model pada database deterministic, sedangkan IR non deterministic.
Contoh IR sederhana (Boolean query)
Boolean Retrieval Model (BRM) adalah salah satu contoh Information Retrieval
yang merupakan model proses pencarian informasi dari query yang menggunakan
ekspresi boolean. Dengan ekspresi boolean menggunakan operator logika AND, OR
dan NOT.
Sedangkan dalam menentukan hasil perhitungannya hanya berupa nilai binary (1
atau 0). Dengan hal itu, Boolean Retrieval Model (BRM) yang ada hanya dokumen
relevan atau tidak sama sekali. Sehingga keunggulan dari Boolean Retrieval Model
(BRM) tidak menghasilkan dokumen yang mirip.
Contoh IR sederhana (lanjutan)
Query adalah kombinasi dari indeks Boolean.
X AND Y : merupakan doc yang berisi X dan Y
X OR Y : merupakan dokumen yang berisi X atau Y
NOT X : mewakili dokumen yang tidak mengandung X
Contoh IR sederhana (lanjutan)
Sebagai contoh terdapat 5 dokumen berikut ini:
udb_1.txt yang berisi text:
Tutorial pemrograman web dan basis data
udb_2.txt yang berisi text:
Mata Kuliah basis data mysql
udb_3.txt yang berisi text:
Mysql adalah basis data
udb_4.txt yang berisi text:
Kuliah sistem temu kembali informasi
udb_5.txt yang berisi text
Mata Kuliah di Teknik informatika
Contoh IR sederhana (lanjutan)
Membuat Indeks Model Boolean:
Pertama-tama kita membuat matriks istilah yang mewakili daftar semua istilah yang berbeda dan
keberadaan mereka pada setiap dokumen/file. Jika dokumen berisi kata kunci maka bernilai 1 jika
tidak bernilai 0. Berikut ini matriknya:
Contoh IR sederhana (lanjutan)
Matrix: Istilah udb_1.txt udb_2.txt udb_3.txt udb_4.txt udb_5.txt
tutorial 1 0 0 0 0
pemrograman 1 0 0 0 0
web 1 0 0 0 0
dan 1 0 0 0 0
basis 1 1 1 0 0
data 1 1 1 0 0
mata 0 1 0 0 1
kuliah 0 1 0 1 1
mysql 0 1 1 0 0
adalah 0 0 1 0 0
sistem 0 0 0 1 0
temu 0 0 0 1 0
kembali 0 0 0 1 0
informasi 0 0 0 1 0
di 0 0 0 0 1
teknik 0 0 0 0 1
informatika 0 0 0 0 1
Proses Query Boolean:
Contoh IR sederhana (lanjutan)
Contoh IR sederhana (lanjutan)
Penarikan kesimpulan:
Berdasarkan hasil query tersebut maka dokumen yang paling relevan
adalah file udb_5.txt
Perkembangan IR
IR Cerdas
• Memanfaatkan pengertian atau makna dari kata yang digunakan
• Melibatkan urutan kata di dalam query
• Beradaptasi dengan pengguna berdasarkan pada feedback, langsung
ataupun tidak
• Memperluas pencarian dengan term terkait
• Mengerjakan pemeriksaan ejaan/perbaikan tanda pengenal otomatis
Perkembangan IR
Macam-macam IR
• Klasifikasi Dokumen
• Klusterisasi Dokumen
• Peringkasan Teks
• Question Answering System
• SEO
Perkembangan IR - Klasifikasi Dokumen
Dokumen A
Dokumen B
Dokumen C
Dokumen D
Positif
Negatif
Perkembangan IR - Klusterisasi Dokumen
Dokumen A
Dokumen B
Dokumen C
Dokumen D
Positif Negatif
Perkembangan IR - Peringkasan Teks
Lorem ipsum dolor sit amet, consectetur adipiscing elit.
Quisque porta, mi et elementum blandit, magna massa
hendrerit nisl, at cursus est tellus sit amet mi. Nullam
convallis pretium tellus non aliquet. Ut pellentesque velit
vitae pharetra tristique. Cras at odio non purus scelerisque
semper. Nam eu ornare enim, sed vehicula nibh. Ut sed
neque sapien. Vivamus sodales lacus sed pretium ultricies.
Mauris euismod semper sem, eu aliquam dolor pharetra a.
Sed a semper elit. Mauris vitae sagittis enim. Donec
tristique convallis mauris a interdum. Phasellus at magna sit
amet mauris efficitur commodo. Nullam ultricies ultrices
cursus. Aliquam interdum sagittis tincidunt.
Lorem ipsum dolor sit
amet, consectetur adipiscing
elit. Quisque porta, mi et
elementum blandit, magna massa
hendrerit nisl, at cursus est tellus sit
amet mi. Mauris euismod semper
sem, eu aliquam dolor pharetra
a. Mauris vitae sagittis enim.
Donec tristique convallis mauris a
interdum. Phasellus at magna sit
amet mauris efficitur commodo.
Perkembangan IR - Question Answering
System (ChatBot AI)
Perkembangan IR - SEO
TERIMAKASIH

More Related Content

Similar to Pertemuan 1 - Konsep Dasar IR.pptx

Analisis-Perancangan-Sistem-Informasi-Pertemuan-4.ppt
Analisis-Perancangan-Sistem-Informasi-Pertemuan-4.pptAnalisis-Perancangan-Sistem-Informasi-Pertemuan-4.ppt
Analisis-Perancangan-Sistem-Informasi-Pertemuan-4.pptFadhilFauzan3
 
Konsep Data
Konsep DataKonsep Data
Konsep Datayusufbf
 
Reka bentuk pangkalan data
Reka bentuk pangkalan dataReka bentuk pangkalan data
Reka bentuk pangkalan dataanniego90
 
Reka bentuk pangkalan data
Reka bentuk pangkalan dataReka bentuk pangkalan data
Reka bentuk pangkalan datameywong17
 
Makalah pengantar basis data 5109100164
Makalah pengantar basis data 5109100164Makalah pengantar basis data 5109100164
Makalah pengantar basis data 5109100164Budi Raharjo
 
Materi kuliah-sistem-basis-data1
Materi kuliah-sistem-basis-data1Materi kuliah-sistem-basis-data1
Materi kuliah-sistem-basis-data1Fariszal Nova
 
Pengenalan kepada pangkalan data
Pengenalan kepada pangkalan dataPengenalan kepada pangkalan data
Pengenalan kepada pangkalan dataAsterer Terer
 
Naskah publikasi 08.11.2133
Naskah publikasi 08.11.2133Naskah publikasi 08.11.2133
Naskah publikasi 08.11.2133Fahrul Cool
 
Basis data dan gudang data
Basis data dan gudang dataBasis data dan gudang data
Basis data dan gudang datalulus nugraha
 
Sim14, khairul anwar , hapzi, sistem informasi, universitas mercu buana, 2017
Sim14, khairul anwar , hapzi, sistem informasi, universitas mercu buana, 2017Sim14, khairul anwar , hapzi, sistem informasi, universitas mercu buana, 2017
Sim14, khairul anwar , hapzi, sistem informasi, universitas mercu buana, 2017khairul anwar
 
Pengantar sistem basis data
Pengantar sistem basis dataPengantar sistem basis data
Pengantar sistem basis datasaid zulhelmi
 
Makalah sistem informasi akuntansi (sistem manajemen database perpustakaan un...
Makalah sistem informasi akuntansi (sistem manajemen database perpustakaan un...Makalah sistem informasi akuntansi (sistem manajemen database perpustakaan un...
Makalah sistem informasi akuntansi (sistem manajemen database perpustakaan un...Jiantari Marthen
 
01 review dan intro struktur data
01   review dan intro struktur data01   review dan intro struktur data
01 review dan intro struktur dataSamir Java
 
312236643 model-data-dalam-basis-data
312236643 model-data-dalam-basis-data312236643 model-data-dalam-basis-data
312236643 model-data-dalam-basis-datanasrymonihu1
 
Dasar_dasar_Database.pdf
Dasar_dasar_Database.pdfDasar_dasar_Database.pdf
Dasar_dasar_Database.pdflambengmahmud13
 

Similar to Pertemuan 1 - Konsep Dasar IR.pptx (20)

1 basis data
1 basis data1 basis data
1 basis data
 
Analisis-Perancangan-Sistem-Informasi-Pertemuan-4.ppt
Analisis-Perancangan-Sistem-Informasi-Pertemuan-4.pptAnalisis-Perancangan-Sistem-Informasi-Pertemuan-4.ppt
Analisis-Perancangan-Sistem-Informasi-Pertemuan-4.ppt
 
Konsep Data
Konsep DataKonsep Data
Konsep Data
 
Reka bentuk pangkalan data
Reka bentuk pangkalan dataReka bentuk pangkalan data
Reka bentuk pangkalan data
 
Reka bentuk pangkalan data
Reka bentuk pangkalan dataReka bentuk pangkalan data
Reka bentuk pangkalan data
 
Makalah pengantar basis data 5109100164
Makalah pengantar basis data 5109100164Makalah pengantar basis data 5109100164
Makalah pengantar basis data 5109100164
 
Materi kuliah-sistem-basis-data1
Materi kuliah-sistem-basis-data1Materi kuliah-sistem-basis-data1
Materi kuliah-sistem-basis-data1
 
Pengenalan kepada pangkalan data
Pengenalan kepada pangkalan dataPengenalan kepada pangkalan data
Pengenalan kepada pangkalan data
 
01-Pengenalan RIS.pdf
01-Pengenalan RIS.pdf01-Pengenalan RIS.pdf
01-Pengenalan RIS.pdf
 
Naskah publikasi 08.11.2133
Naskah publikasi 08.11.2133Naskah publikasi 08.11.2133
Naskah publikasi 08.11.2133
 
Basis data dan gudang data
Basis data dan gudang dataBasis data dan gudang data
Basis data dan gudang data
 
Sim14, khairul anwar , hapzi, sistem informasi, universitas mercu buana, 2017
Sim14, khairul anwar , hapzi, sistem informasi, universitas mercu buana, 2017Sim14, khairul anwar , hapzi, sistem informasi, universitas mercu buana, 2017
Sim14, khairul anwar , hapzi, sistem informasi, universitas mercu buana, 2017
 
Pertemuan 1 SBD
Pertemuan 1 SBDPertemuan 1 SBD
Pertemuan 1 SBD
 
Pengantar sistem basis data
Pengantar sistem basis dataPengantar sistem basis data
Pengantar sistem basis data
 
Makalah sistem informasi akuntansi (sistem manajemen database perpustakaan un...
Makalah sistem informasi akuntansi (sistem manajemen database perpustakaan un...Makalah sistem informasi akuntansi (sistem manajemen database perpustakaan un...
Makalah sistem informasi akuntansi (sistem manajemen database perpustakaan un...
 
01 review dan intro struktur data
01   review dan intro struktur data01   review dan intro struktur data
01 review dan intro struktur data
 
Login.hotspot.bsi
Login.hotspot.bsiLogin.hotspot.bsi
Login.hotspot.bsi
 
Pertemuan 1
Pertemuan 1Pertemuan 1
Pertemuan 1
 
312236643 model-data-dalam-basis-data
312236643 model-data-dalam-basis-data312236643 model-data-dalam-basis-data
312236643 model-data-dalam-basis-data
 
Dasar_dasar_Database.pdf
Dasar_dasar_Database.pdfDasar_dasar_Database.pdf
Dasar_dasar_Database.pdf
 

Recently uploaded

Metode penelitian Deskriptif atau Survei
Metode penelitian Deskriptif atau SurveiMetode penelitian Deskriptif atau Survei
Metode penelitian Deskriptif atau Surveikustiyantidew94
 
pertemuan-3-distribusi pada-frekuensi.ppt
pertemuan-3-distribusi pada-frekuensi.pptpertemuan-3-distribusi pada-frekuensi.ppt
pertemuan-3-distribusi pada-frekuensi.pptAhmadSyajili
 
manajemen analisis data export data epidata 3.1
manajemen analisis data export data epidata 3.1manajemen analisis data export data epidata 3.1
manajemen analisis data export data epidata 3.1YudiPradipta
 
SKP GURU satuan kinerja pegawai tahun 2023 untuk PNS Aceh
SKP GURU satuan kinerja pegawai tahun 2023 untuk PNS AcehSKP GURU satuan kinerja pegawai tahun 2023 untuk PNS Aceh
SKP GURU satuan kinerja pegawai tahun 2023 untuk PNS AcehBISMIAULIA
 
MARIA NOVILIA BOISALA FASILITATOR PMM.pptx
MARIA NOVILIA BOISALA FASILITATOR PMM.pptxMARIA NOVILIA BOISALA FASILITATOR PMM.pptx
MARIA NOVILIA BOISALA FASILITATOR PMM.pptxmariaboisala21
 
SOP MEDIA KOMUNIKASI DAN KOORDINASI pkms
SOP MEDIA KOMUNIKASI DAN KOORDINASI pkmsSOP MEDIA KOMUNIKASI DAN KOORDINASI pkms
SOP MEDIA KOMUNIKASI DAN KOORDINASI pkmsedyardy
 
MATERI SESI 2 KONSEP ETIKA KOMUNIKASI.pptx
MATERI SESI 2 KONSEP ETIKA KOMUNIKASI.pptxMATERI SESI 2 KONSEP ETIKA KOMUNIKASI.pptx
MATERI SESI 2 KONSEP ETIKA KOMUNIKASI.pptxrikosyahputra0173
 
kesalahan tipe 1 dan 2 pada statistik.pptx
kesalahan tipe 1 dan 2 pada statistik.pptxkesalahan tipe 1 dan 2 pada statistik.pptx
kesalahan tipe 1 dan 2 pada statistik.pptxAhmadSyajili
 
Manajemen Lalu Lintas Baru Di Jalan Selamet Riyadi
Manajemen Lalu Lintas Baru Di Jalan Selamet RiyadiManajemen Lalu Lintas Baru Di Jalan Selamet Riyadi
Manajemen Lalu Lintas Baru Di Jalan Selamet RiyadiCristianoRonaldo185977
 
415418921-statistika- mean media modus data tunggal dan data kelompok
415418921-statistika- mean media modus data tunggal dan data kelompok415418921-statistika- mean media modus data tunggal dan data kelompok
415418921-statistika- mean media modus data tunggal dan data kelompokelmalinda2
 
VULKANISME.pdf vulkanisme dan pengaruh nya terhadap kehidupan
VULKANISME.pdf vulkanisme dan pengaruh nya terhadap kehidupanVULKANISME.pdf vulkanisme dan pengaruh nya terhadap kehidupan
VULKANISME.pdf vulkanisme dan pengaruh nya terhadap kehidupanBungaCitraNazwaAtin
 
PPT Olah Nilai Kurikulum merdeka belajar.pptx
PPT Olah Nilai Kurikulum merdeka belajar.pptxPPT Olah Nilai Kurikulum merdeka belajar.pptx
PPT Olah Nilai Kurikulum merdeka belajar.pptxnursariheldaseptiana
 

Recently uploaded (12)

Metode penelitian Deskriptif atau Survei
Metode penelitian Deskriptif atau SurveiMetode penelitian Deskriptif atau Survei
Metode penelitian Deskriptif atau Survei
 
pertemuan-3-distribusi pada-frekuensi.ppt
pertemuan-3-distribusi pada-frekuensi.pptpertemuan-3-distribusi pada-frekuensi.ppt
pertemuan-3-distribusi pada-frekuensi.ppt
 
manajemen analisis data export data epidata 3.1
manajemen analisis data export data epidata 3.1manajemen analisis data export data epidata 3.1
manajemen analisis data export data epidata 3.1
 
SKP GURU satuan kinerja pegawai tahun 2023 untuk PNS Aceh
SKP GURU satuan kinerja pegawai tahun 2023 untuk PNS AcehSKP GURU satuan kinerja pegawai tahun 2023 untuk PNS Aceh
SKP GURU satuan kinerja pegawai tahun 2023 untuk PNS Aceh
 
MARIA NOVILIA BOISALA FASILITATOR PMM.pptx
MARIA NOVILIA BOISALA FASILITATOR PMM.pptxMARIA NOVILIA BOISALA FASILITATOR PMM.pptx
MARIA NOVILIA BOISALA FASILITATOR PMM.pptx
 
SOP MEDIA KOMUNIKASI DAN KOORDINASI pkms
SOP MEDIA KOMUNIKASI DAN KOORDINASI pkmsSOP MEDIA KOMUNIKASI DAN KOORDINASI pkms
SOP MEDIA KOMUNIKASI DAN KOORDINASI pkms
 
MATERI SESI 2 KONSEP ETIKA KOMUNIKASI.pptx
MATERI SESI 2 KONSEP ETIKA KOMUNIKASI.pptxMATERI SESI 2 KONSEP ETIKA KOMUNIKASI.pptx
MATERI SESI 2 KONSEP ETIKA KOMUNIKASI.pptx
 
kesalahan tipe 1 dan 2 pada statistik.pptx
kesalahan tipe 1 dan 2 pada statistik.pptxkesalahan tipe 1 dan 2 pada statistik.pptx
kesalahan tipe 1 dan 2 pada statistik.pptx
 
Manajemen Lalu Lintas Baru Di Jalan Selamet Riyadi
Manajemen Lalu Lintas Baru Di Jalan Selamet RiyadiManajemen Lalu Lintas Baru Di Jalan Selamet Riyadi
Manajemen Lalu Lintas Baru Di Jalan Selamet Riyadi
 
415418921-statistika- mean media modus data tunggal dan data kelompok
415418921-statistika- mean media modus data tunggal dan data kelompok415418921-statistika- mean media modus data tunggal dan data kelompok
415418921-statistika- mean media modus data tunggal dan data kelompok
 
VULKANISME.pdf vulkanisme dan pengaruh nya terhadap kehidupan
VULKANISME.pdf vulkanisme dan pengaruh nya terhadap kehidupanVULKANISME.pdf vulkanisme dan pengaruh nya terhadap kehidupan
VULKANISME.pdf vulkanisme dan pengaruh nya terhadap kehidupan
 
PPT Olah Nilai Kurikulum merdeka belajar.pptx
PPT Olah Nilai Kurikulum merdeka belajar.pptxPPT Olah Nilai Kurikulum merdeka belajar.pptx
PPT Olah Nilai Kurikulum merdeka belajar.pptx
 

Pertemuan 1 - Konsep Dasar IR.pptx

  • 1. INFORMATION RETRIEVAL KONTRAK PERKULIAHAN DAN PERTEMUAN 1 Erfian Junianto, S.T., M.Kom
  • 2. CV Dosen Nama : Erfian Junianto, ST., M.Kom NIDN : 0417069001 E-mail : erfian.ejn@ars.ac.id WhatsApp : 0812-2003-5432 Pendidikan : • S1 -> Universitas BSI (2012) • S2 -> Universitas Nusa Mandiri (2014)
  • 3. Konten • Pendahuluan • Kontrak perkuliahan • Database vs IR • Contoh IR sederhana (Boolean query) • Perkembangan IR
  • 4. Kontrak Perkuliahan Nama Matakuliah : Information Retrieval Kredit : 3 SKS Semester : Gasal 2023/2024
  • 5. Deskripsi Mata Kuliah Mahasiswa mempelajari beberapa teknik pengelolaan data teks untuk menemukan kembali informasi (Information Retrieval) pada data berbentuk teks yang meliputi • pengolahan awal (preprocessing), • ekstraksi fitur (fitur extraction), • perhitungan tingkat kemiripan teks sesuai masukan query, • dan menampilkan hasil pencarian. Serta teknik lanjut tentang • relevance feedback, • Klasifikasi, • dan Klasterisasi teks, untuk membantu pengguna dalam pencarian. Mahasiswa akan merancang, menganalisis dan mengimplementasikan metode IR (Information Retrieval ) pada berbagai permasalahan baik secara mandiri maupun kelompok.
  • 6. Apa itu IR ? IR is finding material (usually documents) of an unstructured nature (usually text) that satisfies information need from within large collections (usually stored on computer) (Manning, 2009) Proses mencari kembali informasi yang berada pada kumpulan dokumen yang besar (biasanya berbentuk teks), dan disimpan dalam computer.
  • 7. Tujuan IR • Sistem Temu Kembali Informasi (Information Retrieval) digunakan untuk menemukan kembali informasi-informasi yang relevan terhadap kebutuhan pengguna dari suatu kumpulan informasi secara otomatis. • Salah satu aplikasi umum dari IR adalah search-engine atau mesin pencari yang terdapat di internet.
  • 8. Tantangan -> Koleksi data yang Besar -> Tidak Terstruktur -> Kebutuhan Informasi
  • 9. Tidak Terstruktur • Terdiri dari berbagai tipe • Tidak mementingkan suatu format ataupun urutan tertentu • Tidak mengikuti aturan tertentu • Tidak bisa diprediksi • Dapat meliputi text, video, image, audio • Contohnya: jurnal, artikel, postingan socmed, blog, e-book, dll
  • 10. Terstruktur • Entitas serupa dikelompokkan bersama (relations or classes) • Entitas dalam grup yang sama memiliki deskripsi yang sama (attributes) • Contoh: Relational Database, data Excel
  • 11. Semi Terstruktur • Text memiliki heading, paragraph, footnote • IR juga memfasilitasi pencarian pada semi structured data, missal pencarian teks/kalimat yang mengandung suatu kata tertentu.
  • 12. Database vs IR Perbedaan Database dengan Information Retrieval: 1. Data pada database terstruktur, sedangkan IR tidak terstruktur. Struktur dalam arti memiliki table, field, record, entity, dan lain-lain. 2. File pada database clear semantic (satu kesatuan, menyeluruh), sedangkan IR tidak ada field. 3. Query pada database dapat dijelaskan (contoh: SQL), sedangkan IR merupakan teks bebas seperti bahasa alami, bahasa manusia sehari-hari. 4. Ukuran kesamaannya pada database pasti, sedangkan IR butuh ukuran keefektifan tertentu, partial (diambil ukuran kesamaan terbaik). 5. Model pada database deterministic, sedangkan IR non deterministic.
  • 13. Contoh IR sederhana (Boolean query) Boolean Retrieval Model (BRM) adalah salah satu contoh Information Retrieval yang merupakan model proses pencarian informasi dari query yang menggunakan ekspresi boolean. Dengan ekspresi boolean menggunakan operator logika AND, OR dan NOT. Sedangkan dalam menentukan hasil perhitungannya hanya berupa nilai binary (1 atau 0). Dengan hal itu, Boolean Retrieval Model (BRM) yang ada hanya dokumen relevan atau tidak sama sekali. Sehingga keunggulan dari Boolean Retrieval Model (BRM) tidak menghasilkan dokumen yang mirip.
  • 14. Contoh IR sederhana (lanjutan) Query adalah kombinasi dari indeks Boolean. X AND Y : merupakan doc yang berisi X dan Y X OR Y : merupakan dokumen yang berisi X atau Y NOT X : mewakili dokumen yang tidak mengandung X
  • 15. Contoh IR sederhana (lanjutan) Sebagai contoh terdapat 5 dokumen berikut ini: udb_1.txt yang berisi text: Tutorial pemrograman web dan basis data udb_2.txt yang berisi text: Mata Kuliah basis data mysql udb_3.txt yang berisi text: Mysql adalah basis data udb_4.txt yang berisi text: Kuliah sistem temu kembali informasi udb_5.txt yang berisi text Mata Kuliah di Teknik informatika
  • 16. Contoh IR sederhana (lanjutan) Membuat Indeks Model Boolean: Pertama-tama kita membuat matriks istilah yang mewakili daftar semua istilah yang berbeda dan keberadaan mereka pada setiap dokumen/file. Jika dokumen berisi kata kunci maka bernilai 1 jika tidak bernilai 0. Berikut ini matriknya:
  • 17. Contoh IR sederhana (lanjutan) Matrix: Istilah udb_1.txt udb_2.txt udb_3.txt udb_4.txt udb_5.txt tutorial 1 0 0 0 0 pemrograman 1 0 0 0 0 web 1 0 0 0 0 dan 1 0 0 0 0 basis 1 1 1 0 0 data 1 1 1 0 0 mata 0 1 0 0 1 kuliah 0 1 0 1 1 mysql 0 1 1 0 0 adalah 0 0 1 0 0 sistem 0 0 0 1 0 temu 0 0 0 1 0 kembali 0 0 0 1 0 informasi 0 0 0 1 0 di 0 0 0 0 1 teknik 0 0 0 0 1 informatika 0 0 0 0 1
  • 18. Proses Query Boolean: Contoh IR sederhana (lanjutan)
  • 19. Contoh IR sederhana (lanjutan) Penarikan kesimpulan: Berdasarkan hasil query tersebut maka dokumen yang paling relevan adalah file udb_5.txt
  • 20. Perkembangan IR IR Cerdas • Memanfaatkan pengertian atau makna dari kata yang digunakan • Melibatkan urutan kata di dalam query • Beradaptasi dengan pengguna berdasarkan pada feedback, langsung ataupun tidak • Memperluas pencarian dengan term terkait • Mengerjakan pemeriksaan ejaan/perbaikan tanda pengenal otomatis
  • 21. Perkembangan IR Macam-macam IR • Klasifikasi Dokumen • Klusterisasi Dokumen • Peringkasan Teks • Question Answering System • SEO
  • 22. Perkembangan IR - Klasifikasi Dokumen Dokumen A Dokumen B Dokumen C Dokumen D Positif Negatif
  • 23. Perkembangan IR - Klusterisasi Dokumen Dokumen A Dokumen B Dokumen C Dokumen D Positif Negatif
  • 24. Perkembangan IR - Peringkasan Teks Lorem ipsum dolor sit amet, consectetur adipiscing elit. Quisque porta, mi et elementum blandit, magna massa hendrerit nisl, at cursus est tellus sit amet mi. Nullam convallis pretium tellus non aliquet. Ut pellentesque velit vitae pharetra tristique. Cras at odio non purus scelerisque semper. Nam eu ornare enim, sed vehicula nibh. Ut sed neque sapien. Vivamus sodales lacus sed pretium ultricies. Mauris euismod semper sem, eu aliquam dolor pharetra a. Sed a semper elit. Mauris vitae sagittis enim. Donec tristique convallis mauris a interdum. Phasellus at magna sit amet mauris efficitur commodo. Nullam ultricies ultrices cursus. Aliquam interdum sagittis tincidunt. Lorem ipsum dolor sit amet, consectetur adipiscing elit. Quisque porta, mi et elementum blandit, magna massa hendrerit nisl, at cursus est tellus sit amet mi. Mauris euismod semper sem, eu aliquam dolor pharetra a. Mauris vitae sagittis enim. Donec tristique convallis mauris a interdum. Phasellus at magna sit amet mauris efficitur commodo.
  • 25. Perkembangan IR - Question Answering System (ChatBot AI)