Proposal TA
Nama : Moh. Rosy Haqqy Aminy
Nrp : 5025211012
1. Buatlah Topik dan deskripsikan tugas akhir yang akan dikerjakan
Tugas akhir ini berfokus pada pengembangan dan implementasi sistem peringkasan teks panjang menggunakan model bahasa besar (Large Language Models, LLM). Peringkasan teks panjang menjadi tantangan signifikan dalam pemrosesan bahasa alami (NLP), khususnya untuk dokumen yang memiliki struktur kompleks dan memuat informasi beragam.
Pendekatan utama yang digunakan adalah peringkasan abstraktif. Dalam hal ini, penelitian akan memanfaatkan teknik pemrosesan dokumen seperti chunking berbasis KMeans untuk membagi dokumen panjang menjadi bagian-bagian lebih kecil yang relevan dan koheren. Proses ini akan mengelompokkan segmen teks berdasarkan fitur-fitur semantik utama untuk memastikan setiap bagian memiliki fokus tertentu.
Tahapan inti dalam tugas akhir ini:
Preprocessing dan Pemecahan Dokumen:
- Analisis dokumen panjang dan pembagian menjadi chunk menggunakan metode KMeans clustering.
- Optimalisasi jumlah cluster untuk menjaga keseimbangan antara ukuran chunk dan kualitas konten.
Peringkasan Lokal:
- Setiap chunk akan diringkas menggunakan model bahasa besar yang telah di-finetune atau model LLM open-source.
- Peringkasan lokal akan bersifat abstraktif, menghasilkan ringkasan baru yang merepresentasikan inti informasi dari setiap chunk.
Peringkasan Global:
- Ringkasan lokal dari setiap chunk akan digabungkan menjadi satu teks utuh.
- LLM akan digunakan untuk membuat ringkasan akhir yang koheren, mencakup seluruh informasi utama dari dokumen panjang.
Evaluasi Kualitas Peringkasan:
- Evaluasi menggunakan metrik otomatis seperti ROUGE, BLEU, dan METEOR.
- Melibatkan evaluasi manual untuk menilai kualitas, relevansi, dan koherensi ringkasan.
Hasil yang Diharapkan:
- Model peringkasan teks panjang yang efisien, dapat diandalkan, dan menghasilkan ringkasan yang koheren, informatif, serta relevan.
- Dokumentasi langkah-langkah teknis dan panduan untuk implementasi sistem ini.
Teknologi dan Alat yang Digunakan:
- Library NLP seperti Hugging Face Transformers.
- Pemodelan dengan LLM, seperti MT5 atau LLaMA.
- Algoritma clustering seperti KMeans dari Scikit-learn atau alternatif yang relevan.
- Framework Python seperti TensorFlow atau PyTorch.
Tugas akhir ini akan memberikan kontribusi signifikan pada bidang NLP, khususnya dalam menangani dokumen teks panjang, sekaligus menambahkan solusi inovatif untuk kebutuhan peringkasan abstraktif berbasis LLM.
2. Buatlan Timeline Rencana Tugas Akhir. Kapan rencana dituntaskan?
JADWAL KEGIATAN
NO |
Nama Kegiatan |
Minggu ke- |
|||||||||||||
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
13 |
14 |
||
1 |
Studi Pustaka |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2 |
Pembuatan Proposal |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
3 |
Percarian data |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
4 |
pengolahan data |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
5 |
Pembuatan model |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
6 |
Evaluasi model |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
7 |
Pelaporan kemajuan |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
8 |
Pembuatan absrak seminar |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
9 |
Mengikuti seminar |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
10 |
Penyusunan laporan Tugas Akhir |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Komentar
Posting Komentar