Proposal TA

Nama    : Moh. Rosy Haqqy Aminy

Nrp       : 5025211012


1. Buatlah Topik dan deskripsikan tugas akhir yang akan dikerjakan 

Topik: Peringkasan Teks Panjang Dengan LLM

Tugas akhir ini berfokus pada pengembangan dan implementasi sistem peringkasan teks panjang menggunakan model bahasa besar (Large Language Models, LLM). Peringkasan teks panjang menjadi tantangan signifikan dalam pemrosesan bahasa alami (NLP), khususnya untuk dokumen yang memiliki struktur kompleks dan memuat informasi beragam.

Pendekatan utama yang digunakan adalah peringkasan abstraktif. Dalam hal ini, penelitian akan memanfaatkan teknik pemrosesan dokumen seperti chunking berbasis KMeans untuk membagi dokumen panjang menjadi bagian-bagian lebih kecil yang relevan dan koheren. Proses ini akan mengelompokkan segmen teks berdasarkan fitur-fitur semantik utama untuk memastikan setiap bagian memiliki fokus tertentu.

Tahapan inti dalam tugas akhir ini:

  1. Preprocessing dan Pemecahan Dokumen:

    • Analisis dokumen panjang dan pembagian menjadi chunk menggunakan metode KMeans clustering.
    • Optimalisasi jumlah cluster untuk menjaga keseimbangan antara ukuran chunk dan kualitas konten.
  2. Peringkasan Lokal:

    • Setiap chunk akan diringkas menggunakan model bahasa besar yang telah di-finetune atau model LLM open-source.
    • Peringkasan lokal akan bersifat abstraktif, menghasilkan ringkasan baru yang merepresentasikan inti informasi dari setiap chunk.
  3. Peringkasan Global:

    • Ringkasan lokal dari setiap chunk akan digabungkan menjadi satu teks utuh.
    • LLM akan digunakan untuk membuat ringkasan akhir yang koheren, mencakup seluruh informasi utama dari dokumen panjang.
  4. Evaluasi Kualitas Peringkasan:

    • Evaluasi menggunakan metrik otomatis seperti ROUGE, BLEU, dan METEOR.
    • Melibatkan evaluasi manual untuk menilai kualitas, relevansi, dan koherensi ringkasan.

Hasil yang Diharapkan:

  • Model peringkasan teks panjang yang efisien, dapat diandalkan, dan menghasilkan ringkasan yang koheren, informatif, serta relevan.
  • Dokumentasi langkah-langkah teknis dan panduan untuk implementasi sistem ini.

Teknologi dan Alat yang Digunakan:

  • Library NLP seperti Hugging Face Transformers.
  • Pemodelan dengan LLM, seperti MT5 atau LLaMA.
  • Algoritma clustering seperti KMeans dari Scikit-learn atau alternatif yang relevan.
  • Framework Python seperti TensorFlow atau PyTorch.

Tugas akhir ini akan memberikan kontribusi signifikan pada bidang NLP, khususnya dalam menangani dokumen teks panjang, sekaligus menambahkan solusi inovatif untuk kebutuhan peringkasan abstraktif berbasis LLM.

2. Buatlan Timeline Rencana Tugas Akhir. Kapan rencana dituntaskan?


JADWAL KEGIATAN


NO

Nama Kegiatan

Minggu ke-

1

2

3

4

5

6

7

8

9

10

11

12

13

14

1

Studi Pustaka

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

Pembuatan Proposal

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3

Percarian data

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4

pengolahan data

 

 

 

 

 

 

 

 

 

 

 

 

 

 

5

Pembuatan model

 

 

 

 

 

 

 

 

 

 

 

 

 

 

6

Evaluasi model

 

 

 

 

 

 

 

 

 

 

 

 

 

 

7

Pelaporan kemajuan

 

 

 

 

 

 

 

 

 

 

 

 

 

 

8

Pembuatan absrak seminar

 

 

 

 

 

 

 

 

 

 

 

 

 

 

9

Mengikuti seminar

 

 

 

 

 

 

 

 

 

 

 

 

 

 

10

Penyusunan laporan Tugas Akhir

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 


Komentar

Postingan populer dari blog ini

Latihan 1 (PBKK)

PPL-ETS

PPL-EAS