diff --git a/dataset/dataset_ner_srl.json b/dataset/dataset_ner_srl.json index a7177f5..21714e3 100644 --- a/dataset/dataset_ner_srl.json +++ b/dataset/dataset_ner_srl.json @@ -915,7 +915,9 @@ "terjadi", "pada", "bulan", - "Oktober-Maret", + "Oktober", + "-", + "Maret", ",", "sedangkan", "musim", @@ -923,7 +925,9 @@ "terjadi", "pada", "bulan", - "April-September", + "April", + "-", + "September", "." ], "labels_ner": [ @@ -934,6 +938,7 @@ "O", "B-DATE", "O", + "B-DATE", "O", "O", "O", @@ -941,6 +946,8 @@ "O", "O", "B-DATE", + "O", + "B-DATE", "O" ], "labels_srl": [ @@ -951,6 +958,8 @@ "AM-TMP", "AM-TMP", "O", + "AM-TMP", + "O", "O", "ARG1", "ARG1", @@ -958,6 +967,8 @@ "AM-TMP", "AM-TMP", "AM-TMP", + "O", + "AM-TMP", "O" ] }, @@ -4250,5 +4261,1353 @@ "ARG1", "O" ] + }, + + { + "tokens": [ + "Proklamasi", + "kemerdekaan", + "Indonesia", + "terjadi", + "pada", + "17", + "Agustus", + "1945", + "." + ], + "labels_ner": [ + "O", + "O", + "B-LOC", + "O", + "O", + "B-DATE", + "I-DATE", + "I-DATE", + "O" + ], + "labels_srl": [ + "ARG1", + "ARG1", + "ARG1", + "V", + "AM-TMP", + "AM-TMP", + "AM-TMP", + "AM-TMP", + "O" + ] + }, + { + "tokens": [ + "Barack", + "Obama", + "lahir", + "pada", + "4", + "Agustus", + "1961", + "di", + "Hawaii", + "." + ], + "labels_ner": [ + "B-PER", + "I-PER", + "O", + "O", + "B-DATE", + "I-DATE", + "I-DATE", + "O", + "B-LOC", + "O" + ], + "labels_srl": [ + "ARG0", + "ARG0", + "V", + "AM-TMP", + "AM-TMP", + "AM-TMP", + "AM-TMP", + "AM-LOC", + "AM-LOC", + "O" + ] + }, + { + "tokens": [ + "Reformasi", + "Indonesia", + "dimulai", + "tahun", + "1998", + "setelah", + "Soeharto", + "mundur", + "." + ], + "labels_ner": ["O", "B-LOC", "O", "O", "B-DATE", "O", "B-PER", "O", "O"], + "labels_srl": [ + "ARG1", + "ARG1", + "V", + "AM-TMP", + "AM-TMP", + "AM-TMP", + "ARG0", + "V", + "O" + ] + }, + { + "tokens": [ + "Perang", + "Dunia", + "II", + "berakhir", + "pada", + "2", + "September", + "1945", + "." + ], + "labels_ner": [ + "B-MISC", + "I-MISC", + "I-MISC", + "O", + "O", + "B-DATE", + "I-DATE", + "I-DATE", + "O" + ], + "labels_srl": [ + "ARG1", + "ARG1", + "ARG1", + "V", + "AM-TMP", + "AM-TMP", + "AM-TMP", + "AM-TMP", + "O" + ] + }, + { + "tokens": [ + "Indonesia", + "menjadi", + "anggota", + "PBB", + "sejak", + "28", + "September", + "1950", + "." + ], + "labels_ner": [ + "B-LOC", + "O", + "O", + "B-ORG", + "O", + "B-DATE", + "I-DATE", + "I-DATE", + "O" + ], + "labels_srl": [ + "ARG0", + "V", + "ARG1", + "ARG1", + "AM-TMP", + "AM-TMP", + "AM-TMP", + "AM-TMP", + "O" + ] + }, + { + "tokens": [ + "Banjir", + "bandang", + "terjadi", + "pada", + "5", + "Januari", + "2021", + "di", + "Bandung", + "." + ], + "labels_ner": [ + "O", + "O", + "O", + "O", + "B-DATE", + "I-DATE", + "I-DATE", + "O", + "B-LOC", + "O" + ], + "labels_srl": [ + "ARG1", + "ARG1", + "V", + "AM-TMP", + "AM-TMP", + "AM-TMP", + "AM-TMP", + "AM-LOC", + "AM-LOC", + "O" + ] + }, + { + "tokens": [ + "Hari", + "Pahlawan", + "diperingati", + "setiap", + "10", + "November", + "." + ], + "labels_ner": ["O", "O", "O", "O", "B-DATE", "I-DATE", "O"], + "labels_srl": ["ARG1", "ARG1", "V", "AM-TMP", "AM-TMP", "AM-TMP", "O"] + }, + { + "tokens": ["Pada", "tahun", "1511", "Portugis", "menguasai", "Malaka", "."], + "labels_ner": ["O", "O", "B-DATE", "B-ORG", "O", "B-LOC", "O"], + "labels_srl": ["AM-TMP", "AM-TMP", "AM-TMP", "ARG0", "V", "ARG1", "O"] + }, + { + "tokens": [ + "Konferensi", + "Asia-Afrika", + "diselenggarakan", + "tahun", + "1955", + "di", + "Bandung", + "." + ], + "labels_ner": ["B-EVENT", "I-EVENT", "O", "O", "B-DATE", "O", "B-LOC", "O"], + "labels_srl": [ + "ARG1", + "ARG1", + "V", + "AM-TMP", + "AM-TMP", + "AM-LOC", + "AM-LOC", + "O" + ] + }, + { + "tokens": [ + "Musim", + "kemarau", + "diperkirakan", + "mulai", + "April", + "2025", + "." + ], + "labels_ner": ["O", "O", "O", "O", "B-DATE", "I-DATE", "O"], + "labels_srl": ["ARG1", "ARG1", "V", "AM-TMP", "AM-TMP", "AM-TMP", "O"] + }, + + { + "tokens": ["Rapat", "dimulai", "pukul", "09.00", "pagi", "."], + "labels_ner": ["O", "O", "O", "B-TIME", "I-TIME", "O"], + "labels_srl": ["ARG1", "V", "AM-TMP", "AM-TMP", "AM-TMP", "O"] + }, + { + "tokens": ["Kereta", "akan", "tiba", "sekitar", "jam", "3", "sore", "."], + "labels_ner": ["O", "O", "O", "O", "O", "B-TIME", "I-TIME", "O"], + "labels_srl": [ + "ARG1", + "O", + "V", + "AM-TMP", + "AM-TMP", + "AM-TMP", + "AM-TMP", + "O" + ] + }, + { + "tokens": [ + "Pertandingan", + "akan", + "dimulai", + "pada", + "pukul", + "19.30", + "." + ], + "labels_ner": ["O", "O", "O", "O", "O", "B-TIME", "O"], + "labels_srl": ["ARG1", "O", "V", "AM-TMP", "AM-TMP", "AM-TMP", "O"] + }, + { + "tokens": [ + "Matahari", + "terbit", + "sekitar", + "05.45", + "pagi", + "di", + "Jakarta", + "." + ], + "labels_ner": ["O", "O", "O", "B-TIME", "I-TIME", "O", "B-LOC", "O"], + "labels_srl": [ + "ARG1", + "V", + "AM-TMP", + "AM-TMP", + "AM-TMP", + "AM-LOC", + "AM-LOC", + "O" + ] + }, + { + "tokens": [ + "Makan", + "siang", + "biasanya", + "dilakukan", + "sekitar", + "jam", + "12", + "siang", + "." + ], + "labels_ner": ["O", "O", "O", "O", "O", "O", "B-TIME", "I-TIME", "O"], + "labels_srl": [ + "ARG1", + "ARG1", + "O", + "V", + "AM-TMP", + "AM-TMP", + "AM-TMP", + "AM-TMP", + "O" + ] + }, + { + "tokens": [ + "Penerbangan", + "dijadwalkan", + "lepas", + "landas", + "pukul", + "23.15", + "." + ], + "labels_ner": ["O", "O", "O", "O", "O", "B-TIME", "O"], + "labels_srl": ["ARG1", "V", "V", "V", "AM-TMP", "AM-TMP", "O"] + }, + { + "tokens": ["Film", "tayang", "mulai", "jam", "8", "malam", "nanti", "."], + "labels_ner": ["O", "O", "O", "O", "B-TIME", "I-TIME", "I-TIME", "O"], + "labels_srl": [ + "ARG1", + "V", + "AM-TMP", + "AM-TMP", + "AM-TMP", + "AM-TMP", + "AM-TMP", + "O" + ] + }, + { + "tokens": [ + "Pesawat", + "mendarat", + "tepat", + "pada", + "00.30", + "dinihari", + "." + ], + "labels_ner": ["O", "O", "O", "O", "B-TIME", "I-TIME", "O"], + "labels_srl": ["ARG1", "V", "O", "AM-TMP", "AM-TMP", "AM-TMP", "O"] + }, + { + "tokens": ["Siaran", "langsung", "dimulai", "pukul", "18.00", "."], + "labels_ner": ["O", "O", "O", "O", "B-TIME", "O"], + "labels_srl": ["ARG1", "ARG1", "V", "AM-TMP", "AM-TMP", "O"] + }, + { + "tokens": [ + "Jam", + "kerja", + "dimulai", + "pukul", + "08.00", + "dan", + "berakhir", + "pukul", + "17.00", + "." + ], + "labels_ner": ["O", "O", "O", "O", "B-TIME", "O", "O", "O", "B-TIME", "O"], + "labels_srl": [ + "ARG1", + "ARG1", + "V", + "AM-TMP", + "AM-TMP", + "O", + "V", + "AM-TMP", + "AM-TMP", + "O" + ] + }, + { + "tokens": ["Alarm", "berbunyi", "pada", "pukul", "06.00", "pagi", "."], + "labels_ner": ["O", "O", "O", "O", "B-TIME", "I-TIME", "O"], + "labels_srl": ["ARG1", "V", "AM-TMP", "AM-TMP", "AM-TMP", "AM-TMP", "O"] + }, + { + "tokens": [ + "Saya", + "bangun", + "sekitar", + "jam", + "5", + "pagi", + "setiap", + "hari", + "." + ], + "labels_ner": ["O", "O", "O", "O", "B-TIME", "I-TIME", "O", "O", "O"], + "labels_srl": [ + "ARG0", + "V", + "AM-TMP", + "AM-TMP", + "AM-TMP", + "AM-TMP", + "O", + "O", + "O" + ] + }, + { + "tokens": [ + "Konser", + "dimulai", + "sekitar", + "20.00", + "malam", + "di", + "stadion", + "." + ], + "labels_ner": ["O", "O", "O", "B-TIME", "I-TIME", "O", "B-LOC", "O"], + "labels_srl": [ + "ARG1", + "V", + "AM-TMP", + "AM-TMP", + "AM-TMP", + "AM-LOC", + "AM-LOC", + "O" + ] + }, + { + "tokens": ["Wawancara", "dijadwalkan", "pada", "jam", "11", "pagi", "."], + "labels_ner": ["O", "O", "O", "O", "B-TIME", "I-TIME", "O"], + "labels_srl": ["ARG1", "V", "AM-TMP", "AM-TMP", "AM-TMP", "AM-TMP", "O"] + }, + { + "tokens": [ + "Kami", + "tiba", + "di", + "bandara", + "sekitar", + "jam", + "2", + "dinihari", + "." + ], + "labels_ner": ["O", "O", "O", "B-LOC", "O", "O", "B-TIME", "I-TIME", "O"], + "labels_srl": [ + "ARG0", + "V", + "AM-LOC", + "AM-LOC", + "AM-TMP", + "AM-TMP", + "AM-TMP", + "AM-TMP", + "O" + ] + }, + { + "tokens": ["Dia", "mengajar", "kelas", "pada", "pukul", "13.00", "."], + "labels_ner": ["O", "O", "O", "O", "O", "B-TIME", "O"], + "labels_srl": ["ARG0", "V", "ARG1", "AM-TMP", "AM-TMP", "AM-TMP", "O"] + }, + { + "tokens": [ + "Peserta", + "diminta", + "hadir", + "sebelum", + "jam", + "7", + "pagi", + "." + ], + "labels_ner": ["O", "O", "O", "O", "O", "B-TIME", "I-TIME", "O"], + "labels_srl": [ + "ARG1", + "V", + "V", + "AM-TMP", + "AM-TMP", + "AM-TMP", + "AM-TMP", + "O" + ] + }, + { + "tokens": [ + "Televisi", + "menayangkan", + "berita", + "malam", + "pada", + "22.00", + "." + ], + "labels_ner": ["O", "O", "O", "O", "O", "B-TIME", "O"], + "labels_srl": ["ARG0", "V", "ARG1", "ARG1", "AM-TMP", "AM-TMP", "O"] + }, + { + "tokens": [ + "Kami", + "akan", + "bertemu", + "jam", + "10", + "malam", + "di", + "kafe", + "." + ], + "labels_ner": ["O", "O", "O", "O", "B-TIME", "I-TIME", "O", "B-LOC", "O"], + "labels_srl": [ + "ARG0", + "O", + "V", + "AM-TMP", + "AM-TMP", + "AM-TMP", + "AM-LOC", + "AM-LOC", + "O" + ] + }, + { + "tokens": ["Toko", "buka", "hingga", "pukul", "21.00", "."], + "labels_ner": ["O", "O", "O", "O", "B-TIME", "O"], + "labels_srl": ["ARG1", "V", "AM-TMP", "AM-TMP", "AM-TMP", "O"] + }, + + { + "tokens": ["Dia", "biasanya", "berolahraga", "pada", "pagi", "hari", "."], + "labels_ner": ["O", "O", "O", "O", "B-TIME", "I-TIME", "O"], + "labels_srl": ["ARG0", "O", "V", "AM-TMP", "AM-TMP", "AM-TMP", "O"] + }, + { + "tokens": ["Kami", "bertemu", "lagi", "pada", "malam", "hari", "itu", "."], + "labels_ner": ["O", "O", "O", "O", "B-TIME", "I-TIME", "O", "O"], + "labels_srl": [ + "ARG0", + "V", + "O", + "AM-TMP", + "AM-TMP", + "AM-TMP", + "AM-TMP", + "O" + ] + }, + { + "tokens": [ + "Upacara", + "dilaksanakan", + "pada", + "sore", + "hari", + "di", + "lapangan", + "." + ], + "labels_ner": ["O", "O", "O", "B-TIME", "I-TIME", "O", "B-LOC", "O"], + "labels_srl": [ + "ARG1", + "V", + "AM-TMP", + "AM-TMP", + "AM-TMP", + "AM-LOC", + "AM-LOC", + "O" + ] + }, + { + "tokens": ["Ia", "pulang", "setiap", "malam", "sekitar", "jam", "9", "."], + "labels_ner": ["O", "O", "O", "B-TIME", "O", "O", "B-TIME", "O"], + "labels_srl": [ + "ARG0", + "V", + "O", + "AM-TMP", + "AM-TMP", + "AM-TMP", + "AM-TMP", + "O" + ] + }, + { + "tokens": [ + "Kami", + "berangkat", + "di", + "pagi", + "hari", + "menggunakan", + "mobil", + "." + ], + "labels_ner": ["O", "O", "O", "B-TIME", "I-TIME", "O", "O", "O"], + "labels_srl": [ + "ARG0", + "V", + "AM-TMP", + "AM-TMP", + "AM-TMP", + "ARGM-MNR", + "ARGM-MNR", + "O" + ] + }, + { + "tokens": ["Acara", "berlangsung", "hingga", "malam", "hari", "."], + "labels_ner": ["O", "O", "O", "B-TIME", "I-TIME", "O"], + "labels_srl": ["ARG1", "V", "AM-TMP", "AM-TMP", "AM-TMP", "O"] + }, + { + "tokens": ["Kami", "tiba", "di", "Bandara", "pada", "dinihari", "."], + "labels_ner": ["O", "O", "O", "B-LOC", "O", "B-TIME", "O"], + "labels_srl": ["ARG0", "V", "AM-LOC", "AM-LOC", "AM-TMP", "AM-TMP", "O"] + }, + { + "tokens": ["Pintu", "gerbang", "dibuka", "setiap", "pagi", "."], + "labels_ner": ["O", "O", "O", "O", "B-TIME", "O"], + "labels_srl": ["ARG1", "ARG1", "V", "O", "AM-TMP", "O"] + }, + { + "tokens": ["Ia", "selalu", "belajar", "di", "malam", "."], + "labels_ner": ["O", "O", "O", "O", "B-TIME", "O"], + "labels_srl": ["ARG0", "O", "V", "AM-TMP", "AM-TMP", "O"] + }, + { + "tokens": ["Waktu", "bermain", "dimulai", "sore", "hari", "."], + "labels_ner": ["O", "O", "O", "B-TIME", "I-TIME", "O"], + "labels_srl": ["ARG1", "ARG1", "V", "AM-TMP", "AM-TMP", "O"] + }, + { + "tokens": [ + "Pelajaran", + "kedua", + "dimulai", + "sekitar", + "jam", + "tujuh", + "lebih", + "sepuluh", + "menit", + "." + ], + "labels_ner": [ + "O", + "O", + "O", + "O", + "O", + "B-TIME", + "I-TIME", + "I-TIME", + "I-TIME", + "O" + ], + "labels_srl": [ + "ARG1", + "ARG1", + "V", + "AM-TMP", + "AM-TMP", + "AM-TMP", + "AM-TMP", + "AM-TMP", + "AM-TMP", + "O" + ] + }, + { + "tokens": [ + "Bus", + "berangkat", + "kurang", + "lebih", + "jam", + "delapan", + "malam", + "." + ], + "labels_ner": ["O", "O", "O", "O", "O", "B-TIME", "I-TIME", "O"], + "labels_srl": [ + "ARG0", + "V", + "AM-TMP", + "AM-TMP", + "AM-TMP", + "AM-TMP", + "AM-TMP", + "O" + ] + }, + { + "tokens": [ + "Pertemuan", + "terakhir", + "dilaksanakan", + "sebelum", + "matahari", + "terbenam", + "." + ], + "labels_ner": ["O", "O", "O", "O", "B-TIME", "I-TIME", "O"], + "labels_srl": ["ARG1", "ARG1", "V", "AM-TMP", "AM-TMP", "AM-TMP", "O"] + }, + { + "tokens": [ + "Kereta", + "berangkat", + "sekitar", + "tengah", + "malam", + "dari", + "stasiun", + "Gambir", + "." + ], + "labels_ner": ["O", "O", "O", "B-TIME", "I-TIME", "O", "O", "B-LOC", "O"], + "labels_srl": [ + "ARG0", + "V", + "AM-TMP", + "AM-TMP", + "AM-TMP", + "AM-LOC", + "AM-LOC", + "AM-LOC", + "O" + ] + }, + { + "tokens": [ + "Jadwal", + "sholat", + "dimulai", + "pukul", + "empat", + "lebih", + "lima", + "menit", + "." + ], + "labels_ner": [ + "O", + "O", + "O", + "O", + "B-TIME", + "I-TIME", + "I-TIME", + "I-TIME", + "O" + ], + "labels_srl": [ + "ARG1", + "ARG1", + "V", + "AM-TMP", + "AM-TMP", + "AM-TMP", + "AM-TMP", + "AM-TMP", + "O" + ] + }, + { + "tokens": [ + "Pemadaman", + "listrik", + "akan", + "dimulai", + "menjelang", + "malam", + "." + ], + "labels_ner": ["O", "O", "O", "O", "B-TIME", "I-TIME", "O"], + "labels_srl": ["ARG1", "ARG1", "O", "V", "AM-TMP", "AM-TMP", "O"] + }, + { + "tokens": [ + "Layanan", + "pelanggan", + "dibuka", + "setiap", + "hari", + "kerja", + "jam", + "sembilan", + "." + ], + "labels_ner": ["O", "O", "O", "O", "O", "O", "O", "B-TIME", "O"], + "labels_srl": ["ARG1", "ARG1", "V", "O", "O", "O", "AM-TMP", "AM-TMP", "O"] + }, + { + "tokens": [ + "Ia", + "terjaga", + "di", + "tengah", + "malam", + "karena", + "petir", + "." + ], + "labels_ner": ["O", "O", "O", "B-TIME", "I-TIME", "O", "O"], + "labels_srl": [ + "ARG0", + "V", + "AM-TMP", + "AM-TMP", + "AM-TMP", + "AM-CAU", + "AM-CAU" + ] + }, + { + "tokens": [ + "Kelas", + "selesai", + "sekitar", + "jam", + "dua", + "kurang", + "seperempat", + "." + ], + "labels_ner": ["O", "O", "O", "O", "B-TIME", "I-TIME", "I-TIME", "O"], + "labels_srl": [ + "ARG1", + "V", + "AM-TMP", + "AM-TMP", + "AM-TMP", + "AM-TMP", + "AM-TMP", + "O" + ] + }, + { + "tokens": [ + "Waktu", + "sarapan", + "dimulai", + "pukul", + "6.30", + "hingga", + "7.30", + "." + ], + "labels_ner": ["O", "O", "O", "O", "B-TIME", "O", "B-TIME", "O"], + "labels_srl": [ + "ARG1", + "ARG1", + "V", + "AM-TMP", + "AM-TMP", + "AM-TMP", + "AM-TMP", + "O" + ] + }, + { + "tokens": [ + "Proklamasi", + "kemerdekaan", + "terjadi", + "pada", + "17", + "Agustus", + "1945", + "." + ], + "labels_ner": ["O", "O", "O", "O", "B-DATE", "I-DATE", "I-DATE", "O"], + "labels_srl": [ + "ARG1", + "ARG1", + "V", + "AM-TMP", + "AM-TMP", + "AM-TMP", + "AM-TMP", + "O" + ] + }, + { + "tokens": ["Indonesia", "merdeka", "pada", "tahun", "1945", "."], + "labels_ner": ["B-LOC", "O", "O", "O", "B-DATE", "O"], + "labels_srl": ["ARG0", "V", "AM-TMP", "AM-TMP", "AM-TMP", "O"] + }, + { + "tokens": ["Pemilu", "diadakan", "pada", "14", "Februari", "2024", "."], + "labels_ner": ["O", "O", "O", "B-DATE", "I-DATE", "I-DATE", "O"], + "labels_srl": ["ARG1", "V", "AM-TMP", "AM-TMP", "AM-TMP", "AM-TMP", "O"] + }, + { + "tokens": [ + "Tanggal", + "1", + "Januari", + "2023", + "merupakan", + "hari", + "libur", + "." + ], + "labels_ner": ["O", "B-DATE", "I-DATE", "I-DATE", "O", "O", "O", "O"], + "labels_srl": [ + "AM-TMP", + "AM-TMP", + "AM-TMP", + "AM-TMP", + "V", + "ARG1", + "ARG1", + "O" + ] + }, + { + "tokens": ["Barack", "Obama", "lahir", "pada", "4", "Agustus", "1961", "."], + "labels_ner": [ + "B-PER", + "I-PER", + "O", + "O", + "B-DATE", + "I-DATE", + "I-DATE", + "O" + ], + "labels_srl": [ + "ARG0", + "ARG0", + "V", + "AM-TMP", + "AM-TMP", + "AM-TMP", + "AM-TMP", + "O" + ] + }, + { + "tokens": ["Hari", "Bumi", "diperingati", "setiap", "22", "April", "."], + "labels_ner": ["O", "O", "O", "O", "B-DATE", "I-DATE", "O"], + "labels_srl": ["ARG1", "ARG1", "V", "AM-TMP", "AM-TMP", "AM-TMP", "O"] + }, + { + "tokens": [ + "Musim", + "kemarau", + "terjadi", + "antara", + "bulan", + "April", + "hingga", + "Oktober", + "." + ], + "labels_ner": ["O", "O", "O", "O", "O", "B-DATE", "O", "I-DATE", "O"], + "labels_srl": [ + "ARG1", + "ARG1", + "V", + "AM-TMP", + "AM-TMP", + "AM-TMP", + "AM-TMP", + "AM-TMP", + "O" + ] + }, + { + "tokens": [ + "Reformasi", + "1998", + "mengubah", + "sistem", + "politik", + "Indonesia", + "." + ], + "labels_ner": ["O", "B-DATE", "O", "O", "O", "B-LOC", "O"], + "labels_srl": ["ARG1", "AM-TMP", "V", "ARG2", "ARG2", "AM-LOC", "O"] + }, + { + "tokens": [ + "Konferensi", + "Asia-Afrika", + "digelar", + "pada", + "tahun", + "1955", + "di", + "Bandung", + "." + ], + "labels_ner": [ + "B-EVENT", + "I-EVENT", + "O", + "O", + "O", + "B-DATE", + "O", + "B-LOC", + "O" + ], + "labels_srl": [ + "ARG1", + "ARG1", + "V", + "AM-TMP", + "AM-TMP", + "AM-TMP", + "AM-LOC", + "AM-LOC", + "O" + ] + }, + { + "tokens": ["Perang", "Dunia", "kedua", "berakhir", "tahun", "1945", "."], + "labels_ner": ["B-MISC", "I-MISC", "I-MISC", "O", "O", "B-DATE", "O"], + "labels_srl": ["ARG1", "ARG1", "ARG1", "V", "AM-TMP", "AM-TMP", "O"] + }, + { + "tokens": [ + "Sumpah", + "Pemuda", + "diperingati", + "setiap", + "28", + "Oktober", + "." + ], + "labels_ner": ["B-EVENT", "I-EVENT", "O", "O", "B-DATE", "I-DATE", "O"], + "labels_srl": ["ARG1", "ARG1", "V", "AM-TMP", "AM-TMP", "AM-TMP", "O"] + }, + { + "tokens": [ + "Habibie", + "dilantik", + "menjadi", + "Presiden", + "pada", + "21", + "Mei", + "1998", + "." + ], + "labels_ner": [ + "B-PER", + "O", + "O", + "O", + "O", + "B-DATE", + "I-DATE", + "I-DATE", + "O" + ], + "labels_srl": [ + "ARG0", + "V", + "O", + "ARG1", + "AM-TMP", + "AM-TMP", + "AM-TMP", + "AM-TMP", + "O" + ] + }, + { + "tokens": [ + "Hari", + "Kemerdekaan", + "Indonesia", + "dirayakan", + "setiap", + "17", + "Agustus", + "." + ], + "labels_ner": ["O", "O", "B-LOC", "O", "O", "B-DATE", "I-DATE", "O"], + "labels_srl": [ + "ARG1", + "ARG1", + "ARG1", + "V", + "AM-TMP", + "AM-TMP", + "AM-TMP", + "O" + ] + }, + { + "tokens": [ + "Pada", + "tahun", + "1949", + ",", + "Belanda", + "mengakui", + "kemerdekaan", + "Indonesia", + "." + ], + "labels_ner": ["O", "O", "B-DATE", "O", "B-LOC", "O", "O", "B-LOC", "O"], + "labels_srl": [ + "AM-TMP", + "AM-TMP", + "AM-TMP", + "O", + "ARG0", + "V", + "ARG1", + "ARG1", + "O" + ] + }, + { + "tokens": [ + "Tsunami", + "Aceh", + "terjadi", + "pada", + "26", + "Desember", + "2004", + "." + ], + "labels_ner": ["O", "B-LOC", "O", "O", "B-DATE", "I-DATE", "I-DATE", "O"], + "labels_srl": [ + "ARG1", + "ARG1", + "V", + "AM-TMP", + "AM-TMP", + "AM-TMP", + "AM-TMP", + "O" + ] + }, + { + "tokens": ["Bung", "Karno", "meninggal", "pada", "21", "Juni", "1970", "."], + "labels_ner": [ + "B-PER", + "I-PER", + "O", + "O", + "B-DATE", + "I-DATE", + "I-DATE", + "O" + ], + "labels_srl": [ + "ARG0", + "ARG0", + "V", + "AM-TMP", + "AM-TMP", + "AM-TMP", + "AM-TMP", + "O" + ] + }, + { + "tokens": [ + "Jakarta", + "ditetapkan", + "sebagai", + "ibu", + "kota", + "negara", + "pada", + "tahun", + "1961", + "." + ], + "labels_ner": ["B-LOC", "O", "O", "O", "O", "O", "O", "O", "B-DATE", "O"], + "labels_srl": [ + "ARG1", + "V", + "ARG2", + "ARG2", + "ARG2", + "ARG2", + "AM-TMP", + "AM-TMP", + "AM-TMP", + "O" + ] + }, + { + "tokens": [ + "Pada", + "1955", + ",", + "Indonesia", + "menjadi", + "tuan", + "rumah", + "Konferensi", + "Asia-Afrika", + "." + ], + "labels_ner": [ + "O", + "B-DATE", + "O", + "B-LOC", + "O", + "O", + "O", + "B-EVENT", + "I-EVENT", + "O" + ], + "labels_srl": [ + "AM-TMP", + "AM-TMP", + "O", + "ARG0", + "V", + "ARG1", + "ARG1", + "ARG1", + "ARG1", + "O" + ] + }, + { + "tokens": [ + "Pemerintah", + "mengumumkan", + "kebijakan", + "PSBB", + "pada", + "April", + "2020", + "di", + "Jakarta", + "." + ], + "labels_ner": [ + "O", + "O", + "O", + "O", + "O", + "B-DATE", + "I-DATE", + "O", + "B-LOC", + "O" + ], + "labels_srl": [ + "ARG0", + "V", + "ARG1", + "ARG1", + "AM-TMP", + "AM-TMP", + "AM-TMP", + "AM-LOC", + "AM-LOC", + "O" + ] + }, + { + "tokens": [ + "Undang-Undang", + "Dasar", + "1945", + "disahkan", + "pada", + "tanggal", + "18", + "Agustus", + "1945", + "." + ], + "labels_ner": [ + "O", + "O", + "B-DATE", + "O", + "O", + "O", + "B-DATE", + "I-DATE", + "I-DATE", + "O" + ], + "labels_srl": [ + "ARG1", + "ARG1", + "AM-TMP", + "V", + "AM-TMP", + "AM-TMP", + "AM-TMP", + "AM-TMP", + "AM-TMP", + "O" + ] } ] diff --git a/dataset/dataset_ner_srl.tsv b/dataset/dataset_ner_srl.tsv new file mode 100644 index 0000000..70f227a --- /dev/null +++ b/dataset/dataset_ner_srl.tsv @@ -0,0 +1,2012 @@ +Keberagaman O ARG1 +potensi O ARG1 +sumber O ARG1 +daya O ARG1 +alam O ARG1 +Indonesia B-LOC ARGM-LOC +tidak O ARGM-NEG +lepas O V +dari O ARGM-SRC +proses O ARGM-SRC +geografis O ARGM-SRC +yang O ARGM-SRC +terjadi O ARGM-SRC +. O O + +Bagaimana O ARGM-MNR +proses O ARG1 +geografis O ARG1 +di O ARGM-LOC +Indonesia B-LOC ARGM-LOC +? O O + +Bagaimana O ARGM-MNR +pengaruh O ARG1 +proses O ARG1 +geografis O ARG1 +bagi O ARGM-BNF +keragaman O ARG2 +alam O ARG2 +dan O O +keragaman O ARG2 +sosial O ARG2 +masyarakat O ARG2 +Indonesia B-LOC ARGM-LOC +? O O + +Bagaimana O ARGM-MNR +mengoptimalkan O V +peranan O ARG1 +sumber O ARG1 +daya O ARG1 +manusia O ARG1 +dalam O ARGM-MNR +mengelola O V +sumber O ARG2 +daya O ARG2 +alam O ARG2 +Indonesia B-LOC ARGM-LOC +? O O + +Apakah O O +sumber O ARG0 +daya O ARG0 +manusia O ARG0 +di O ARGM-LOC +Indonesia B-LOC ARGM-LOC +sudah O ARGM-TMP +memenuhi O V +syarat O ARG1 +untuk O ARGM-PRP +mengolah O V +pariwisata O ARG2 +yang O O +dimilikinya O ARG2 +? O O + +Bagaimana O ARGM-MNR +lembaga O ARG0 +sosial O ARG0 +yang O O +akan O ARGM-MOD +mewadahi O V +untuk O O +mengolah O V +sumber O ARG1 +daya O ARG1 +alam O ARG1 +dan O O +sumber O ARG1 +daya O ARG1 +manusianya O ARG1 +? O O + +Kalian O ARG0 +juga O O +perlu O ARGM-MOD +memahami O V +, O O +bahwa O O +keragaman O ARG1 +sosial O ARG1 +dan O O +budaya O ARG1 +telah O ARGM-TMP +menarik O V +kedatangan O ARG2 +bangsa-bangsa O ARG2 +asing O ARG2 +sejak O ARGM-TMP +ribuan O ARGM-TMP +tahun O ARGM-TMP +yang O O +lalu O ARGM-TMP +. O O + +Perkembangan O ARG1 +Hindu-Buddha B-MISC ARG1 +di O ARGM-LOC +Indonesia B-LOC ARGM-LOC +tidak O ARGM-NEG +lepas O V +dari O ARGM-SRC +perkembangan O ARGM-SRC +perdagangan O ARGM-SRC +dan O O +pelayaran O ARGM-SRC +pada O ARGM-TMP +awal B-TIME ARGM-TMP +abad I-TIME ARGM-TMP +Masehi I-TIME ARGM-TMP +. O O + +Bangsa O ARG0 +Indonesia B-LOC ARG0 +patut O ARGM-MOD +bersyukur O V +karena O ARGM-CAU +proses O ARG1 +geografis O ARG1 +dan O O +keragaman O ARG1 +alam O ARG1 +yang O O +dimiliki O ARG1 +. O O + +Indonesia B-LOC ARG1 +merupakan O V +negara O ARG2 +terluas O ARG2 +di O ARGM-LOC +Asia B-LOC ARGM-LOC +Tenggara I-LOC ARGM-LOC +. O O + +dan O O +lautan O ARG1 +Indonesia B-LOC ARG1 +mencapai O V +5,8 B-QUANT ARG2 +juta I-QUANT ARG2 +km2 I-QUANT ARG2 +. O O + +Letak O ARG1 +Indonesia B-LOC ARG1 +sangat O ARGM-MNR +menguntungkan O V +bagi O ARGM-BNF +kehidupan O ARGM-BNF +masyarakat O ARGM-BNF +. O O + +Selain O O +memiliki O V +letak O ARG1 +geografis O ARG1 +yang O O +sangat O ARGM-MNR +menguntungkan O ARGM-MNR +, O O +Indonesia B-LOC ARG0 +juga O O +memiliki O V +letak O ARG1 +geologis O ARG1 +, O O +iklim O ARG1 +, O O +dan O O +cuaca O ARG1 +yang O O +sangat O ARGM-MNR +menguntungkan O ARGM-MNR + +Kalian O ARG0 +tentu O ARGM-MOD +sering O ARGM-FRQ +membincangkan O V +tentang O O +musim O ARG1 +dan O O +hubungannya O ARG1 +dengan O ARG1 +aktivitas O ARG1 +sehari-hari O ARG1 +. O O + +Masyarakat O ARG0 +memiliki O V +kebiasaan O ARG1 +di O ARGM-LOC +musim O ARG1 +hujan O ARG1 +dan O O +musim O ARG1 +kemarau O ARG1 +baik O O +berhubungan O V +dengan O ARG2 +mata O ARG2 +pencaharian O ARG2 +dan O O +kesenangan O ARG2 +( O O +hobi O ARG2 +) O O + +Kalian O ARG0 +juga O O +sering O ARGM-FRQ +memperhatikan O V +prakiraan O ARG1 +cuaca O ARG1 +untuk O O +merancang O V +kegiatan O ARG1 +harian O ARG1 +. O O + +Cuaca O ARG0 +dan O O +iklim O ARG0 +memengaruhi O V +aktivitas O ARG1 +masyarakat O ARG1 +Indonesia B-LOC ARG1 +. O O + +Cuaca O ARG1 +adalah O V +kondisi O ARG1 +rata-rata O ARG1 +udara O ARG1 +pada O ARGM-TMP +saat O ARGM-TMP +tertentu O ARGM-TMP +di O ARGM-LOC +suatu O ARGM-LOC +wilayah O ARGM-LOC +yang O ARGM-LOC +relatif O ARGM-LOC +sempit O ARGM-LOC +dan O O +dalam O ARGM-TMP +waktu O ARGM-TMP +yang O ARGM-TMP +singkat O ARGM-TMP +. O O + +Iklim O ARG1 +merupakan O V +kondisi O ARG1 +cuaca O ARG1 +rata-rata O ARG1 +tahunan O ARG1 +pada O ARGM-LOC +suatu O ARGM-LOC +wilayah O ARGM-LOC +yang O ARGM-LOC +luas O ARGM-LOC +. O O + +Indonesia B-LOC ARG0 +memiliki O V +iklim O ARG1 +tropis O ARG1 +yang O ARG1 +memiliki O V +dua O ARG1 +musim O ARG1 +yaitu O ARG1 +musim O ARG1 +hujan O ARG1 +dan O O +musim O ARG1 +kemarau O ARG1 +. O O + +Musim O ARG1 +hujan O ARG1 +terjadi O V +pada O ARGM-TMP +bulan O ARGM-TMP +Oktober B-DATE ARGM-TMP +- O O +Maret B-DATE ARGM-TMP +, O O +sedangkan O O +musim O ARG1 +kemarau O ARG1 +terjadi O V +pada O ARGM-TMP +bulan B-DATE ARGM-TMP +April O ARGM-TMP +- B-DATE O +September O ARGM-TMP + +Semakin O ARGM-MNR +ke O ARGM-LOC +timur B-LOC ARGM-LOC +curah O ARG0 +hujan O ARG0 +semakin O ARGM-MNR +sedikit O V +. O O + +Hal O ARGM-CAU +ini O ARGM-CAU +karena O ARGM-CAU +hujan O ARG0 +telah O ARGM-TMP +banyak O O +jatuh O V +dan O O +menguap O V +di O ARGM-LOC +bagian O ARGM-LOC +barat B-LOC ARGM-LOC +. O O + +Keadaan O ARG1 +iklim O ARG1 +dapat O ARGM-MOD +diamati O V +dengan O ARGM-MNR +memperhatikan O V +unsur-unsur O ARG1 +cuaca O ARG1 +dan O O +iklim O ARG1 +. O O + +Unsur-unsur O ARG1 +tersebut O ARG1 +antara O O +lain O O +, O O +penyinaran O ARG1 +matahari O ARG1 +, O O +suhu O ARG1 +udara O ARG1 +, O O +kelembaban O ARG1 +udara O ARG1 +, O O +angin O ARG1 +, O O +dan O O +hujan O ARG1 +. O O + +Tanaman O ARG0 +tropis O ARG0 +memiliki O V +banyak O ARG1 +varietas O ARG1 +yang O R-ARG1 +kaya O ARGM-MNR +akan O ARGM-MNR +hidrat O ARG1 +arang O ARG1 +terutama O ARGM-MNR +tanaman O ARG1 +bahan O ARG1 +makanan O ARG1 +pokok O ARG1 +. O O + +Penyinaran O ARG0 +matahari O ARG0 +Memengaruhi O V +fotosintesis O ARG1 +tanaman O ARG1 +, O O +dapat O O +meningkatkan O V +suhu O ARG1 +udara O ARG1 +. O O + +Suhu O ARG0 +Mengurangi O V +kadar O ARG1 +air O ARG1 +sehingga O O +cenderung O ARGM-MNR +menjadi O V +kering O ARG1 +. O O + +Kelembaban O ARG0 +Membatasi O V +hilangnya O ARG1 +air O ARG1 +. O O + +Angin O ARG0 +Membantu O V +proses O ARG1 +penyerbukan O ARG1 +secara O ARGM-MNR +alami O ARGM-MNR +, O O +mengurangi O V +kadar O ARG1 +air O ARG1 +. O O + +Hujan O ARG0 +Meningkatkan O V +kadar O ARG1 +air O ARG1 +, O O +mengikis O V +tanah O ARG1 +. O O + +Kalian O ARG0 +menemukan O V +berbagai O ARG1 +perbedaan O ARG1 +sosial O ARG1 +budaya O ARG1 +masyarakat O ARG1 +di O O +sekitar O ARGM-LOC +tempat O ARGM-LOC +tinggalmu O ARGM-LOC +. O O + +Apabila O O +kalian O ARG0 +tinggal O V +di O O +perkotaan B-LOC ARGM-LOC +, O O +perbedaan O ARG1 +sosial O ARG1 +budaya O ARG1 +akan O O +semakin O ARGM-MOD +banyak O O +. O O + +Perbedaan O ARG1 +sosial O ARG1 +budaya O ARG1 +meliputi O V +perbedaan O ARG2 +nilai-nilai O ARG2 +, O O +norma O ARG2 +, O O +dan O ARG2 +karakteristik O ARG2 +dari O O +suatu O ARG2 +kelompok O ARG2 +. O O + +Keragaman O ARG1 +sosial O ARG1 +budaya O ARG1 +di O ARGM-LOC +masyarakat O ARGM-LOC +dapat O ARGM-MOD +terjadi O V +saat O ARGM-TMP +berbagai O ARGM-TMP +jenis O ARGM-TMP +suku B-MISC ARG2 +dan O ARG2 +agama B-REL ARG2 +yang O ARG2 +ada O ARG2 +di O ARGM-LOC +suatu O ARGM-LOC +ruang O ARGM-LOC +bertemu O V +dan O V +berinteraksi O V +setiap O ARGM-TMP +harinya O ARGM-TMP + +Ruang O ARG1 +tersebut O ARG1 +adalah O V +ruang O ARG2 +yang O ARG2 +ada O ARG2 +pada O ARGM-LOC +masyarakat O ARGM-LOC +. O O + +Budaya O ARG1 +dapat O ARGM-MOD +berupa O V +cara O ARG2 +hidup O ARG2 +masyarakat O ARG2 +, O O +cara O ARG2 +berpakaian O ARG2 +, O O +adat O ARG2 +istiadat O ARG2 +, O O +jenis O ARG2 +mata O ARG2 +pecaharian O ARG2 +, O O +dan O ARG2 +tata O ARG2 +upacara O ARG2 +keagamaan O ARG2 + +Keragaman O ARG1 +budaya O ARG1 +juga O O +mencakup O V +barang-barang O ARG2 +yang O ARG2 +dihasilkan O ARG2 +oleh O ARGM-CAU +masyarakat O ARGM-CAU +, O O +seperti O ARG2 +senjata O ARG2 +, O O +alat O ARG2 +bajak O ARG2 +sawah O ARG2 +, O O +kitab O ARG2 +hukum O ARG2 +adat O ARG2 +, O O +dan O ARG2 +tempat O ARG2 +tinggal O O + +Budaya O ARG1 +dapat O ARGM-MOD +dianggap O V +sebagai O ARG2 +serangkaian O ARG2 +rancangan O ARG2 +untuk O O +bertahan O V +hidup O ARG1 +atau O O +alat O ARG2 +dari O ARGM-SRC +praktik O ARG3 +, O O +pengetahuan O ARG3 +, O O +dan O ARG3 +simbol O ARG3 +yang O ARG3 +diperoleh O ARG3 +melalui O ARGM-MNR +pembelajaran O ARGM-MNR +, O O +bukan O ARGM-NEG +oleh O ARGM-MNR +naluri O ARGM-MNR +, O O +yang O ARGM-CAU +memungkinkan O V +orang O ARG0 +untuk O O +hidup O V +dalam O ARGM-LOC +masyarakat O ARGM-LOC + +Masyarakat O ARG1 +terdiri O V +dari O ARG2 +orang-orang O ARG2 +yang O ARG2 +berinteraksi O ARG2 +dan O V +berbagi O V +budaya O ARG2 +yang O ARG2 +sama O O +. O O + +Perbedaan O ARG1 +budaya O ARG1 +dapat O ARGM-MOD +disebabkan O V +oleh O ARGM-CAU +berbagai O ARGM-CAU +hal O ARGM-CAU +seperti O ARGM-CAU +sejarah B-TIME ARG2 +, O O +keturunan O ARG2 +, O O +keyakinan B-REL ARG2 +, O O +dan O ARG2 +faktor B-LOC ARG2 +geografis I-LOC ARG2 +. O O + +Salah O ARG1 +satu O ARG1 +penyebab O ARG1 +perbedaan O ARG1 +budaya O ARG1 +adalah O V +faktor B-LOC ARG2 +geografis I-LOC ARG2 +. O O + +Faktor B-LOC ARG0 +geografis I-LOC ARG0 +yang O ARG0 +memengaruhi O V +keragaman O ARG1 +budaya O ARG1 +yang O ARG1 +akan O ARGM-MOD +dibahas O V +berikut O ARGM-TMP +ini O ARGM-TMP + +Dari O ARGM-SRC +teks O ARGM-SRC +tersebut O ARGM-SRC +dapat O ARGM-MOD +kita O ARG0 +pelajari O V +bahwa O ARGM-PRP +budaya O ARG1 +yang O ARG1 +ada O ARG1 +di O ARGM-LOC +masyarakat O ARGM-LOC +dapat O ARGM-MOD +dipengaruhi O V +oleh O ARGM-CAU +lingkungan O ARG2 +yang O ARG2 +ada O ARG2 +di O ARGM-LOC +sekitarnya O ARGM-LOC +, O O + +misalnya O O +suku B-ETH ARG1 +Lawu I-ETH ARG1 +dan O ARG1 +suku B-ETH ARG1 +Bugis I-ETH ARG1 +yang O ARG1 +bermata O V +pencaharian O ARG1 +sebagai O ARG2 +nelayan O ARG2 +dengan O ARGM-MNR +kapal O ARG2 +pinisinya B-MISC ARG2 +, O O + +sehingga O ARGM-CAU +menjadi O V +sebuah O ARG2 +simbol O ARG2 +bahwa O ARG2 +Indonesia B-LOC ARG1 +merupakan O V +negara O ARG2 +maritim O ARG2 +yang O ARG2 +kuat O ARG2 +dan O ARG2 +disegani O ARG2 +di O ARGM-LOC +lautan B-LOC ARGM-LOC +. O O + +Keragaman O ARG1 +budaya O ARG1 +dipengaruhi O V +oleh O ARGM-CAU +lingkungan B-LOC ARG2 +fisik I-LOC ARG2 +. O O + +Manusia O ARG0 +sebagai O O +individu O O +adalah O V +kesatuan O ARG1 +jiwa O ARG1 +, O O +raga O ARG1 +dan O O +kegiatan O ARG1 +atau O O +perilaku O ARG1 +pribadi O ARG1 +itu O ARG1 +sendiri O ARG1 +. O O + +Sebagai O O +individu O O +, O O +dalam O ARGM-LOC +pribadi O ARGM-LOC +manusia O ARGM-LOC +terdapat O V +tiga O ARG1 +unsur O ARG1 +, O O +yaitu O ARG1 +nafsu O ARG2 +, O O +semangat O ARG2 +, O O +dan O ARG2 +intelegensi O ARG2 +. O O + +Kombinasi O ARG0 +dari O ARG0 +unsur O ARG0 +tersebut O ARG0 +menghasilkan O V +tingkah O ARG1 +laku O ARG1 +seseorang O ARG1 +yang O ARG1 +mencerminkan O V +karakter O ARG2 +atau O O +budayaanya O ARG2 +. O O + +Kesatuan O ARG0 +dari O ARG0 +kepribadian-kepribadian O ARG0 +seseorang O ARG0 +pada O ARGM-LOC +suatu O ARGM-LOC +daerah B-LOC ARGM-LOC +yang O ARGM-LOC +mempunyai O ARG1 +pola O ARG1 +yang O ARG1 +sama O ARG1 +dapat O ARGM-MOD +membentuk O V +budaya O ARG2 +daerah B-LOC ARG2 +tersebut O ARG2 +yang O ARG2 +membedakan O V +dengan O O +tempat B-LOC O +lain O O + +Indonesia B-LOC ARG0 +memiliki O V +kebudayaan O ARG1 +yang O ARG1 +beragam O ARG1 +. O O + +Indonesia B-LOC ARG0 +memiliki O V +kekayaan O ARG1 +yang O ARG1 +begitu O ARG1 +besar O ARG1 +. O O + +Bukan O ARGM-NEG +hanya O O +pemandangan O ARG1 +alam O ARG1 +budaya O ARG1 +, O O +jauh O ARGM-LOC +di O ARGM-LOC +kedalaman O ARGM-LOC +tanahnya B-LOC ARGM-LOC +begitu O ARGM-MNR +banyak O O +kandungan O ARG1 +mineral O ARG1 +berharga O ARG1 +. O O + +Selama B-TIME ARGM-TMP +puluhan I-TIME ARGM-TMP +tahun I-TIME ARGM-TMP +, O O +Freeport B-ORG ARG0 +mengelola O V +tambang O ARG1 +mineral O ARG1 +di O ARGM-LOC +tanah O ARGM-LOC +Papua B-LOC ARGM-LOC +, O O +Indonesia B-LOC ARGM-LOC +. O O + +Berdasarkan O ARGM-PRP +laporan O ARGM-PRP +keuangan O ARGM-PRP +Freeport B-ORG ARGM-PRP +McMorRan I-ORG ARGM-PRP +Inc I-ORG ARGM-PRP +periode O ARGM-TMP +2017 B-DATE ARGM-TMP +, O O +Freeport B-ORG ARG0 +Indonesia B-LOC ARG0 +di O ARGM-LOC +Papua B-LOC ARGM-LOC +tercatat O V +memiliki O V +6 O ARG1 +tambang O ARG1 +, O O +yakni O ARG1 +Grasberg B-LOC ARG2 +Block I-LOC ARG2 +Cave I-LOC ARG2 +, O O +DMLZ B-LOC ARG2 +, O O +tambang O ARG2 +Kucing B-LOC ARG2 +Liar I-LOC ARG2 +, O O +DOZ B-LOC ARG2 +, O O +Big B-LOC ARG2 +Gossan I-LOC ARG2 +, O O +dan O ARG2 +Grasberg B-LOC ARG2 +Open I-LOC ARG2 +Pit I-LOC ARG2 +. O O + +Tambang O ARG1 +Freeport B-ORG ARG0 +memiliki O V +beberapa O ARG2 +kandungan O ARG2 +cadangan O ARG2 +mineral O ARG2 +, O O +yaitu O ARG2 +tembaga B-MIN ARG3 +, O O +emas B-MIN ARG3 +, O O +dan B-MIN ARG3 +perak O O + +Sumber O ARG1 +daya O ARG1 +alam O ARG1 +yang O ARG1 +terdapat O V +pada O ARGM-LOC +pertambangan O ARGM-LOC +Freeport B-ORG ARGM-LOC +di O ARGM-LOC +atas O ARGM-LOC +merupakan O V +salah O ARG1 +satu O ARG1 +contoh O ARG1 +dari O ARG1 +berbagai O ARG1 +sumber O ARG1 +daya O ARG1 +yang O ARG1 +ada O ARG1 +di O ARGM-LOC +Indonesia B-LOC ARGM-LOC +yang O ARG1 +memiliki O V +beberapa O ARG2 +kandungan O ARG2 +cadangan O ARG2 +mineral O O +, O ARG2 +seperti B-MIN ARG3 +tembaga O O +, B-MIN ARG3 +emas O O +, O O +dan B-MIN ARG3 +perak O O + +Kemudian O O +apa O ARG1 +sih O ARG1 +sumber O ARG1 +daya O ARG1 +alam O ARG1 +itu O ARG1 +? O O + +Apakah O ARGM-PRP +ada O V +manfaatnya O ARG1 +untuk O ARGM-BNF +kita O ARGM-BNF +? O O + +Yuk O O +silahkan O O +simak O V +penjelasan O ARG1 +di O ARGM-LOC +bawah O ARGM-LOC +ini O ARGM-LOC +. O O + +Sumber O ARG0 +daya O ARG0 +alam O ARG0 +merupakan O V +segala O ARG1 +sesuatu O ARG1 +yang O ARG1 +ada O ARG1 +di O ARGM-LOC +permukaan O ARGM-LOC +bumi B-LOC ARGM-LOC +dan O O +dapat O ARGM-MOD +dimanfaatkan O V +untuk O O +memenuhi O V +kebutuhan O ARG1 +manusia O ARG1 +. O O + +Potensi O ARG0 +sumber O ARG0 +daya O ARG0 +ini O ARG0 +mencakup O V +hal O ARG1 +yang O ARG1 +ada O ARG1 +di O ARGM-LOC +udara B-LOC ARG2 +, O O +daratan B-LOC ARG2 +, O O +dan O ARG2 +perairan B-LOC ARG2 +. O O + +Berdasarkan O ARGM-PRP +kelestariannya O ARGM-PRP +, O O +sumber O ARG1 +daya O ARG1 +alam O ARG1 +dapat O ARGM-MOD +dibedakan O V +menjadi O V +dua O ARG2 +yaitu O ARG2 +sumber O ARG2 +daya O ARG2 +alam O ARG2 +yang O ARG2 +dapat O ARG2 +diperbarui O ARG2 +( O O +renewable B-TERM ARG2 +resources I-TERM ARG2 +) O O +dan O ARG2 +tidak O ARG2 +dapat O ARG2 +diperbarui O O +( O O +non B-TERM ARG2 +renewable I-TERM ARG2 +resource I-TERM ARG2 +) O O + +Contoh O ARG1 +sumber O ARG1 +daya O ARG1 +alam O ARG1 +yang O ARG1 +dapat O ARG1 +diperbarui O ARG1 +yaitu O O +seperti O O +air B-RES ARG2 +, O O +tanah B-RES ARG2 +, O O +dan O ARG2 +hutan B-RES ARG2 +. O O + +Sedangkan O O +sumber O ARG1 +daya O ARG1 +alam O ARG1 +yang O ARG1 +tidak O ARG1 +dapat O ARG1 +diperbarui O ARG1 +seperti O O +minyak B-RES ARG2 +bumi I-RES ARG2 +dan O ARG2 +batu B-RES ARG2 +bara I-RES ARG2 +. O O + +Berikut O O +ini O O +merupakan O V +potensi O ARG1 +sumber O ARG1 +daya O ARG1 +alam O ARG1 +di O ARGM-LOC +Indonesia B-LOC ARGM-LOC +yang O ARG1 +dirinci O V +menjadi O V +tiga O ARG2 +yaitu O ARG2 +sumber O ARG2 +daya O ARG2 +alam O ARG2 +hutan B-RES ARG2 +, O O +sumber O ARG2 +daya O ARG2 +alam O ARG2 +tambang B-RES ARG2 +, O O +dan O ARG2 +sumber O ARG2 +daya O ARG2 +alam B-RES ARG2 +kemaritiman O O + +Indonesia B-LOC ARG0 +termasuk O V +negara O ARG1 +yang O O +memiliki O ARG1 +kekayaan O ARG1 +alam O ARG1 +yang O O +berlimpah O ARG1 +dibandingkan O ARGM-COM +negara-negara O ARGM-COM +yang O O +lain O ARGM-COM + +Potensi O ARG1 +sumber O ARG1 +daya O ARG1 +alam O ARG1 +Indonesia B-LOC ARG1 +sangat O ARGM-MNR +beraneka O V +ragam O ARG1 +. O O + +Bangsa O ARG0 +Indonesia B-LOC ARG0 +memiliki O V +modal O ARG1 +penting O ARG1 +dalam O ARGM-LOC +pembangunan O ARGM-LOC +. O O + +Jumlah O ARG1 +penduduk O ARG1 +Indonesia B-LOC ARG1 +yang O ARG1 +lebih O ARG1 +dari O ARG1 +270 B-QUANT ARG1 +juta I-QUANT ARG1 +merupakan O V +potensi O ARG1 +penting O ARG1 +dalam O ARGM-LOC +pembangunan O ARGM-LOC +. O O + +Pada O ARGM-TMP +tahun O ARGM-TMP +2016 B-DATE ARGM-TMP +Badan B-ORG ARG0 +Pusat I-ORG ARG0 +Statistik I-ORG ARG0 +mencatat O V +bahwa O O +di O ARG1 +Indonesia B-LOC ARG1 +terdapat O ARG1 +angkatan O ARG1 +kerja O ARG1 +127,67 B-QUANT ARG1 +juta I-QUANT ARG1 +jiwa O ARG1 +. O O + +Di O ARGM-LOC +antara O ARGM-LOC +negara O ARGM-LOC +ASEAN B-LOC ARGM-LOC +, O O +kualitas O ARG1 +SDM O ARG1 +dan O ARG1 +ketenagakerjaan O ARG1 +Indonesia B-LOC ARG1 +masih O O +berada O V +di O ARGM-LOC +peringkat O ARGM-LOC +bawah O ARGM-LOC +. O O + +Kualitas O ARG0 +SDM O ARG0 +dan O ARG0 +ketenagakerjaan O ARG0 +Indonesia B-LOC ARG0 +menempati O V +urutan O ARG1 +kelima O ARG1 +. O O + +Peringkat O ARG1 +ini O ARG1 +masih O O +kalah O V +jika O O +dibandingkan O ARGM-COM +Singapura B-LOC ARGM-COM +, O O +Brunei B-LOC ARGM-COM +Darussalam I-LOC ARGM-COM +, O O +Malaysia B-LOC ARGM-COM +, O O +dan O O +Thailand B-LOC ARGM-COM +. O O + +Kualitas O ARG0 +sumber O ARG0 +daya O ARG0 +manusia O ARG0 +di O ARG0 +Indonesia B-LOC ARG0 +memengaruhi O V +terhadap O O +kemajuan O ARG1 +sebuah O ARG1 +bangsa O ARG1 +. O O + +Peristiwa O ARG1 +itu O ARG1 +dilatarbelakangi O V +oleh O O +peristiwa O ARG0 +yang O ARG0 +jauh O ARG0 +dari O O +Indonesia B-LOC ARG0 +, O O +misalnya O O +peristiwa O ARG0 +jatuhnya O ARG0 +Konstantinopel B-LOC ARG0 +di O ARGM-LOC +kawasan O ARGM-LOC +Laut B-LOC ARGM-LOC +Tengah I-LOC ARGM-LOC +pada O ARGM-TMP +tahun O ARGM-TMP +1453 B-DATE ARGM-TMP +. O O + +Kehidupan O ARG1 +global O ARG1 +semakin O O +berkembang O V +dengan O ARGM-MNR +maraknya O ARGM-MNR +penjelajahan O ARGM-MNR +samudera O ARGM-MNR +orang-orang O ARGM-MNR +Eropa B-LOC ARGM-MNR +ke O ARGM-MNR +dunia O ARGM-MNR +Timur B-LOC ARGM-MNR +. O O + +Begitu O ARG1 +juga O ARG0 +peristiwa O ARG0 +kedatangan O ARG0 +bangsa O ARG0 +Eropa B-LOC O +ke O O +Indonesia B-LOC O +, O V +telah O ARG1 +ikut O ARG1 +meningkatkan O O + +Pada O ARGM-TMP +tahun O ARGM-TMP +1488 B-DATE ARGM-TMP +karena O O +serangan O ARGM-CAU +ombak O ARGM-CAU +besar O ARGM-CAU +terpaksa O ARGM-CAU +Bartholomeus B-PER ARG0 +Diaz I-PER ARG0 +mendarat O V +di O ARGM-LOC +suatu O ARGM-LOC +ujung O ARGM-LOC +selatan O ARGM-LOC +Benua B-LOC ARGM-LOC +Afrika I-LOC ARGM-LOC +. O O + +Pada O ARGM-TMP +Juli B-DATE ARGM-TMP +1497 I-DATE ARGM-TMP +Vasco B-PER ARG0 +da I-PER ARG0 +Gama I-PER ARG0 +berangkat O V +dari O ARGM-LOC +pelabuhan O ARGM-LOC +Lisabon B-LOC ARGM-LOC +untuk O O +memulai O O +penjelajahan O O +samudra O O +. O O + +Berdasarkan O O +pengalaman O O +Bartholomeus B-PER ARGM-CAU +Diaz I-PER ARGM-CAU +tersebut O O +, O O +Vasco B-PER ARG0 +da I-PER ARG0 +Gama I-PER ARG0 +juga O O +berlayar O V +mengambil O V +rute O ARG1 +yang O ARG1 +pernah O ARG1 +dilayari O ARG1 +Bartholomeus B-PER ARG1 +Diaz I-PER ARG1 +. O O + +Rombongan O ARG0 +Vasco B-PER ARG0 +da I-PER ARG0 +Gama I-PER ARG0 +juga O O +singgah O V +di O ARGM-LOC +Tanjung B-LOC ARGM-LOC +Harapan I-LOC ARGM-LOC +. O O + +Atas O ARGM-CAU +petunjuk O ARGM-CAU +dari O ARGM-CAU +pelaut O ARGM-CAU +bangsa O ARGM-CAU +Moor B-MISC ARGM-CAU +yang O ARGM-CAU +telah O ARGM-CAU +disewanya O ARGM-CAU +, O O +rombongan O ARG0 +Vasco B-PER ARG0 +da I-PER ARG0 +Gama I-PER ARG0 +melanjutkan O V +penjelajahan O ARG1 +, O O +berlayar O V +menelusuri O V +pantai O ARGM-LOC +timur O ARGM-LOC +Afrika B-LOC ARGM-LOC +kemudian O O +berbelok O O +ke O O +kanan O O +untuk O O +mengarungi O V +Lautan B-LOC ARGM-LOC +Hindia I-LOC ARGM-LOC +( O O +Samudra B-LOC ARGM-LOC +Indonesia I-LOC ARGM-LOC +) O O +. O O + +Pada O ARGM-TMP +tahun O ARGM-TMP +1498 B-DATE ARGM-TMP +rombongan O ARG0 +Vasco B-PER ARG0 +da I-PER ARG0 +Gama I-PER ARG0 +mendarat O V +sampai O V +di O ARGM-LOC +Kalikut B-LOC ARG1 +dan O O +juga O O +Goa B-LOC ARG1 +di O ARGM-LOC +pantai B-LOC ARGM-LOC +barat I-LOC ARGM-LOC +India I-LOC ARGM-LOC +. O O + +Pada O ARGM-TMP +tahun O ARGM-TMP +1511 B-DATE ARGM-TMP +armada B-ORG ARG0 +Portugis I-ORG ARG0 +berhasil O V +menguasai O V +Malaka B-LOC ARG1 +. O O + +Proklamasi O ARG1 +kemerdekaan O ARG1 +Indonesia B-LOC ARG1 +terjadi O V +pada O ARGM-TMP +17 B-DATE ARGM-TMP +Agustus I-DATE ARGM-TMP +1945 I-DATE ARGM-TMP +. O O + +Barack B-PER ARG0 +Obama I-PER ARG0 +lahir O V +pada O ARGM-TMP +4 B-DATE ARGM-TMP +Agustus I-DATE ARGM-TMP +1961 I-DATE ARGM-TMP +di O ARGM-LOC +Hawaii B-LOC ARGM-LOC +. O O + +Reformasi O ARG1 +Indonesia B-LOC ARG1 +dimulai O V +tahun O ARGM-TMP +1998 B-DATE ARGM-TMP +setelah O ARGM-TMP +Soeharto B-PER ARG0 +mundur O V +. O O + +Perang B-MISC ARG1 +Dunia I-MISC ARG1 +II I-MISC ARG1 +berakhir O V +pada O ARGM-TMP +2 B-DATE ARGM-TMP +September I-DATE ARGM-TMP +1945 I-DATE ARGM-TMP +. O O + +Indonesia B-LOC ARG0 +menjadi O V +anggota O ARG1 +PBB B-ORG ARG1 +sejak O ARGM-TMP +28 B-DATE ARGM-TMP +September I-DATE ARGM-TMP +1950 I-DATE ARGM-TMP +. O O + +Banjir O ARG1 +bandang O ARG1 +terjadi O V +pada O ARGM-TMP +5 B-DATE ARGM-TMP +Januari I-DATE ARGM-TMP +2021 I-DATE ARGM-TMP +di O ARGM-LOC +Bandung B-LOC ARGM-LOC +. O O + +Hari O ARG1 +Pahlawan O ARG1 +diperingati O V +setiap O ARGM-TMP +10 B-DATE ARGM-TMP +November I-DATE ARGM-TMP +. O O + +Pada O ARGM-TMP +tahun O ARGM-TMP +1511 B-DATE ARGM-TMP +Portugis B-ORG ARG0 +menguasai O V +Malaka B-LOC ARG1 +. O O + +Konferensi B-EVENT ARG1 +Asia-Afrika I-EVENT ARG1 +diselenggarakan O V +tahun O ARGM-TMP +1955 B-DATE ARGM-TMP +di O ARGM-LOC +Bandung B-LOC ARGM-LOC +. O O + +Musim O ARG1 +kemarau O ARG1 +diperkirakan O V +mulai O ARGM-TMP +April B-DATE ARGM-TMP +2025 I-DATE ARGM-TMP +. O O + +Rapat O ARG1 +dimulai O V +pukul O ARGM-TMP +9 B-TIME ARGM-TMP +pagi I-TIME ARGM-TMP +. O O + +Kereta O ARG1 +akan O O +tiba O V +sekitar O ARGM-TMP +jam O ARGM-TMP +3 B-TIME ARGM-TMP +sore I-TIME ARGM-TMP +. O O + +Pertandingan O ARG1 +akan O O +dimulai O V +pada O ARGM-TMP +pukul O ARGM-TMP +19.3 B-TIME ARGM-TMP +. O O + +Matahari O ARG1 +terbit O V +sekitar O ARGM-TMP +5.45 B-TIME ARGM-TMP +pagi I-TIME ARGM-TMP +di O ARGM-LOC +Jakarta B-LOC ARGM-LOC +. O O + +Makan O ARG1 +siang O ARG1 +biasanya O O +dilakukan O V +sekitar O ARGM-TMP +jam O ARGM-TMP +12 B-TIME ARGM-TMP +siang I-TIME ARGM-TMP +. O O + +Penerbangan O ARG1 +dijadwalkan O V +lepas O V +landas O V +pukul O ARGM-TMP +23.15 B-TIME ARGM-TMP +. O O + +Film O ARG1 +tayang O V +mulai O ARGM-TMP +jam O ARGM-TMP +8 B-TIME ARGM-TMP +malam I-TIME ARGM-TMP +nanti I-TIME ARGM-TMP +. O O + +Pesawat O ARG1 +mendarat O V +tepat O O +pada O ARGM-TMP +0.3 B-TIME ARGM-TMP +dinihari I-TIME ARGM-TMP +. O O + +Siaran O ARG1 +langsung O ARG1 +dimulai O V +pukul O ARGM-TMP +18 B-TIME ARGM-TMP +. O O + +Jam O ARG1 +kerja O ARG1 +dimulai O V +pukul O ARGM-TMP +8 B-TIME ARGM-TMP +dan O O +berakhir O V +pukul O ARGM-TMP +17 B-TIME ARGM-TMP +. O O + +Alarm O ARG1 +berbunyi O V +pada O ARGM-TMP +pukul O ARGM-TMP +6 B-TIME ARGM-TMP +pagi I-TIME ARGM-TMP +. O O + +Saya O ARG0 +bangun O V +sekitar O ARGM-TMP +jam O ARGM-TMP +5 B-TIME ARGM-TMP +pagi I-TIME ARGM-TMP +setiap O O +hari O O +. O O + +Konser O ARG1 +dimulai O V +sekitar O ARGM-TMP +20 B-TIME ARGM-TMP +malam I-TIME ARGM-TMP +di O ARGM-LOC +stadion B-LOC ARGM-LOC +. O O + +Wawancara O ARG1 +dijadwalkan O V +pada O ARGM-TMP +jam O ARGM-TMP +11 B-TIME ARGM-TMP +pagi I-TIME ARGM-TMP +. O O + +Kami O ARG0 +tiba O V +di O ARGM-LOC +bandara B-LOC ARGM-LOC +sekitar O ARGM-TMP +jam O ARGM-TMP +2 B-TIME ARGM-TMP +dinihari I-TIME ARGM-TMP +. O O + +Dia O ARG0 +mengajar O V +kelas O ARG1 +pada O ARGM-TMP +pukul O ARGM-TMP +13 B-TIME ARGM-TMP +. O O + +Peserta O ARG1 +diminta O V +hadir O V +sebelum O ARGM-TMP +jam O ARGM-TMP +7 B-TIME ARGM-TMP +pagi I-TIME ARGM-TMP +. O O + +Televisi O ARG0 +menayangkan O V +berita O ARG1 +malam O ARG1 +pada O ARGM-TMP +22 B-TIME ARGM-TMP +. O O + +Kami O ARG0 +akan O O +bertemu O V +jam O ARGM-TMP +10 B-TIME ARGM-TMP +malam I-TIME ARGM-TMP +di O ARGM-LOC +kafe B-LOC ARGM-LOC +. O O + +Toko O ARG1 +buka O V +hingga O ARGM-TMP +pukul O ARGM-TMP +21 B-TIME ARGM-TMP +. O O + +Dia O ARG0 +biasanya O O +berolahraga O V +pada O ARGM-TMP +pagi B-TIME ARGM-TMP +hari I-TIME ARGM-TMP +. O O + +Kami O ARG0 +bertemu O V +lagi O O +pada O ARGM-TMP +malam B-TIME ARGM-TMP +hari I-TIME ARGM-TMP +itu O ARGM-TMP +. O O + +Upacara O ARG1 +dilaksanakan O V +pada O ARGM-TMP +sore B-TIME ARGM-TMP +hari I-TIME ARGM-TMP +di O ARGM-LOC +lapangan B-LOC ARGM-LOC +. O O + +Ia O ARG0 +pulang O V +setiap O O +malam B-TIME ARGM-TMP +sekitar O ARGM-TMP +jam O ARGM-TMP +9 B-TIME ARGM-TMP +. O O + +Kami O ARG0 +berangkat O V +di O ARGM-TMP +pagi B-TIME ARGM-TMP +hari I-TIME ARGM-TMP +menggunakan O ARGM-MNR +mobil O ARGM-MNR +. O O + +Acara O ARG1 +berlangsung O V +hingga O ARGM-TMP +malam B-TIME ARGM-TMP +hari I-TIME ARGM-TMP +. O O + +Kami O ARG0 +tiba O V +di O ARGM-LOC +Bandara B-LOC ARGM-LOC +pada O ARGM-TMP +dinihari B-TIME ARGM-TMP +. O O + +Pintu O ARG1 +gerbang O ARG1 +dibuka O V +setiap O O +pagi B-TIME ARGM-TMP +. O O + +Ia O ARG0 +selalu O O +belajar O V +di O ARGM-TMP +malam B-TIME ARGM-TMP +. O O + +Waktu O ARG1 +bermain O ARG1 +dimulai O V +sore B-TIME ARGM-TMP +hari I-TIME ARGM-TMP +. O O + +Pelajaran O ARG1 +kedua O ARG1 +dimulai O V +sekitar O ARGM-TMP +jam O ARGM-TMP +tujuh B-TIME ARGM-TMP +lebih I-TIME ARGM-TMP +sepuluh I-TIME ARGM-TMP +menit I-TIME ARGM-TMP +. O O + +Bus O ARG0 +berangkat O V +kurang O ARGM-TMP +lebih O ARGM-TMP +jam O ARGM-TMP +delapan B-TIME ARGM-TMP +malam I-TIME ARGM-TMP +. O O + +Pertemuan O ARG1 +terakhir O ARG1 +dilaksanakan O V +sebelum O ARGM-TMP +matahari B-TIME ARGM-TMP +terbenam I-TIME ARGM-TMP +. O O + +Kereta O ARG0 +berangkat O V +sekitar O ARGM-TMP +tengah B-TIME ARGM-TMP +malam I-TIME ARGM-TMP +dari O ARGM-LOC +stasiun O ARGM-LOC +Gambir B-LOC ARGM-LOC +. O O + +Jadwal O ARG1 +sholat O ARG1 +dimulai O V +pukul O ARGM-TMP +empat B-TIME ARGM-TMP +lebih I-TIME ARGM-TMP +lima I-TIME ARGM-TMP +menit I-TIME ARGM-TMP +. O O + +Pemadaman O ARG1 +listrik O ARG1 +akan O O +dimulai O V +menjelang B-TIME ARGM-TMP +malam I-TIME ARGM-TMP +. O O + +Layanan O ARG1 +pelanggan O ARG1 +dibuka O V +setiap O O +hari O O +kerja O O +jam O ARGM-TMP +sembilan B-TIME ARGM-TMP +. O O + +Ia O ARG0 +terjaga O V +di O ARGM-TMP +tengah B-TIME ARGM-TMP +malam I-TIME ARGM-TMP +karena O ARGM-CAU +petir O ARGM-CAU + +Kelas O ARG1 +selesai O V +sekitar O ARGM-TMP +jam O ARGM-TMP +dua B-TIME ARGM-TMP +kurang I-TIME ARGM-TMP +seperempat I-TIME ARGM-TMP +. O O + +Waktu O ARG1 +sarapan O ARG1 +dimulai O V +pukul O ARGM-TMP +6.3 B-TIME ARGM-TMP +hingga O ARGM-TMP +7.3 B-TIME ARGM-TMP +. O O + +Proklamasi O ARG1 +kemerdekaan O ARG1 +terjadi O V +pada O ARGM-TMP +17 B-DATE ARGM-TMP +Agustus I-DATE ARGM-TMP +1945 I-DATE ARGM-TMP +. O O + +Indonesia B-LOC ARG0 +merdeka O V +pada O ARGM-TMP +tahun O ARGM-TMP +1945 B-DATE ARGM-TMP +. O O + +Pemilu O ARG1 +diadakan O V +pada O ARGM-TMP +14 B-DATE ARGM-TMP +Februari I-DATE ARGM-TMP +2024 I-DATE ARGM-TMP +. O O + +Tanggal O ARGM-TMP +1 B-DATE ARGM-TMP +Januari I-DATE ARGM-TMP +2023 I-DATE ARGM-TMP +merupakan O V +hari O ARG1 +libur O ARG1 +. O O + +Barack B-PER ARG0 +Obama I-PER ARG0 +lahir O V +pada O ARGM-TMP +4 B-DATE ARGM-TMP +Agustus I-DATE ARGM-TMP +1961 I-DATE ARGM-TMP +. O O + +Hari O ARG1 +Bumi O ARG1 +diperingati O V +setiap O ARGM-TMP +22 B-DATE ARGM-TMP +April I-DATE ARGM-TMP +. O O + +Musim O ARG1 +kemarau O ARG1 +terjadi O V +antara O ARGM-TMP +bulan O ARGM-TMP +April B-DATE ARGM-TMP +hingga O ARGM-TMP +Oktober I-DATE ARGM-TMP +. O O + +Reformasi O ARG1 +1998 B-DATE ARGM-TMP +mengubah O V +sistem O ARG2 +politik O ARG2 +Indonesia B-LOC ARGM-LOC +. O O + +Konferensi B-EVENT ARG1 +Asia-Afrika I-EVENT ARG1 +digelar O V +pada O ARGM-TMP +tahun O ARGM-TMP +1955 B-DATE ARGM-TMP +di O ARGM-LOC +Bandung B-LOC ARGM-LOC +. O O + +Perang B-MISC ARG1 +Dunia I-MISC ARG1 +kedua I-MISC ARG1 +berakhir O V +tahun O ARGM-TMP +1945 B-DATE ARGM-TMP +. O O + +Sumpah B-EVENT ARG1 +Pemuda I-EVENT ARG1 +diperingati O V +setiap O ARGM-TMP +28 B-DATE ARGM-TMP +Oktober I-DATE ARGM-TMP +. O O + +Habibie B-PER ARG0 +dilantik O V +menjadi O O +Presiden O ARG1 +pada O ARGM-TMP +21 B-DATE ARGM-TMP +Mei I-DATE ARGM-TMP +1998 I-DATE ARGM-TMP +. O O + +Hari O ARG1 +Kemerdekaan O ARG1 +Indonesia B-LOC ARG1 +dirayakan O V +setiap O ARGM-TMP +17 B-DATE ARGM-TMP +Agustus I-DATE ARGM-TMP +. O O + +Pada O ARGM-TMP +tahun O ARGM-TMP +1949 B-DATE ARGM-TMP +, O O +Belanda B-LOC ARG0 +mengakui O V +kemerdekaan O ARG1 +Indonesia B-LOC ARG1 +. O O + +Tsunami O ARG1 +Aceh B-LOC ARG1 +terjadi O V +pada O ARGM-TMP +26 B-DATE ARGM-TMP +Desember I-DATE ARGM-TMP +2004 I-DATE ARGM-TMP +. O O + +Bung B-PER ARG0 +Karno I-PER ARG0 +meninggal O V +pada O ARGM-TMP +21 B-DATE ARGM-TMP +Juni I-DATE ARGM-TMP +1970 I-DATE ARGM-TMP +. O O + +Jakarta B-LOC ARG1 +ditetapkan O V +sebagai O ARG2 +ibu O ARG2 +kota O ARG2 +negara O ARG2 +pada O ARGM-TMP +tahun O ARGM-TMP +1961 B-DATE ARGM-TMP +. O O + +Pada O ARGM-TMP +1955 B-DATE ARGM-TMP +, O O +Indonesia B-LOC ARG0 +menjadi O V +tuan O ARG1 +rumah O ARG1 +Konferensi B-EVENT ARG1 +Asia-Afrika I-EVENT ARG1 +. O O + +Pemerintah O ARG0 +mengumumkan O V +kebijakan O ARG1 +PSBB O ARG1 +pada O ARGM-TMP +April B-DATE ARGM-TMP +2020 I-DATE ARGM-TMP +di O ARGM-LOC +Jakarta B-LOC ARGM-LOC +. O O + +Undang-Undang O ARG1 +Dasar O ARG1 +1945 B-DATE ARGM-TMP +disahkan O V +pada O ARGM-TMP +tanggal O ARGM-TMP +18 B-DATE ARGM-TMP +Agustus I-DATE ARGM-TMP +1945 I-DATE ARGM-TMP +. O O + +ibu B-PER ARG0 +memasak O V +nasi O ARG1 +di O O +dapur B-LOC ARGM-LOC +. O O diff --git a/dataset_converter.py b/dataset_converter.py new file mode 100644 index 0000000..2ecd688 --- /dev/null +++ b/dataset_converter.py @@ -0,0 +1,13 @@ +import json + +with open("dataset/dataset_ner_srl.json", encoding="utf-8") as f: + data = json.load(f) + + +with open("dataset/dataset_ner_srl.tsv", "w", encoding="utf-8") as f: + for entry in data: + for tok, ner, srl in zip( + entry["tokens"], entry["labels_ner"], entry["labels_srl"] + ): + f.write(f"{tok}\t{ner}\t{srl}\n") + f.write("\n") # Separate sentences diff --git a/train_multitask_lstm.py b/train_multitask_lstm.py new file mode 100644 index 0000000..43c5d42 --- /dev/null +++ b/train_multitask_lstm.py @@ -0,0 +1,142 @@ +""" +Train multi‑task LSTM / BiLSTM untuk NER + SRL +——————————————— +• Dataset : ../dataset/dataset_ner_srl.json +• Split : 80 % train | 20 % test +• Model : Shared LSTM ➜ 2 head (NER, SRL) +• Output : multi_task_lstm_ner_srl_model.keras +""" + +import json, pickle, numpy as np, tensorflow as tf +from sklearn.model_selection import train_test_split +from tensorflow.keras.layers import ( + Input, + Embedding, + LSTM, + Bidirectional, + TimeDistributed, + Dense, +) +from tensorflow.keras.models import Model +from tensorflow.keras.preprocessing.sequence import pad_sequences +from tensorflow.keras.utils import to_categorical + +# ------------------------------------------------------------------------------ +# 1. Muat data +# ------------------------------------------------------------------------------ +with open("../dataset/dataset_ner_srl.json", encoding="utf-8") as f: + DATA = json.load(f) # list[dict] + +# ------------------------------------------------------------------------------ +# 2. Buat vocab & tag map +# ------------------------------------------------------------------------------ +vocab = {"PAD": 0, "UNK": 1} +for sample in DATA: + for tok in sample["tokens"]: + vocab.setdefault(tok.lower(), len(vocab)) + + +def build_tag_map(key): + m = {"PAD": 0} + for s in DATA: + for t in s[key]: + m.setdefault(t, len(m)) + return m + + +ner2idx = build_tag_map("labels_ner") +srl2idx = build_tag_map("labels_srl") + +# ------------------------------------------------------------------------------ +# 3. Encoding token & label ke indeks ➜ pad +# ------------------------------------------------------------------------------ +MAXLEN = 50 + + +def encode_tokens(tokens): + ids = [vocab.get(tok.lower(), vocab["UNK"]) for tok in tokens] + return pad_sequences([ids], maxlen=MAXLEN, padding="post", value=vocab["PAD"])[0] + + +def encode_labels(labels, tag2idx): + ids = [tag2idx[l] for l in labels] + return pad_sequences([ids], maxlen=MAXLEN, padding="post", value=tag2idx["PAD"])[0] + + +X = np.array([encode_tokens(s["tokens"]) for s in DATA]) +y_ner = np.array([encode_labels(s["labels_ner"], ner2idx) for s in DATA]) +y_srl = np.array([encode_labels(s["labels_srl"], srl2idx) for s in DATA]) + +# one‑hot (jika pakai categorical_crossentropy) +y_ner = to_categorical(y_ner, num_classes=len(ner2idx)) +y_srl = to_categorical(y_srl, num_classes=len(srl2idx)) + +# ------------------------------------------------------------------------------ +# 4. Train / test split 80 : 20 +# ------------------------------------------------------------------------------ +X_tr, X_te, ytr_ner, yte_ner, ytr_srl, yte_srl = train_test_split( + X, y_ner, y_srl, test_size=0.20, random_state=42, shuffle=True +) + +print(f"TRAIN : {X_tr.shape[0]} | TEST : {X_te.shape[0]}") + +# ------------------------------------------------------------------------------ +# 5. Definisi model +# ------------------------------------------------------------------------------ +EMB_DIM = 128 +RNN_UNITS = 128 +BILSTM = True # ganti False jika mau LSTM biasa + +inp = Input(shape=(MAXLEN,)) +emb = Embedding(len(vocab), EMB_DIM, mask_zero=True)(inp) +rnn = ( + Bidirectional(LSTM(RNN_UNITS, return_sequences=True)) + if BILSTM + else LSTM(RNN_UNITS, return_sequences=True) +)(emb) + +out_ner = TimeDistributed(Dense(len(ner2idx), activation="softmax"), name="ner_output")( + rnn +) +out_srl = TimeDistributed(Dense(len(srl2idx), activation="softmax"), name="srl_output")( + rnn +) + +model = Model(inp, [out_ner, out_srl]) +model.compile( + optimizer="adam", + loss={ + "ner_output": "categorical_crossentropy", + "srl_output": "categorical_crossentropy", + }, + metrics={"ner_output": "accuracy", "srl_output": "accuracy"}, +) + +model.summary() + +# ------------------------------------------------------------------------------ +# 6. Training +# ------------------------------------------------------------------------------ +EPOCHS = 15 +BATCH_SIZE = 32 + +history = model.fit( + X_tr, + {"ner_output": ytr_ner, "srl_output": ytr_srl}, + validation_data=(X_te, {"ner_output": yte_ner, "srl_output": yte_srl}), + epochs=EPOCHS, + batch_size=BATCH_SIZE, +) + +# ------------------------------------------------------------------------------ +# 7. Simpan artefak +# ------------------------------------------------------------------------------ +model.save("multi_task_lstm_ner_srl_model.keras") +with open("word2idx.pkl", "wb") as f: + pickle.dump(vocab, f) +with open("tag2idx_ner.pkl", "wb") as f: + pickle.dump(ner2idx, f) +with open("tag2idx_srl.pkl", "wb") as f: + pickle.dump(srl2idx, f) + +print("✓ Model & mapping tersimpan — siap dipakai fungsi predict_sentence()!")