diff --git a/NER/lstm_ner_srl.ipynb b/NER/lstm_ner_srl.ipynb new file mode 100644 index 0000000..05503bd --- /dev/null +++ b/NER/lstm_ner_srl.ipynb @@ -0,0 +1,203 @@ +{ + "cells": [ + { + "cell_type": "code", + "execution_count": 8, + "id": "fcdce269", + "metadata": {}, + "outputs": [], + "source": [ + "import json\n", + "import numpy as np\n", + "from keras.models import Model\n", + "from keras.layers import Input, Embedding, Bidirectional, LSTM, TimeDistributed, Dense\n", + "from keras.utils import to_categorical\n", + "from keras.preprocessing.sequence import pad_sequences\n", + "from sklearn.model_selection import train_test_split\n", + "from seqeval.metrics import classification_report\n", + "import pickle" + ] + }, + { + "cell_type": "code", + "execution_count": 9, + "id": "d568e8f2", + "metadata": {}, + "outputs": [], + "source": [ + "# === LOAD DATA ===\n", + "with open(\"../dataset/dataset_ner_srl.json\", \"r\", encoding=\"utf-8\") as f:\n", + " data = json.load(f)\n", + "\n", + "sentences = [[token.lower() for token in item[\"tokens\"]] for item in data]\n", + "ner_labels = [item[\"labels_ner\"] for item in data]\n", + "srl_labels = [item[\"labels_srl\"] for item in data]" + ] + }, + { + "cell_type": "code", + "execution_count": 10, + "id": "e9653d99", + "metadata": {}, + "outputs": [], + "source": [ + "# === VOCABULARY ===\n", + "words = list(set(word for sentence in sentences for word in sentence))\n", + "word2idx = {word: idx + 2 for idx, word in enumerate(words)}\n", + "word2idx[\"PAD\"] = 0\n", + "word2idx[\"UNK\"] = 1\n", + "\n", + "all_ner_tags = sorted(set(tag for seq in ner_labels for tag in seq))\n", + "all_srl_tags = sorted(set(tag for seq in srl_labels for tag in seq))\n", + "tag2idx_ner = {tag: idx for idx, tag in enumerate(all_ner_tags)}\n", + "tag2idx_srl = {tag: idx for idx, tag in enumerate(all_srl_tags)}\n", + "idx2tag_ner = {i: t for t, i in tag2idx_ner.items()}\n", + "idx2tag_srl = {i: t for t, i in tag2idx_srl.items()}" + ] + }, + { + "cell_type": "code", + "execution_count": null, + "id": "9d3a37b3", + "metadata": {}, + "outputs": [ + { + "ename": "KeyError", + "evalue": "'O'", + "output_type": "error", + "traceback": [ + "\u001b[0;31m---------------------------------------------------------------------------\u001b[0m", + "\u001b[0;31mKeyError\u001b[0m Traceback (most recent call last)", + "Cell \u001b[0;32mIn[11], line 9\u001b[0m\n\u001b[1;32m 7\u001b[0m X \u001b[38;5;241m=\u001b[39m pad_sequences(X, maxlen\u001b[38;5;241m=\u001b[39mmaxlen, padding\u001b[38;5;241m=\u001b[39m\u001b[38;5;124m\"\u001b[39m\u001b[38;5;124mpost\u001b[39m\u001b[38;5;124m\"\u001b[39m, value\u001b[38;5;241m=\u001b[39mword2idx[\u001b[38;5;124m\"\u001b[39m\u001b[38;5;124mPAD\u001b[39m\u001b[38;5;124m\"\u001b[39m])\n\u001b[1;32m 8\u001b[0m y_ner \u001b[38;5;241m=\u001b[39m pad_sequences(y_ner, maxlen\u001b[38;5;241m=\u001b[39mmaxlen, padding\u001b[38;5;241m=\u001b[39m\u001b[38;5;124m\"\u001b[39m\u001b[38;5;124mpost\u001b[39m\u001b[38;5;124m\"\u001b[39m, value\u001b[38;5;241m=\u001b[39mtag2idx_ner[\u001b[38;5;124m\"\u001b[39m\u001b[38;5;124mO\u001b[39m\u001b[38;5;124m\"\u001b[39m])\n\u001b[0;32m----> 9\u001b[0m y_srl \u001b[38;5;241m=\u001b[39m pad_sequences(y_srl, maxlen\u001b[38;5;241m=\u001b[39mmaxlen, padding\u001b[38;5;241m=\u001b[39m\u001b[38;5;124m\"\u001b[39m\u001b[38;5;124mpost\u001b[39m\u001b[38;5;124m\"\u001b[39m, value\u001b[38;5;241m=\u001b[39m\u001b[43mtag2idx_srl\u001b[49m\u001b[43m[\u001b[49m\u001b[38;5;124;43m\"\u001b[39;49m\u001b[38;5;124;43mO\u001b[39;49m\u001b[38;5;124;43m\"\u001b[39;49m\u001b[43m]\u001b[49m)\n\u001b[1;32m 10\u001b[0m y_ner_cat \u001b[38;5;241m=\u001b[39m [to_categorical(seq, num_classes\u001b[38;5;241m=\u001b[39m\u001b[38;5;28mlen\u001b[39m(tag2idx_ner)) \u001b[38;5;28;01mfor\u001b[39;00m seq \u001b[38;5;129;01min\u001b[39;00m y_ner]\n\u001b[1;32m 11\u001b[0m y_srl_cat \u001b[38;5;241m=\u001b[39m [to_categorical(seq, num_classes\u001b[38;5;241m=\u001b[39m\u001b[38;5;28mlen\u001b[39m(tag2idx_srl)) \u001b[38;5;28;01mfor\u001b[39;00m seq \u001b[38;5;129;01min\u001b[39;00m y_srl]\n", + "\u001b[0;31mKeyError\u001b[0m: 'O'" + ] + } + ], + "source": [ + "\n", + "# === ENCODING ===\n", + "X = [[word2idx.get(w, word2idx[\"UNK\"]) for w in s] for s in sentences]\n", + "y_ner = [[tag2idx_ner[t] for t in ts] for ts in ner_labels]\n", + "y_srl = [[tag2idx_srl[t] for t in ts] for ts in srl_labels]\n", + "\n", + "maxlen = max(len(x) for x in X)\n", + "X = pad_sequences(X, maxlen=maxlen, padding=\"post\", value=word2idx[\"PAD\"])\n", + "y_ner = pad_sequences(y_ner, maxlen=maxlen, padding=\"post\", value=tag2idx_ner[\"O\"])\n", + "y_srl = pad_sequences(y_srl, maxlen=maxlen, padding=\"post\", value=tag2idx_srl[\"O\"])\n", + "y_ner_cat = [to_categorical(seq, num_classes=len(tag2idx_ner)) for seq in y_ner]\n", + "y_srl_cat = [to_categorical(seq, num_classes=len(tag2idx_srl)) for seq in y_srl]\n" + ] + }, + { + "cell_type": "code", + "execution_count": null, + "id": "a5c264df", + "metadata": {}, + "outputs": [], + "source": [ + "# split dataset \n", + "X_temp, X_test, y_ner_temp, y_ner_test, y_srl_temp, y_srl_test = train_test_split(\n", + " X, y_ner_cat, y_srl_cat, test_size=0.1, random_state=42\n", + ")\n", + "X_train, X_val, y_ner_train, y_ner_val, y_srl_train, y_srl_val = train_test_split(\n", + " X_temp, y_ner_temp, y_srl_temp, test_size=0.1111, random_state=42 # ~10% of total\n", + ")" + ] + }, + { + "cell_type": "code", + "execution_count": null, + "id": "712c1789", + "metadata": {}, + "outputs": [], + "source": [ + "#training model\n", + "input_layer = Input(shape=(maxlen,))\n", + "embedding = Embedding(input_dim=len(word2idx), output_dim=64)(input_layer)\n", + "bilstm = Bidirectional(LSTM(units=64, return_sequences=True))(embedding)\n", + "out_ner = TimeDistributed(Dense(len(tag2idx_ner), activation=\"softmax\"), name=\"ner_output\")(bilstm)\n", + "out_srl = TimeDistributed(Dense(len(tag2idx_srl), activation=\"softmax\"), name=\"srl_output\")(bilstm)\n", + "\n", + "model = Model(inputs=input_layer, outputs=[out_ner, out_srl])\n", + "model.compile(\n", + " optimizer=\"adam\",\n", + " loss={\"ner_output\": \"categorical_crossentropy\", \"srl_output\": \"categorical_crossentropy\"},\n", + " metrics={\"ner_output\": \"accuracy\", \"srl_output\": \"accuracy\"}\n", + ")\n", + "\n", + "model.summary()" + ] + }, + { + "cell_type": "code", + "execution_count": null, + "id": "98feee87", + "metadata": {}, + "outputs": [], + "source": [ + "\n", + "# === TRAINING ===\n", + "history = model.fit(\n", + " X_train,\n", + " {\"ner_output\": np.array(y_ner_train), \"srl_output\": np.array(y_srl_train)},\n", + " validation_data=(X_val, {\"ner_output\": np.array(y_ner_val), \"srl_output\": np.array(y_srl_val)}),\n", + " batch_size=2,\n", + " epochs=10\n", + ")\n", + "\n", + "# === SAVE ===\n", + "model.save(\"NER_SRL/multi_task_bilstm_model.keras\")\n", + "with open(\"NER_SRL/word2idx.pkl\", \"wb\") as f:\n", + " pickle.dump(word2idx, f)\n", + "with open(\"NER_SRL/tag2idx_ner.pkl\", \"wb\") as f:\n", + " pickle.dump(tag2idx_ner, f)\n", + "with open(\"NER_SRL/tag2idx_srl.pkl\", \"wb\") as f:\n", + " pickle.dump(tag2idx_srl, f)" + ] + }, + { + "cell_type": "code", + "execution_count": null, + "id": "aeef32c1", + "metadata": {}, + "outputs": [], + "source": [ + "# evaluation\n", + "y_pred_ner, y_pred_srl = model.predict(X_test)\n", + "\n", + "y_true_ner = [[idx2tag_ner[np.argmax(tok)] for tok in seq] for seq in y_ner_test]\n", + "y_pred_ner = [[idx2tag_ner[np.argmax(tok)] for tok in seq] for seq in y_pred_ner]\n", + "\n", + "y_true_srl = [[idx2tag_srl[np.argmax(tok)] for tok in seq] for seq in y_srl_test]\n", + "y_pred_srl = [[idx2tag_srl[np.argmax(tok)] for tok in seq] for seq in y_pred_srl]\n", + "\n", + "print(\"\\nšŸ“Š [NER] Test Set Classification Report:\")\n", + "print(classification_report(y_true_ner, y_pred_ner))\n", + "\n", + "print(\"\\nšŸ“Š [SRL] Test Set Classification Report:\")\n", + "print(classification_report(y_true_srl, y_pred_srl))" + ] + } + ], + "metadata": { + "kernelspec": { + "display_name": "myenv", + "language": "python", + "name": "python3" + }, + "language_info": { + "codemirror_mode": { + "name": "ipython", + "version": 3 + }, + "file_extension": ".py", + "mimetype": "text/x-python", + "name": "python", + "nbconvert_exporter": "python", + "pygments_lexer": "ipython3", + "version": "3.10.16" + } + }, + "nbformat": 4, + "nbformat_minor": 5 +} diff --git a/NER/test_ner.py b/NER/test_ner.py index 52c850b..8fbecbc 100644 --- a/NER/test_ner.py +++ b/NER/test_ner.py @@ -33,7 +33,7 @@ def predict_sentence(sentence): if __name__ == "__main__": try: - sentence = "dani datang ke indonesia" + sentence = "korea adalah tempat lahir jun" predict_sentence(sentence) except KeyboardInterrupt: print("\n\nSelesai.") diff --git a/dataset/dataset _qc.json b/dataset/dataset _qc.json new file mode 100644 index 0000000..6af892a --- /dev/null +++ b/dataset/dataset _qc.json @@ -0,0 +1,8 @@ +{ + "tokens": ["Barack", "Obama", "lahir", "di", "Hawaii", "."], + "ner": ["B-PER", "I-PER", "O", "O", "B-LOC", "O"], + "srl": ["B-ARG0", "I-ARG0", "B-V", "B-ARGM-LOC", "I-ARGM-LOC", "O"], + "question": "___ lahir di Hawaii.", + "answer": "Barack Obama", + "type": "isian" +} diff --git a/dataset/dataset_ner_srl.json b/dataset/dataset_ner_srl.json index 9c5ee96..eadab79 100644 --- a/dataset/dataset_ner_srl.json +++ b/dataset/dataset_ner_srl.json @@ -2,23 +2,27 @@ { "tokens": ["Barack", "Obama", "adalah", "kanselir", "asal", "Hawaii"], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "B-LOC"], - "labels_srl": [] + "labels_srl": ["ARG0", "ARG0", "V", "ARG1", "ARGM-LOC", "ARGM-LOC"] }, { "tokens": ["Greta", "Thunberg", "adalah", "pemain bola", "asal", "Inggris"], - "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "B-LOC"] + "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "B-LOC"], + "labels_srl": ["ARG0", "ARG0", "V", "ARG1", "ARGM-LOC", "ARGM-LOC"] }, { "tokens": ["Greta", "Thunberg", "datang", "dari", "Amerika"], - "labels_ner": ["B-PER", "I-PER", "O", "O", "B-LOC"] + "labels_ner": ["B-PER", "I-PER", "O", "O", "B-LOC"], + "labels_srl": ["ARG0", "ARG0", "V", "ARGM-LOC", "ARGM-LOC"] }, { "tokens": ["Joko", "Widodo", "lahir", "di", "Indonesia"], - "labels_ner": ["B-PER", "I-PER", "O", "O", "B-LOC"] + "labels_ner": ["B-PER", "I-PER", "O", "O", "B-LOC"], + "labels_srl": ["ARG0", "ARG0", "V", "ARGM-LOC", "ARGM-LOC"] }, { "tokens": ["Taylor", "Swift", "datang", "dari", "Indonesia"], - "labels_ner": ["B-PER", "I-PER", "O", "O", "B-LOC"] + "labels_ner": ["B-PER", "I-PER", "O", "O", "B-LOC"], + "labels_srl": ["ARG0", "ARG0", "V", "ARGM-LOC", "ARGM-LOC"] }, { "tokens": [ @@ -29,34 +33,42 @@ "asal", "Inggris" ], - "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "B-LOC"] + "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "B-LOC"], + "labels_srl": ["ARG0", "ARG0", "V", "ARG1", "ARGM-LOC", "ARGM-LOC"] }, { "tokens": ["Angela", "Merkel", "lahir", "di", "Kanada"], - "labels_ner": ["B-PER", "I-PER", "O", "O", "B-LOC"] + "labels_ner": ["B-PER", "I-PER", "O", "O", "B-LOC"], + "labels_srl": ["ARG0", "ARG0", "V", "ARGM-LOC", "ARGM-LOC"] }, { "tokens": ["Joe", "Biden", "adalah", "kanselir", "asal", "Jerman"], - "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "B-LOC"] + "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "B-LOC"], + "labels_srl": ["ARG0", "ARG0", "V", "ARG1", "ARGM-LOC", "ARGM-LOC"] }, { "tokens": ["Elon", "Musk", "pernah", "tinggal", "di", "Italia"], - "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "B-LOC"] + "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "B-LOC"], + "labels_srl": ["ARG0", "ARG0", "ARGM-TMP", "V", "ARGM-LOC", "ARGM-LOC"] }, { "tokens": ["Taylor", "Swift", "datang", "dari", "Brazil"], - "labels_ner": ["B-PER", "I-PER", "O", "O", "B-LOC"] + "labels_ner": ["B-PER", "I-PER", "O", "O", "B-LOC"], + "labels_srl": ["ARG0", "ARG0", "V", "ARGM-LOC", "ARGM-LOC"] }, { "tokens": ["Joe", "Biden", "lahir", "di", "Indonesia"], - "labels_ner": ["B-PER", "I-PER", "O", "O", "B-LOC"] + "labels_ner": ["B-PER", "I-PER", "O", "O", "B-LOC"], + "labels_srl": [] }, { "tokens": ["Cristiano", "Ronaldo", "adalah", "presiden", "asal", "Jerman"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "B-LOC"] }, { "tokens": ["Joko", "Widodo", "pernah", "tinggal", "di", "Amerika"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "B-LOC"] }, { @@ -69,6 +81,7 @@ "di", "Kanada" ], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "O", "B-LOC"] }, { @@ -81,18 +94,22 @@ "di", "Indonesia" ], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "O", "B-LOC"] }, { "tokens": ["Lionel", "Messi", "lahir", "di", "Kanada"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "B-LOC"] }, { "tokens": ["Lionel", "Messi", "datang", "dari", "Perancis"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "B-LOC"] }, { "tokens": ["Emma", "Watson", "lahir", "di", "Jerman"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "B-LOC"] }, { @@ -104,34 +121,42 @@ "asal", "Indonesia" ], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "B-LOC"] }, { "tokens": ["Angela", "Merkel", "datang", "dari", "Amerika"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "B-LOC"] }, { "tokens": ["Elon", "Musk", "pernah", "tinggal", "di", "Jerman"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "B-LOC"] }, { "tokens": ["Joko", "Widodo", "adalah", "ilmuwan", "asal", "Inggris"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "B-LOC"] }, { "tokens": ["Joko", "Widodo", "adalah", "aktivis", "asal", "Perancis"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "B-LOC"] }, { "tokens": ["Emma", "Watson", "pernah", "tinggal", "di", "Italia"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "B-LOC"] }, { "tokens": ["Emma", "Watson", "datang", "dari", "Hawaii"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "B-LOC"] }, { "tokens": ["Angela", "Merkel", "pernah", "tinggal", "di", "Inggris"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "B-LOC"] }, { @@ -144,10 +169,12 @@ "di", "Brazil" ], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "O", "B-LOC"] }, { "tokens": ["Elon", "Musk", "adalah", "aktivis", "asal", "Spanyol"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "B-LOC"] }, { @@ -160,38 +187,47 @@ "di", "Italia" ], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "O", "B-LOC"] }, { "tokens": ["Joko", "Widodo", "lahir", "di", "Italia"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "B-LOC"] }, { "tokens": ["Taylor", "Swift", "adalah", "presiden", "asal", "Jerman"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "B-LOC"] }, { "tokens": ["Joko", "Widodo", "lahir", "di", "Spanyol"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "B-LOC"] }, { "tokens": ["Joe", "Biden", "pernah", "tinggal", "di", "Italia"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "B-LOC"] }, { "tokens": ["Lionel", "Messi", "datang", "dari", "Indonesia"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "B-LOC"] }, { "tokens": ["Emma", "Watson", "datang", "dari", "Kanada"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "B-LOC"] }, { "tokens": ["Angela", "Merkel", "datang", "dari", "Inggris"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "B-LOC"] }, { "tokens": ["Cristiano", "Ronaldo", "lahir", "di", "Brazil"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "B-LOC"] }, { @@ -204,34 +240,42 @@ "di", "Spanyol" ], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "O", "B-LOC"] }, { "tokens": ["Greta", "Thunberg", "pernah", "tinggal", "di", "Inggris"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "B-LOC"] }, { "tokens": ["Lionel", "Messi", "datang", "dari", "Italia"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "B-LOC"] }, { "tokens": ["Joko", "Widodo", "datang", "dari", "Kanada"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "B-LOC"] }, { "tokens": ["Greta", "Thunberg", "pernah", "tinggal", "di", "Amerika"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "B-LOC"] }, { "tokens": ["Joe", "Biden", "lahir", "di", "Kanada"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "B-LOC"] }, { "tokens": ["Lionel", "Messi", "lahir", "di", "Jerman"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "B-LOC"] }, { "tokens": ["Emma", "Watson", "pernah", "tinggal", "di", "Hawaii"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "B-LOC"] }, { @@ -244,54 +288,67 @@ "di", "Kanada" ], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "O", "B-LOC"] }, { "tokens": ["Angela", "Merkel", "datang", "dari", "Hawaii"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "B-LOC"] }, { "tokens": ["Joko", "Widodo", "lahir", "di", "Indonesia"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "B-LOC"] }, { "tokens": ["Taylor", "Swift", "lahir", "di", "Inggris"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "B-LOC"] }, { "tokens": ["Barack", "Obama", "datang", "dari", "Perancis"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "B-LOC"] }, { "tokens": ["Joko", "Widodo", "adalah", "penyanyi", "asal", "Brazil"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "B-LOC"] }, { "tokens": ["Greta", "Thunberg", "adalah", "aktivis", "asal", "Amerika"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "B-LOC"] }, { "tokens": ["Greta", "Thunberg", "datang", "dari", "Kanada"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "B-LOC"] }, { "tokens": ["Joko", "Widodo", "adalah", "penyanyi", "asal", "Indonesia"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "B-LOC"] }, { "tokens": ["Greta", "Thunberg", "lahir", "di", "Indonesia"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "B-LOC"] }, { "tokens": ["Barack", "Obama", "pernah", "tinggal", "di", "Hawaii"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "B-LOC"] }, { "tokens": ["Greta", "Thunberg", "adalah", "pemain bola", "asal", "Italia"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "B-LOC"] }, { "tokens": ["Greta", "Thunberg", "adalah", "pemain bola", "asal", "Inggris"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "B-LOC"] }, { @@ -304,10 +361,12 @@ "di", "Brazil" ], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "O", "B-LOC"] }, { "tokens": ["Angela", "Merkel", "datang", "dari", "Inggris"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "B-LOC"] }, { @@ -320,22 +379,27 @@ "di", "Perancis" ], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "O", "B-LOC"] }, { "tokens": ["Joe", "Biden", "adalah", "aktor", "asal", "Inggris"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "B-LOC"] }, { "tokens": ["Angela", "Merkel", "adalah", "ilmuwan", "asal", "Indonesia"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "B-LOC"] }, { "tokens": ["Angela", "Merkel", "adalah", "kanselir", "asal", "Hawaii"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "B-LOC"] }, { "tokens": ["Taylor", "Swift", "adalah", "penyanyi", "asal", "Perancis"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "B-LOC"] }, { @@ -348,34 +412,42 @@ "di", "Perancis" ], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "O", "B-LOC"] }, { "tokens": ["Joko", "Widodo", "adalah", "aktivis", "asal", "Brazil"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "B-LOC"] }, { "tokens": ["Greta", "Thunberg", "datang", "dari", "Amerika"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "B-LOC"] }, { "tokens": ["Lionel", "Messi", "datang", "dari", "Brazil"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "B-LOC"] }, { "tokens": ["Emma", "Watson", "adalah", "presiden", "asal", "Amerika"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "B-LOC"] }, { "tokens": ["Angela", "Merkel", "datang", "dari", "Brazil"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "B-LOC"] }, { "tokens": ["Angela", "Merkel", "adalah", "ilmuwan", "asal", "Indonesia"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "B-LOC"] }, { "tokens": ["Barack", "Obama", "lahir", "di", "Inggris"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "B-LOC"] }, { @@ -388,30 +460,37 @@ "di", "Italia" ], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "O", "B-LOC"] }, { "tokens": ["Elon", "Musk", "adalah", "aktivis", "asal", "Perancis"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "B-LOC"] }, { "tokens": ["Joe", "Biden", "pernah", "tinggal", "di", "Jerman"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "B-LOC"] }, { "tokens": ["Barack", "Obama", "pernah", "tinggal", "di", "Spanyol"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "B-LOC"] }, { "tokens": ["Barack", "Obama", "adalah", "kanselir", "asal", "Spanyol"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "B-LOC"] }, { "tokens": ["Taylor", "Swift", "lahir", "di", "Kanada"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "B-LOC"] }, { "tokens": ["Greta", "Thunberg", "datang", "dari", "Italia"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "B-LOC"] }, { @@ -424,38 +503,47 @@ "di", "Spanyol" ], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "O", "B-LOC"] }, { "tokens": ["Joko", "Widodo", "datang", "dari", "Amerika"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "B-LOC"] }, { "tokens": ["Elon", "Musk", "adalah", "kanselir", "asal", "Spanyol"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "B-LOC"] }, { "tokens": ["Barack", "Obama", "pernah", "tinggal", "di", "Jerman"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "B-LOC"] }, { "tokens": ["Taylor", "Swift", "lahir", "di", "Indonesia"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "B-LOC"] }, { "tokens": ["Emma", "Watson", "adalah", "penyanyi", "asal", "Kanada"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "B-LOC"] }, { "tokens": ["Cristiano", "Ronaldo", "datang", "dari", "Hawaii"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "B-LOC"] }, { "tokens": ["Joe", "Biden", "adalah", "pemain bola", "asal", "Italia"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "B-LOC"] }, { "tokens": ["Joe", "Biden", "lahir", "di", "Perancis"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "B-LOC"] }, { @@ -468,63 +556,78 @@ "di", "Jerman" ], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "O", "B-LOC"] }, { "tokens": ["Elon", "Musk", "pernah", "tinggal", "di", "Brazil"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "B-LOC"] }, { "tokens": ["Lionel", "Messi", "pernah", "tinggal", "di", "Spanyol"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "B-LOC"] }, { "tokens": ["Lionel", "Messi", "datang", "dari", "Indonesia"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "B-LOC"] }, { "tokens": ["Emma", "Watson", "adalah", "aktivis", "asal", "Perancis"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "B-LOC"] }, { "tokens": ["Barack", "Obama", "datang", "dari", "Spanyol"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "B-LOC"] }, { "tokens": ["Emma", "Watson", "pernah", "tinggal", "di", "Jerman"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "B-LOC"] }, { "tokens": ["Joe", "Biden", "pernah", "tinggal", "di", "Jerman"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "B-LOC"] }, { "tokens": ["Angela", "Merkel", "lahir", "di", "Inggris"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "B-LOC"] }, { "tokens": ["Angela", "Merkel", "pernah", "tinggal", "di", "Spanyol"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "B-LOC"] }, { "tokens": ["Cristiano", "Ronaldo", "lahir", "di", "Brazil"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "B-LOC"] }, { "tokens": ["Nadiem", "Makarim", "lahir", "di", "Bandung"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "B-LOC"] }, { "tokens": ["Joko", "Widodo", "lahir", "di", "Bandung"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "B-LOC"] }, { "tokens": ["Joko", "Widodo", "datang", "dari", "Yogyakarta"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "B-LOC"] }, { "tokens": ["Prabowo", "Subianto", "pernah", "tinggal", "di", "Makassar"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "B-LOC"] }, { @@ -537,22 +640,27 @@ "di", "Bandung" ], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "O", "B-LOC"] }, { "tokens": ["Sri", "Mulyani", "bekerja", "sebagai", "artis", "di", "Padang"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "O", "B-LOC"] }, { "tokens": ["Ganjar", "Pranowo", "pernah", "tinggal", "di", "Makassar"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "B-LOC"] }, { "tokens": ["Ganjar", "Pranowo", "pernah", "tinggal", "di", "Bali"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "B-LOC"] }, { "tokens": ["Joko", "Widodo", "datang", "dari", "Bali"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "B-LOC"] }, { @@ -565,18 +673,22 @@ "di", "Semarang" ], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "O", "B-LOC"] }, { "tokens": ["Najwa", "Shihab", "adalah", "penulis", "asal", "Jakarta"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "B-LOC"] }, { "tokens": ["Susi", "Pudjiastuti", "datang", "dari", "Palembang"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "B-LOC"] }, { "tokens": ["Ganjar", "Pranowo", "pernah", "tinggal", "di", "Semarang"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "B-LOC"] }, { @@ -589,14 +701,17 @@ "di", "Semarang" ], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "O", "B-LOC"] }, { "tokens": ["Susi", "Pudjiastuti", "adalah", "penulis", "asal", "Jakarta"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "B-LOC"] }, { "tokens": ["Maudy", "Ayunda", "pernah", "tinggal", "di", "Semarang"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "B-LOC"] }, { @@ -608,18 +723,22 @@ "asal", "Yogyakarta" ], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "B-LOC"] }, { "tokens": ["Nadiem", "Makarim", "pernah", "tinggal", "di", "Bali"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "B-LOC"] }, { "tokens": ["Najwa", "Shihab", "datang", "dari", "Palembang"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "B-LOC"] }, { "tokens": ["Ganjar", "Pranowo", "adalah", "penulis", "asal", "Bali"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "B-LOC"] }, { @@ -632,10 +751,12 @@ "di", "Medan" ], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "O", "B-LOC"] }, { "tokens": ["Susi", "Pudjiastuti", "adalah", "walikota", "asal", "Bali"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "B-LOC"] }, { @@ -648,46 +769,57 @@ "di", "Palembang" ], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "O", "B-LOC"] }, { "tokens": ["Budi", "Gunadi", "adalah", "artis", "asal", "Bali"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "B-LOC"] }, { "tokens": ["Ganjar", "Pranowo", "adalah", "walikota", "asal", "Jakarta"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "B-LOC"] }, { "tokens": ["Ganjar", "Pranowo", "pernah", "tinggal", "di", "Palembang"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "B-LOC"] }, { "tokens": ["Ridwan", "Kamil", "pernah", "tinggal", "di", "Palembang"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "B-LOC"] }, { "tokens": ["Ganjar", "Pranowo", "datang", "dari", "Makassar"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "B-LOC"] }, { "tokens": ["Maudy", "Ayunda", "lahir", "di", "Padang"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "B-LOC"] }, { "tokens": ["Budi", "Gunadi", "adalah", "dosen", "asal", "Semarang"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "B-LOC"] }, { "tokens": ["Maudy", "Ayunda", "datang", "dari", "Medan"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "B-LOC"] }, { "tokens": ["Joko", "Widodo", "lahir", "di", "Palembang"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "B-LOC"] }, { "tokens": ["Susi", "Pudjiastuti", "adalah", "menteri", "asal", "Bali"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "B-LOC"] }, { @@ -700,26 +832,32 @@ "di", "Palembang" ], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "O", "B-LOC"] }, { "tokens": ["Najwa", "Shihab", "adalah", "walikota", "asal", "Jakarta"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "B-LOC"] }, { "tokens": ["Susi", "Pudjiastuti", "pernah", "tinggal", "di", "Medan"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "B-LOC"] }, { "tokens": ["Najwa", "Shihab", "lahir", "di", "Padang"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "B-LOC"] }, { "tokens": ["Ridwan", "Kamil", "adalah", "dosen", "asal", "Medan"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "B-LOC"] }, { "tokens": ["Prabowo", "Subianto", "lahir", "di", "Surabaya"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "B-LOC"] }, { @@ -732,42 +870,52 @@ "di", "Surabaya" ], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "O", "B-LOC"] }, { "tokens": ["Ganjar", "Pranowo", "adalah", "menteri", "asal", "Jakarta"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "B-LOC"] }, { "tokens": ["Ridwan", "Kamil", "pernah", "tinggal", "di", "Medan"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "B-LOC"] }, { "tokens": ["Najwa", "Shihab", "datang", "dari", "Bandung"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "B-LOC"] }, { "tokens": ["Prabowo", "Subianto", "datang", "dari", "Semarang"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "B-LOC"] }, { "tokens": ["Maudy", "Ayunda", "lahir", "di", "Surabaya"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "B-LOC"] }, { "tokens": ["Prabowo", "Subianto", "lahir", "di", "Bali"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "B-LOC"] }, { "tokens": ["Sri", "Mulyani", "datang", "dari", "Jakarta"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "B-LOC"] }, { "tokens": ["Nadiem", "Makarim", "adalah", "penulis", "asal", "Bali"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "B-LOC"] }, { "tokens": ["Nadiem", "Makarim", "datang", "dari", "Semarang"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "B-LOC"] }, { @@ -779,18 +927,22 @@ "asal", "Yogyakarta" ], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "B-LOC"] }, { "tokens": ["Sri", "Mulyani", "pernah", "tinggal", "di", "Jakarta"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "B-LOC"] }, { "tokens": ["Prabowo", "Subianto", "datang", "dari", "Jakarta"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "B-LOC"] }, { "tokens": ["Ganjar", "Pranowo", "pernah", "tinggal", "di", "Semarang"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "B-LOC"] }, { @@ -803,18 +955,22 @@ "di", "Semarang" ], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "O", "B-LOC"] }, { "tokens": ["Ridwan", "Kamil", "adalah", "walikota", "asal", "Jakarta"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "B-LOC"] }, { "tokens": ["Susi", "Pudjiastuti", "adalah", "walikota", "asal", "Padang"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "B-LOC"] }, { "tokens": ["Ganjar", "Pranowo", "pernah", "tinggal", "di", "Semarang"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "B-LOC"] }, { @@ -827,14 +983,17 @@ "di", "Yogyakarta" ], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "O", "B-LOC"] }, { "tokens": ["Budi", "Gunadi", "lahir", "di", "Yogyakarta"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "B-LOC"] }, { "tokens": ["Ridwan", "Kamil", "pernah", "tinggal", "di", "Makassar"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "B-LOC"] }, { @@ -847,58 +1006,72 @@ "di", "Yogyakarta" ], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "O", "B-LOC"] }, { "tokens": ["Nadiem", "Makarim", "adalah", "aktivis", "asal", "Yogyakarta"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "B-LOC"] }, { "tokens": ["Maudy", "Ayunda", "datang", "dari", "Bali"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "B-LOC"] }, { "tokens": ["Ridwan", "Kamil", "datang", "dari", "Jakarta"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "B-LOC"] }, { "tokens": ["Budi", "Gunadi", "datang", "dari", "Makassar"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "B-LOC"] }, { "tokens": ["Joko", "Widodo", "lahir", "di", "Surabaya"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "B-LOC"] }, { "tokens": ["Nadiem", "Makarim", "lahir", "di", "Padang"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "B-LOC"] }, { "tokens": ["Susi", "Pudjiastuti", "datang", "dari", "Bali"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "B-LOC"] }, { "tokens": ["Budi", "Gunadi", "datang", "dari", "Semarang"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "B-LOC"] }, { "tokens": ["Prabowo", "Subianto", "datang", "dari", "Semarang"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "B-LOC"] }, { "tokens": ["Prabowo", "Subianto", "adalah", "dosen", "asal", "Bandung"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "B-LOC"] }, { "tokens": ["Ganjar", "Pranowo", "datang", "dari", "Padang"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "B-LOC"] }, { "tokens": ["Ridwan", "Kamil", "lahir", "di", "Makassar"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "B-LOC"] }, { "tokens": ["Nadiem", "Makarim", "datang", "dari", "Palembang"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "B-LOC"] }, { @@ -911,30 +1084,37 @@ "di", "Bandung" ], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "O", "B-LOC"] }, { "tokens": ["Ganjar", "Pranowo", "lahir", "di", "Medan"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "B-LOC"] }, { "tokens": ["Joko", "Widodo", "pernah", "tinggal", "di", "Bali"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "B-LOC"] }, { "tokens": ["Joko", "Widodo", "pernah", "tinggal", "di", "Bali"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "B-LOC"] }, { "tokens": ["Susi", "Pudjiastuti", "pernah", "tinggal", "di", "Bandung"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "B-LOC"] }, { "tokens": ["Susi", "Pudjiastuti", "datang", "dari", "Bandung"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "B-LOC"] }, { "tokens": ["Maudy", "Ayunda", "pernah", "tinggal", "di", "Bandung"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "B-LOC"] }, { @@ -947,18 +1127,22 @@ "di", "Makassar" ], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "O", "B-LOC"] }, { "tokens": ["Sri", "Mulyani", "adalah", "dosen", "asal", "Makassar"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "B-LOC"] }, { "tokens": ["Prabowo", "Subianto", "lahir", "di", "Medan"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "B-LOC"] }, { "tokens": ["Budi", "Gunadi", "lahir", "di", "Jakarta"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "B-LOC"] }, { @@ -971,10 +1155,12 @@ "di", "Makassar" ], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "O", "B-LOC"] }, { "tokens": ["Sri", "Mulyani", "lahir", "di", "Yogyakarta"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "B-LOC"] }, { @@ -987,30 +1173,37 @@ "di", "Yogyakarta" ], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "O", "B-LOC"] }, { "tokens": ["Prabowo", "Subianto", "datang", "dari", "Surabaya"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "B-LOC"] }, { "tokens": ["Najwa", "Shihab", "bekerja", "sebagai", "artis", "di", "Medan"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "O", "B-LOC"] }, { "tokens": ["Sri", "Mulyani", "lahir", "di", "Bandung"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "B-LOC"] }, { "tokens": ["Najwa", "Shihab", "adalah", "aktivis", "asal", "Semarang"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "B-LOC"] }, { "tokens": ["Prabowo", "Subianto", "pernah", "tinggal", "di", "Bandung"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "B-LOC"] }, { "tokens": ["Joko", "Widodo", "pernah", "tinggal", "di", "Yogyakarta"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "B-LOC"] }, { @@ -1023,10 +1216,12 @@ "di", "Semarang" ], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "O", "B-LOC"] }, { "tokens": ["Maudy", "Ayunda", "pernah", "tinggal", "di", "Padang"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "B-LOC"] }, { @@ -1039,10 +1234,12 @@ "di", "Bandung" ], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "O", "B-LOC"] }, { "tokens": ["Ganjar", "Pranowo", "datang", "dari", "Surabaya"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "B-LOC"] }, { @@ -1055,14 +1252,17 @@ "di", "Bali" ], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "O", "B-LOC"] }, { "tokens": ["Prabowo", "Subianto", "adalah", "aktivis", "asal", "Palembang"], + "labels_srl": [], "labels_ner": ["B-PER", "I-PER", "O", "O", "O", "B-LOC"] }, { "tokens": ["jakarta", "adalah", "ibu", "kota", "Indonesia"], + "labels_srl": [], "labels_ner": ["B-LOC", "O", "O", "O", "B-LOC"] }, { @@ -1075,14 +1275,17 @@ "prabowo", "subianto" ], + "labels_srl": [], "labels_ner": ["O", "B-LOC", "O", "O", "O", "B-PER", "I-PER"] }, { "tokens": ["dani", "datang", "dari", "jakarta"], + "labels_srl": [], "labels_ner": ["B-PER", "O", "O", "B-LOC"] }, { "tokens": ["dani", "pergi", "ke", "surabaya"], + "labels_srl": [], "labels_ner": ["B-PER", "O", "O", "B-LOC"] }, { @@ -1097,6 +1300,7 @@ "zaman", "praaksara" ], + "labels_srl": [], "labels_ner": ["O", "O", "O", "O", "O", "O", "O", "B-TIME", "I-TIME"] }, { @@ -1109,10 +1313,12 @@ "usul", "manusia" ], + "labels_srl": [], "labels_ner": ["O", "O", "O", "O", "O", "O", "O"] }, { "tokens": ["Tumbuhan", "memiliki", "akar"], + "labels_srl": [], "labels_ner": ["O", "O", "O"] }, { @@ -1129,6 +1335,7 @@ "ke", "bumi" ], + "labels_srl": [], "labels_ner": ["O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC"] }, { @@ -1146,10 +1353,12 @@ "alam", "lainnya" ], + "labels_srl": [], "labels_ner": ["O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O"] }, { "tokens": ["Demikian", "pula", "halnya", "dengan", "manusia"], + "labels_srl": [], "labels_ner": ["O", "O", "O", "O", "O"] }, { @@ -1161,6 +1370,7 @@ "kelompok", "masyarakat" ], + "labels_srl": [], "labels_ner": ["O", "O", "O", "O", "O", "O"] }, { @@ -1178,6 +1388,7 @@ "terhadap", "tradisi" ], + "labels_srl": [], "labels_ner": [ "O", "O", @@ -1204,6 +1415,7 @@ "budaya", "bangsanya" ], + "labels_srl": [], "labels_ner": ["O", "O", "O", "O", "O", "O", "B-MISC", "B-MISC"] }, { @@ -1219,6 +1431,7 @@ "lebih", "kuat" ], + "labels_srl": [], "labels_ner": ["O", "O", "O", "O", "O", "B-MISC", "B-MISC", "O", "O", "O"] }, { @@ -1230,6 +1443,7 @@ "identitas", "diri" ], + "labels_srl": [], "labels_ner": ["O", "O", "O", "O", "B-MISC", "I-MISC"] }, { @@ -1243,6 +1457,7 @@ "nenek", "moyangnya" ], + "labels_srl": [], "labels_ner": ["O", "O", "O", "O", "O", "B-MISC", "O", "O"] }, { @@ -1259,6 +1474,7 @@ "bukan", "miliknya" ], + "labels_srl": [], "labels_ner": [ "O", "O", @@ -1289,6 +1505,7 @@ "pendahulu", "kita" ], + "labels_srl": [], "labels_ner": [ "O", "O", @@ -1325,6 +1542,7 @@ "banyak", "orang" ], + "labels_srl": [], "labels_ner": [ "O", "O", @@ -1347,6 +1565,7 @@ }, { "tokens": ["Untuk", "memetik", "pelajaran", "dari", "uraian", "ini"], + "labels_srl": [], "labels_ner": ["O", "O", "O", "O", "O", "O"] }, { @@ -1364,6 +1583,7 @@ "zaman", "praaksara" ], + "labels_srl": [], "labels_ner": [ "O", "O", @@ -1396,6 +1616,7 @@ "sebagai", "peringatan" ], + "labels_srl": [], "labels_ner": [ "O", "O", @@ -1431,6 +1652,7 @@ "masa", "depan" ], + "labels_srl": [], "labels_ner": [ "O", "O", @@ -1460,6 +1682,7 @@ "praaksara", "berakhir" ], + "labels_srl": [], "labels_ner": ["O", "O", "O", "O", "O", "B-TIME", "I-TIME", "O"] }, { @@ -1478,6 +1701,7 @@ "mengenal", "tulisan" ], + "labels_srl": [], "labels_ner": [ "O", "O", @@ -1507,6 +1731,7 @@ "akan", "berbeda" ], + "labels_srl": [], "labels_ner": ["O", "O", "O", "O", "B-TIME", "I-TIME", "O", "O", "O", "O"] }, { @@ -1524,6 +1749,7 @@ "ke-5", "M" ], + "labels_srl": [], "labels_ner": [ "O", "O", @@ -1556,6 +1782,7 @@ "dan", "Mesopotamia" ], + "labels_srl": [], "labels_ner": [ "O", "O", @@ -1585,6 +1812,7 @@ "3000", "SM" ], + "labels_srl": [], "labels_ner": ["O", "O", "O", "O", "O", "O", "B-TIME", "I-TIME", "I-TIME"] }, { @@ -1603,6 +1831,7 @@ "kerajaan", "tua" ], + "labels_srl": [], "labels_ner": [ "O", "B-TIME", @@ -1630,6 +1859,7 @@ "Kalimantan", "Timur" ], + "labels_srl": [], "labels_ner": ["O", "O", "B-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC"] }, @@ -1653,6 +1883,7 @@ "hidup", "manusia" ], + "labels_srl": [], "labels_ner": [ "B-LOC", "O", @@ -1690,6 +1921,7 @@ "dengan", "keturunannya" ], + "labels_srl": [], "labels_ner": [ "O", "B-LOC", @@ -1727,6 +1959,7 @@ "hidup", "kita" ], + "labels_srl": [], "labels_ner": [ "O", "B-LOC", @@ -1760,6 +1993,7 @@ "menimbulkan", "bencana" ], + "labels_srl": [], "labels_ner": ["O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O"] }, { @@ -1783,6 +2017,7 @@ "menimbulkan", "tsunami" ], + "labels_srl": [], "labels_ner": [ "O", "O", @@ -1820,6 +2055,7 @@ "di", "Aceh" ], + "labels_srl": [], "labels_ner": [ "O", "O", @@ -1853,6 +2089,7 @@ "api", "meletus" ], + "labels_srl": [], "labels_ner": [ "O", "O", @@ -1884,6 +2121,7 @@ "benda", "melayang" ], + "labels_srl": [], "labels_ner": ["O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O"] }, { @@ -1915,6 +2153,7 @@ "yang", "lalu" ], + "labels_srl": [], "labels_ner": [ "O", "O", @@ -1958,6 +2197,7 @@ "pembabakan", "waktu" ], + "labels_srl": [], "labels_ner": ["O", "O", "O", "O", "O", "O", "O", "O", "O", "O"] }, { @@ -1979,6 +2219,7 @@ "Indonesia", "terbentuk" ], + "labels_srl": [], "labels_ner": [ "O", "O", @@ -2000,6 +2241,7 @@ }, { "tokens": ["dani", "pergi", "ke", "surabaya", "sore", "ini"], + "labels_srl": [], "labels_ner": ["B-PER", "O", "O", "B-LOC", "B-TIME", "O"] }, { @@ -2013,6 +2255,7 @@ "dengan", "pacarnya" ], + "labels_srl": [], "labels_ner": ["B-TIME", "O", "B-PER", "O", "O", "O", "O", "B-PER"] } ]