import numpy as np import pandas as pd from fastapi import APIRouter, HTTPException, Depends, Query from sqlalchemy.orm import Session from sklearn.svm import SVR from sklearn.preprocessing import MinMaxScaler, StandardScaler from sklearn.model_selection import train_test_split from sklearn.metrics import mean_absolute_error, mean_squared_error, mean_absolute_percentage_error from config.db import get_db from models.index import priceTomat from middleware.index import verify_token # Inisialisasi Router testingModel_router = APIRouter( prefix="/testing", tags=["Testing Model SVR"] ) @testingModel_router.get("/predict", response_model=dict,dependencies=[Depends(verify_token)]) def predict_price( db: Session = Depends(get_db), kernel: str = Query("rbf", enum=["linear", "poly", "sigmoid", "rbf"]), degree: int = Query(3, description="Degree untuk kernel Polynomial"), coef0: float = Query(0.0, description="Coef0 untuk kernel Polynomial dan Sigmoid"), C: float = Query(100.0, description="Parameter regulasi C"), gamma: float = Query(0.1, description="Parameter gamma untuk kernel RBF, Poly, dan Sigmoid"), epsilon: float = Query(0.01, description="Margin kesalahan untuk SVR") ): # Ambil data dari database data = db.query(priceTomat).all() if not data: raise HTTPException(status_code=404, detail="Data harga tomat tidak ditemukan") # Konversi data ke DataFrame df = pd.DataFrame([{ "Tanggal": item.tanggal, "Pasar_Bandung": item.pasar_bandung, "Pasar_Ngunut": item.pasar_ngunut, "Pasar_Ngemplak": item.pasar_ngemplak, "Harga_Kemarin": item.ratarata_kemarin, "Harga_Sekarang": item.ratarata_sekarang } for item in data]) # Simpan data asli data_asli = df.to_dict(orient='records') # Cek apakah data cukup untuk diproses if df.shape[0] < 3: raise HTTPException(status_code=400, detail="Data tidak cukup untuk melakukan prediksi") # Preprocessing # Pastikan semua kolom numerik kolom_numerik = ['Pasar_Bandung', 'Pasar_Ngunut', 'Pasar_Ngemplak', 'Harga_Kemarin', 'Harga_Sekarang'] df[kolom_numerik] = df[kolom_numerik].apply(pd.to_numeric, errors='coerce') df[kolom_numerik] = df[kolom_numerik].replace(0, np.nan) # Interpolasi nilai kosong (0 yang sudah jadi NaN) df[kolom_numerik] = df[kolom_numerik].interpolate(method='linear', limit_direction='both') # Drop jika masih ada NaN (misalnya di ujung data) df.dropna(inplace=True) # df['Tanggal'] = pd.to_datetime(df['Tanggal']) # df.dropna(inplace=True) # Simpan hasil preprocessing hasil_preprocessing = df.to_dict(orient='records') # Normalisasi Data # scaler = MinMaxScaler() # df[['Pasar_Bandung', 'Pasar_Ngunut', 'Pasar_Ngemplak', 'Harga_Kemarin', 'Harga_Sekarang']] = scaler.fit_transform(df[['Pasar_Bandung', 'Pasar_Ngunut', 'Pasar_Ngemplak', 'Harga_Kemarin', 'Harga_Sekarang']]) scaler = StandardScaler() df[['Pasar_Bandung', 'Pasar_Ngunut', 'Pasar_Ngemplak', 'Harga_Kemarin', 'Harga_Sekarang']] = scaler.fit_transform(df[['Pasar_Bandung', 'Pasar_Ngunut', 'Pasar_Ngemplak', 'Harga_Kemarin', 'Harga_Sekarang']]) # Simpan hasil normalisasi hasil_normalisasi = df.to_dict(orient='records') # Split Data X = df[['Pasar_Bandung', 'Pasar_Ngunut', 'Pasar_Ngemplak', 'Harga_Kemarin']] y = df['Harga_Sekarang'] X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, shuffle=False) # Simpan hasil split data hasil_split_data = { "X_train": X_train.to_dict(orient='records'), "X_test": X_test.to_dict(orient='records'), "y_train": y_train.tolist(), "y_test": y_test.tolist() } if kernel == "linear": svr = SVR(kernel="linear", C=C, epsilon=epsilon) elif kernel == "rbf": svr = SVR(kernel="rbf", C=C, gamma=gamma, epsilon=epsilon) elif kernel == "sigmoid": svr = SVR(kernel="sigmoid", C=C, gamma=gamma, coef0=coef0, epsilon=epsilon) elif kernel == "poly": svr = SVR(kernel="poly", C=C, gamma=gamma, coef0=coef0, degree=degree, epsilon=epsilon) svr.fit(X_train, y_train) # Prediksi Harga y_pred = svr.predict(X_test) # Evaluasi Model mae = mean_absolute_error(y_test, y_pred) rmse = np.sqrt(mean_squared_error(y_test, y_pred)) mape = mean_absolute_percentage_error(y_test, y_pred) # Kembalikan skala data df_prediksi = df.iloc[len(X_train):].copy() # df_prediksi['Tanggal'] = df_prediksi['Tanggal'].dt.date df_prediksi['Harga_Prediksi'] = y_pred # Daftar kolom yang telah dinormalisasi cols_scaled = ['Pasar_Bandung', 'Pasar_Ngunut', 'Pasar_Ngemplak', 'Harga_Kemarin', 'Harga_Sekarang'] # Invers scaling satu per satu kolom berdasarkan mean dan std dari StandardScaler feature_names = scaler.feature_names_in_.tolist() # Invers Harga_Prediksi berdasarkan skala 'Harga_Sekarang' index_harga_sekarang = feature_names.index('Harga_Sekarang') mean_sekarang = scaler.mean_[index_harga_sekarang] std_sekarang = np.sqrt(scaler.var_[index_harga_sekarang]) df_prediksi['Harga_Prediksi'] = df_prediksi['Harga_Prediksi'] * std_sekarang + mean_sekarang df_prediksi['Harga_Prediksi'] = df_prediksi['Harga_Prediksi'].round(0) # Invers kolom lain yang tersedia di df_prediksi for kolom in cols_scaled: if kolom in df_prediksi.columns: index = feature_names.index(kolom) mean = scaler.mean_[index] std = np.sqrt(scaler.var_[index]) df_prediksi[kolom] = df_prediksi[kolom] * std + mean # Ambil nilai min dan max dari scaler # data_min = scaler.data_min_ # data_max = scaler.data_max_ # feature_names = scaler.feature_names_in_.tolist() # # Invers Harga_Prediksi berdasarkan skala 'Harga_Sekarang' # index_harga_sekarang = feature_names.index('Harga_Sekarang') # min_sekarang = data_min[index_harga_sekarang] # max_sekarang = data_max[index_harga_sekarang] # df_prediksi['Harga_Prediksi'] = df_prediksi['Harga_Prediksi'] * (max_sekarang - min_sekarang) + min_sekarang # df_prediksi['Harga_Prediksi'] = df_prediksi['Harga_Prediksi'].round(0) # # Invers kolom lain yang tersedia di df_prediksi # for kolom in cols_scaled: # if kolom in df_prediksi.columns: # index = feature_names.index(kolom) # min_val = data_min[index] # max_val = data_max[index] # df_prediksi[kolom] = df_prediksi[kolom] * (max_val - min_val) + min_val # Export atau tampilkan hasil hasil_prediksi = df_prediksi[['Tanggal', 'Pasar_Bandung', 'Pasar_Ngunut', 'Pasar_Ngemplak', 'Harga_Kemarin', 'Harga_Sekarang', 'Harga_Prediksi']].to_dict(orient='records') # Kembalikan semua hasil dalam JSON return { "Kernel_Digunakan": kernel, "Degree": degree if kernel == "poly" else None, "Coef0": coef0 if kernel in ["poly", "sigmoid"] else None, "C": C, "Gamma": gamma, "Epsilon": epsilon, "Data_Asli": data_asli, "Hasil_Preprocessing": hasil_preprocessing, "Hasil_Normalisasi": hasil_normalisasi, "Hasil_Split_Data": hasil_split_data, "Hasil_Prediksi": hasil_prediksi, "Evaluasi_Model": { "MAE": mae, "RMSE": rmse, "MAPE": mape } }