Spaces:

bacancydataprophets
/

Insurance_Fraud_Detection

Sleeping

App Files Files Community

Insurance_Fraud_Detection / app.py

kothariyashhh

Update app.py

c115711 verified 9 months ago

raw

history blame contribute delete

5.67 kB

	import streamlit as st
	import pandas as pd
	import numpy as np
	import joblib
	from sklearn.preprocessing import LabelEncoder

	class FraudDetectionApp:
	def __init__(self):
	self.model = joblib.load('model/only_model.joblib')

	# Assuming the model has an attribute 'feature_names_in_' which stores the feature names used during training
	self.feature_names = self.model.feature_names_in_ if hasattr(self.model, 'feature_names_in_') else [
	'incident_severity', 'insured_hobbies', 'total_claim_amount', 'months_as_customer', 'policy_annual_premium',
	'incident_date', 'capital-loss', 'capital-gains', 'insured_education_level', 'incident_city'
	]

	self.categorical_columns = ['incident_severity', 'insured_hobbies', 'insured_education_level', 'incident_city']
	self.encoders = {col: LabelEncoder() for col in self.categorical_columns}
	self.fit_encoders()

	def fit_encoders(self):
	# Example unique values for fitting the encoders
	example_data = {
	'incident_severity': ['Minor Damage', 'Major Damage', 'Total Loss', 'Trivial Damage'],
	'insured_hobbies': ['sleeping', 'reading', 'board-games', 'bungie-jumping', 'base-jumping', 'golf', 'camping', 'dancing', 'skydiving', 'movies', 'hiking', 'yachting', 'paintball', 'chess', 'kayaking', 'polo', 'basketball', 'video-games', 'cross-fit', 'exercise'],
	'insured_education_level': ['MD', 'PhD', 'Associate', 'Masters', 'High School', 'College', 'JD'],
	'incident_city': ['Columbus', 'Riverwood', 'Arlington', 'Springfield', 'Hillsdale', 'Northbend', 'Northbrook']
	}
	for col in self.categorical_columns:
	self.encoders[col].fit(example_data[col])

	def preprocess_single_data(self, data):
	if not isinstance(data, pd.DataFrame):
	data = pd.DataFrame(data, index=[0])
	for col in self.categorical_columns:
	if col in data.columns:
	data[col] = self.encoders[col].transform(data[col])
	# Ensure the column order matches the training data
	data = data[self.feature_names]
	return data

	def predict_single_fraud(self, data):
	data_processed = self.preprocess_single_data(data)
	prediction = self.model.predict(data_processed)[0]
	return prediction

	def run(self):
	st.title('Insurance Fraud Prediction')

	# Input fields
	incident_severity = st.selectbox('Incident Severity', ['Minor Damage', 'Major Damage', 'Total Loss', 'Trivial Damage'])
	insured_hobbies = st.selectbox('Insured Hobbies', ['sleeping', 'reading', 'board-games', 'bungie-jumping', 'base-jumping', 'golf', 'camping', 'dancing', 'skydiving', 'movies', 'hiking', 'yachting', 'paintball', 'chess', 'kayaking', 'polo', 'basketball', 'video-games', 'cross-fit', 'exercise'])
	total_claim_amount = st.number_input('Total Claim Amount')
	months_as_customer = st.number_input('Months as Customer')
	policy_annual_premium = st.number_input('Policy Annual Premium')
	incident_date = st.number_input('Incident Date', min_value=1, max_value=31, step=1)
	capital_loss = st.number_input('Capital Loss')
	capital_gains = st.number_input('Capital Gains')
	insured_education_level = st.selectbox('Insured Education Level', ['MD', 'PhD', 'Associate', 'Masters', 'High School', 'College', 'JD'])
	incident_city = st.selectbox('Incident City', ['Columbus', 'Riverwood', 'Arlington', 'Springfield', 'Hillsdale', 'Northbend', 'Northbrook'])

	# Collecting user input
	new_data_point = {
	'incident_severity': incident_severity,
	'insured_hobbies': insured_hobbies,
	'total_claim_amount': total_claim_amount,
	'months_as_customer': months_as_customer,
	'policy_annual_premium': policy_annual_premium,
	'incident_date': incident_date,
	'capital-loss': capital_loss,
	'capital-gains': capital_gains,
	'insured_education_level': insured_education_level,
	'incident_city': incident_city,
	}

	# Prediction button
	if st.button('Predict'):
	prediction = self.predict_single_fraud(new_data_point)
	if prediction == 0:
	st.write('The applied application is not fraud.')
	else:
	st.write('The applied application is fraud.')

	# Generate sample data
	if st.button('Generate Sample Data'):
	sample_non_fraud = self.generate_sample_data(fraud=False)
	sample_fraud = self.generate_sample_data(fraud=True)
	st.write("Non-Fraud Sample Data:")
	st.write(sample_non_fraud)
	st.write("Fraud Sample Data:")
	st.write(sample_fraud)

	def generate_sample_data(self, fraud=False):
	sample_data = {
	'incident_severity': ['Major Damage' if fraud else 'Minor Damage'],
	'insured_hobbies': ['skydiving' if fraud else 'reading'],
	'total_claim_amount': [50000 if fraud else 1000],
	'months_as_customer': [1 if fraud else 60],
	'policy_annual_premium': [10000 if fraud else 200],
	'incident_date': [15],
	'capital-loss': [1000 if fraud else 0],
	'capital-gains': [5000 if fraud else 0],
	'insured_education_level': ['PhD' if fraud else 'College'],
	'incident_city': ['Riverwood' if fraud else 'Northbrook']
	}
	return pd.DataFrame(sample_data)

	if __name__ == '__main__':
	app = FraudDetectionApp()
	app.run()