Spaces:

rushankg
/

test-streamlit

Sleeping

File size: 3,088 Bytes

17d7d2e
 
 
efda6d0
8970242
17d7d2e
 
bf3fe21
 
17d7d2e
1303ac0
17d7d2e
 
c077474
17d7d2e
 
56a13a2
17d7d2e
 
 
 
 
 
 
 
 
 
94fc387
fc60bd5
 
bc648c2
ba18f11
fc60bd5
17d7d2e
2815635
912fc79
bd80b62
4ec5d64
7cdbd6f
73a25a9
011e348
73a25a9
1907c60
94fc387
 
28831ec
9cc277c
2b57cad
 
f68a5ef
bf3fe21
4ec5d64
bf3fe21
 
 
fc60bd5
 
bf3fe21
94fc387
 
28831ec
bf3fe21
2b57cad
 
bf3fe21

import streamlit as st
import pickle
import pandas as pd
import torch
import numpy as np

cosine_scores = pickle.load(open('cosine_scores.pkl','rb'))
coursedf = pd.read_pickle('course_df.pkl')          # course_df uses titles to generate course recommendations
course_df_new = pd.read_pickle('course_df_new.pkl') #course_df_new makes recommendations using the entire description

course_title_list = [i + ": " + j for i, j in zip(coursedf['ref'].to_list(), coursedf['title'].to_list())]

def get_random_course():
    row=coursedf.sample(1)
    return row['ref'], row['title'] 

def recommend(index):
    pairs = {}

    for i in range(len(coursedf)):
        pairs[coursedf.iloc[i,1]]=cosine_scores[index][i]

    sorttemp = sorted(pairs.items(), key=lambda x:x[1], reverse=True)
    sorted_final = dict(sorttemp[1:31])

    return list(sorted_final.keys())

st.set_page_config(page_title='DiscoverCourses', page_icon=':bird:')
st.header('DiscoverCourses')
st.markdown('#')
st.write('© 2023 Rushank Goyal. All rights reserved. Source for the all-MiniLM-L6-v2 model: Wang, Wenhui, et al. "MiniLM: Deep Self-Attention Distillation for Task-Agnostic Compression of Pre-Trained Transformers." arXiv, 25 Feb. 2020, doi:10.48550/arXiv.2002.10957.')

selected_course = st.selectbox('Pick a course from the dropdown:',course_title_list)

container = st.container()
maincol1, maincol2 = container.columns(2)

if maincol1.button('Recommend by title',use_container_width=True):
    output=recommend(np.where((coursedf['ref']+": "+coursedf['title']) == selected_course)[0][0])
    for result in output:
        index=np.where(coursedf['title'] == result)[0][0]
        course_id=coursedf.iloc[index,0]
        st.subheader(course_id+": "+result)
        with st.expander("See description"):
            st.write(course_df_new.iloc[index,3]) #Using the new coursedf because it has proper descriptions for each course
        link = "[ExploreCourses](https://explorecourses.stanford.edu/search?q="+course_id+"+"+result.replace(" ","+")+")"
        st.markdown(link, unsafe_allow_html=True)
        link = "https://carta-beta.stanford.edu/results/"+course_id
        st.markdown(link, unsafe_allow_html=True)
        st.divider()
        
if maincol2.button('Recommend by description',use_container_width=True):
    index_new=np.where((coursedf['ref']+": "+coursedf['title']) == selected_course)[0][0]
    rec_list=course_df_new.iloc[index_new,2]
    for result in rec_list:
        index=np.where(coursedf['title'] == result)[0][0]
        course_id=coursedf.iloc[index,0]
        st.subheader(course_id+": "+result)
        with st.expander("See description"):
            st.write(course_df_new.iloc[index_new,3]) #Using the new coursedf because it has proper descriptions for each course
        link = "[ExploreCourses](https://explorecourses.stanford.edu/search?q="+course_id+"+"+result.replace(" ","+")+")"
        st.markdown(link, unsafe_allow_html=True)
        link = "https://carta-beta.stanford.edu/results/"+course_id
        st.markdown(link, unsafe_allow_html=True)
        st.divider()