Spaces:

Sebasur90
/

observatorio_noticias

Runtime error

App Files Files Community

observatorio_noticias / app.py

Sebasur90

Update app.py

6c2d890 over 2 years ago

raw

history blame

5.91 kB

	import streamlit as st
	import plotly.express as px
	import pandas as pd
	from wordcloud import WordCloud
	import matplotlib.pyplot as plt
	from scrapper_rss import Scrapper
	import datetime as dt

	st.set_option('deprecation.showPyplotGlobalUse', False)

	scrapper = Scrapper()

	noticias = pd.read_csv('./diarios_historicos.csv')
	noticias=noticias.drop('descripcion' ,axis=1)
	fechas = pd.read_csv('./fechas.csv')

	diarios = list(noticias.diario.unique())
	secciones = list(noticias.seccion.unique())
	columna_para_nube = ['titulo', 'descripcion']

	st.set_page_config(
	page_title="Observatorio de noticias",
	initial_sidebar_state="expanded"
	)


	with st.sidebar:
	st.write("Creado por [sebasur90](https://www.linkedin.com/in/sebastian-rodriguez-9b417830/)")

	diarios_select = st.multiselect('Selecciona los diarios',
	diarios, default=diarios)
	secciones_select = st.multiselect('Selecciona las secciones',
	secciones, default=secciones)
	palabra_buscada = st.text_input('Buscar palabra', 'Ninguna')

	if st.button('Actualizar Diarios'):
	dia_str = str(dt.datetime.today().date())
	if fechas.iloc[-1]['dia'] == dia_str:
	st.success("Las noticias ya estan actualizadas")
	pass
	else:
	with st.spinner('Actualizando los siguientes diarios..'):
	scrapper.run()
	st.write("Se actualizaron las noticias")




	if palabra_buscada == "Ninguna" or palabra_buscada == "":
	st.title("Observatorio de Noticias")
	st.write("""

	Hola! Bienvenido a la aplicación de análisis de sentimientos en las noticias. Esta aplicación extrae las noticias de algunos de los diarios mas
	importantes del país ( a traves del RSS) y realiza un analisis de sentimientos sobre los titulos de cada una.
	La app permite filtrar por palabra clave y generar una nube de palabras con los resultados

	De acuerdo al sentimiento analizado sobre cada noticia encontraremos 3 grupos:

	Sentimiento Positivo: "YPF aumentó la distribución de gasoil y aseguró que el campo tiene garantizado el abastecimiento"
	Probabilidades: NEGATIVA=0.008 --- NEUTRA 0.43 --- POSITIVA 0.56 (GANADOR --> POSITIVA)


	Sentimiento Neutro: "El aeroclub de Comodoro Rivadavia celebró su 87° aniversario"
	Probabilidades: NEGATIVA=0.02 --- NEUTRA 0.67 --- POSITIVA 0.30 (GANADOR --> NEUTRA)

	Sentimiento Negativo: "Crecen las expectativas de inflación del mercado"
	Probabilidades: NEGATIVA=0.60 --- NEUTRA 0.37 --- POSITIVA 0.15 (GANADOR --> NEGATIVA)

	""")



	pass
	else:
	#st.title("Observatorio de Noticias")
	st.header(f"Resultados para : {palabra_buscada}")

	noticias = noticias[noticias['titulo'].str.contains(palabra_buscada)]

	st.session_state['dataframe_filtrado'] = noticias[(noticias.diario.isin(
	diarios_select)) & (noticias.seccion.isin(secciones_select))]

	st.subheader("Muestra aleatoria de noticias")
	st.dataframe(st.session_state['dataframe_filtrado'].sample(frac=1))
	st.session_state['dataframe_agrupado'] = st.session_state['dataframe_filtrado'].groupby(
	'diario')[['pond_negativos', 'pond_neutro', 'pond_positivo']].mean().reset_index()

	fig = px.bar(st.session_state['dataframe_agrupado'], x="diario", y=['pond_neutro', "pond_negativos", 'pond_positivo'], text_auto=True,
	title=f"Analisis de sentimientos para las noticias seleccionadas según el diario"
	)

	newnames = {'pond_neutro':'NEUTRAL', 'pond_negativos': 'NEGATIVA','pond_positivo': 'POSITIVA'}
	fig.for_each_trace(lambda t: t.update(name = newnames[t.name],
	legendgroup = newnames[t.name],
	hovertemplate = t.hovertemplate.replace(t.name, newnames[t.name])
	)
	)
	fig.update_layout(
	xaxis_title="Diarios",
	yaxis_title="Probabilidades (de 0 a 1)",

	)
	fig.update_layout(legend_title_text='Probabilidades')

	st.plotly_chart(fig)


	def transforma_letras_para_wordcloud(dataframe_noticias):
	columna_analizada = list(dataframe_noticias['titulo'])
	acentos = {'á': 'a', 'é': 'e', 'í': 'i', 'ó': 'o', 'ú': 'u',
	'Á': 'A', 'E': 'E', 'Í': 'I', 'Ó': 'O', 'Ú': 'U'}
	lista_palabras_para_wordcloud = []
	for palabras in columna_analizada:
	palabras_div = palabras.split(' ')
	for letras in palabras_div:
	for acen in acentos:
	if acen in letras:
	letras = letras.replace(acen, acentos[acen])
	lista_palabras_para_wordcloud.append(letras.lower())
	return ' '.join(lista_palabras_para_wordcloud)


	def genera_wordcloud(dataframe_noticias):
	palabras_para_wordcloud = transforma_letras_para_wordcloud(
	dataframe_noticias)
	palabras_ignoradas = set(['a', 'ante', 'con', 'contra', 'de', 'desde', 'durante', 'en', 'para', 'por', 'segun', 'sin', 'sobre', 'el', 'la', 'los', 'las',
	'...', 'y', 'hoy', 'este', 'cuanto', 'un', 'del', 'las', 'que', 'con', 'todos', 'es', '¿qué', 'como', 'cada',
	'jueves', '¿cuanto', 'hoy', 'al', 'cual', 'se', 'su', 'sus', 'lo', 'una', 'un', 'tiene',
	'le', 'habia'])

	wordcloud = WordCloud(width=1920, height=1080, stopwords=palabras_ignoradas).generate(
	palabras_para_wordcloud)
	plt.imshow(wordcloud, interpolation='bilinear')
	plt.axis("off")
	st.pyplot()


	if st.button('Generar Nube'):
	genera_wordcloud(st.session_state['dataframe_filtrado'])
	else:
	pass