Spaces:

v1shal
/

News_Summarisation_and_Sentiment_Analysis

Running

App Files Files Community

News_Summarisation_and_Sentiment_Analysis / approach_library /utils /comparative_analysis.py

v1shal

first_commit

b396e94 21 days ago

raw

history blame contribute delete

3.48 kB


	import json
	from collections import Counter

	def comparative_sentiment_analysis(company, articles, max_comparisons=10, chunk_size=5):
	"""
	Perform a comparative sentiment analysis on multiple articles.
	"""
	overall_sentiment_counts = Counter()
	overall_coverage_differences = []
	all_topics = []

	if not articles:
	print("No articles found for analysis.")
	return {
	"Company": company,
	"Articles": [],
	"Comparative Sentiment Score": {
	"Sentiment Distribution": {},
	"Coverage Differences": [],
	"Topic Overlap": {"Common Topics": [], "Unique Topics Per Article": []}
	},
	"Final Sentiment Analysis": "No data available."
	}

	# Process articles in chunks
	for start in range(0, len(articles), chunk_size):
	chunk = articles[start:start + chunk_size]

	# Count sentiment distribution
	sentiment_counts = Counter(article["Sentiment"] for article in chunk)
	overall_sentiment_counts.update(sentiment_counts)

	# Identify coverage differences
	for i in range(len(chunk) - 1):
	for j in range(i + 1, len(chunk)):
	if len(overall_coverage_differences) >= max_comparisons:
	break
	article1, article2 = chunk[i], chunk[j]
	comparison = {
	"Comparison": f"'{article1.get('Title', 'Article 1')}' vs '{article2.get('Title', 'Article 2')}'",
	"Impact": f"{article1.get('Topics', [])} vs {article2.get('Topics', [])}"
	}
	overall_coverage_differences.append(comparison)

	# Extract topics ensuring valid lists
	topics = [set(article.get("Topics", [])) for article in chunk if isinstance(article.get("Topics", list), list) and article.get("Topics", [])]
	all_topics.extend(topics)

	# Debugging Output
	print("All Topics Extracted:", all_topics)

	# Determine common and unique topics
	if len(all_topics) == 0:
	common_topics = set() # No topics found
	elif len(all_topics) == 1:
	common_topics = all_topics[0] # Only one article, take its topics as common
	else:
	common_topics = set.intersection(*all_topics) # Find intersection normally

	unique_topics = [{"Article": i + 1, "Unique Topics": list(topics - common_topics)}
	for i, topics in enumerate(all_topics)]

	# Convert to list for JSON output
	common_topics = list(common_topics)

	print("Common Topics:", common_topics)

	# Final sentiment summary
	final_analysis = "The news coverage is mostly "
	if overall_sentiment_counts["Positive"] > overall_sentiment_counts["Negative"]:
	final_analysis += "positive, indicating potential growth."
	elif overall_sentiment_counts["Negative"] > overall_sentiment_counts["Positive"]:
	final_analysis += "negative, suggesting challenges ahead."
	else:
	final_analysis += "balanced, with mixed reactions."


	return {
	"Comparative Sentiment Score": {
	"Sentiment Distribution": dict(overall_sentiment_counts),
	"Coverage Differences": overall_coverage_differences,
	"Topic Overlap": {
	"Common Topics": common_topics,
	"Unique Topics Per Article": unique_topics
	}
	},
	"Final Sentiment Analysis": final_analysis
	}