Spaces:

RathodHarish
/

HealthVoiceAnalyzer

Running

App Files Files Community

RathodHarish commited on Jun 23

Commit

b3db979

verified ·

1 Parent(s): dab2915

Update app.py

Browse files

Files changed (1) hide show

app.py +12 -43

app.py CHANGED Viewed

@@ -5,7 +5,6 @@ import torch
 from transformers import Wav2Vec2Processor, Wav2Vec2Model
 from simple_salesforce import Salesforce
 import os
-import hashlib
 from datetime import datetime
 # Salesforce credentials (store securely in environment variables)
@@ -30,68 +29,38 @@ except Exception as e:
 processor = Wav2Vec2Processor.from_pretrained("facebook/wav2vec2-base-960h")
 model = Wav2Vec2Model.from_pretrained("facebook/wav2vec2-base-960h")
-def compute_file_hash(file_path):
-    """Compute MD5 hash of a file to check uniqueness."""
-    hash_md5 = hashlib.md5()
-    with open(file_path, "rb") as f:
-        for chunk in iter(lambda: f.read(4096), b""):
-            hash_md5.update(chunk)
-    return hash_md5.hexdigest()
 def analyze_voice(audio_file):
     """Analyze voice for health indicators."""
     try:
-        # Log audio file info
-        file_hash = compute_file_hash(audio_file)
-        print(f"Processing audio file: {audio_file}, Hash: {file_hash}")
         # Load audio file
         audio, sr = librosa.load(audio_file, sr=16000)
-        audio = audio / (np.max(np.abs(audio)) + 1e-10)  # Normalize audio
-        print(f"Audio shape: {audio.shape}, Sampling rate: {sr}, Duration: {len(audio)/sr:.2f}s, Mean: {np.mean(audio):.4f}, Std: {np.std(audio):.4f}")
         # Process audio for Wav2Vec2
         inputs = processor(audio, sampling_rate=16000, return_tensors="pt", padding=True)
-        print(f"Input tensor shape: {inputs['input_values'].shape}, Sample values: {inputs['input_values'][0][:5]}")
         with torch.no_grad():
             outputs = model(**inputs)
-        # Extract features
-        features = outputs.last_hidden_state.numpy()  # Use full hidden states
-        print(f"Features shape: {features.shape}, Sample values: {features[0, 0, :5]}")
-        # Compute scores
-        respiratory_score = np.mean(features, axis=(1, 2))
-        mental_health_score = np.std(features, axis=(1, 2))
-        # Log scores
-        print(f"Respiratory Score: {respiratory_score:.4f}, Mental Health Score: {mental_health_score:.4f}")
-        # Threshold-based feedback
         feedback = ""
-        if respiratory_score > 0.1:
-            feedback += f"Possible respiratory issue detected (score: {respiratory_score:.4f}); consult a doctor. "
-        if mental_health_score > 0.2:  # Raised from 0.1 to reduce false positives
-            feedback += f"Possible stress indicators detected (score: {mental_health_score:.4f}); consider professional advice. "
         if not feedback:
             feedback = "No significant health indicators detected."
-        feedback += f"\n\n**Debug Info**: Respiratory Score = {respiratory_score:.4f}, Mental Health Score = {mental_health_score:.4f}, File Hash = {file_hash}"
-        feedback += "\n**Disclaimer**: This is not a diagnostic tool. Consult a healthcare provider for medical advice."
         # Store in Salesforce
         if sf:
             store_in_salesforce(audio_file, feedback, respiratory_score, mental_health_score)
-        # Clean up temporary audio file
-        try:
-            os.remove(audio_file)
-            print(f"Deleted temporary audio file: {audio_file}")
-        except Exception as e:
-            print(f"Failed to delete audio file: {str(e)}")
         return feedback
     except Exception as e:
         return f"Error processing audio: {str(e)}"
@@ -111,7 +80,7 @@ def store_in_salesforce(audio_file, feedback, respiratory_score, mental_health_s
 def test_with_sample_audio():
     """Test the app with a sample audio file."""
-    sample_audio_path = "audio_samples/sample.wav"
     if os.path.exists(sample_audio_path):
         return analyze_voice(sample_audio_path)
     return "Sample audio file not found."
@@ -126,5 +95,5 @@ iface = gr.Interface(
 )
 if __name__ == "__main__":
-    print(test_with_sample_audio())
     iface.launch(server_name="0.0.0.0", server_port=7860)

 from transformers import Wav2Vec2Processor, Wav2Vec2Model
 from simple_salesforce import Salesforce
 import os
 from datetime import datetime
 # Salesforce credentials (store securely in environment variables)
 processor = Wav2Vec2Processor.from_pretrained("facebook/wav2vec2-base-960h")
 model = Wav2Vec2Model.from_pretrained("facebook/wav2vec2-base-960h")
 def analyze_voice(audio_file):
     """Analyze voice for health indicators."""
     try:
         # Load audio file
         audio, sr = librosa.load(audio_file, sr=16000)
         # Process audio for Wav2Vec2
         inputs = processor(audio, sampling_rate=16000, return_tensors="pt", padding=True)
         with torch.no_grad():
             outputs = model(**inputs)
+        # Extract features (simplified for demo)
+        features = outputs.last_hidden_state.mean(dim=1).numpy()
+        # Adjusted thresholds for testing (lower to trigger feedback)
+        respiratory_score = np.mean(features)  # Mock score
+        mental_health_score = np.std(features)  # Mock score
         feedback = ""
+        if respiratory_score > 0.1:  # Lowered from 0.5
+            feedback += "Possible respiratory issue detected; consult a doctor. "
+        if mental_health_score > 0.1:  # Lowered from 0.3
+            feedback += "Possible stress indicators detected; consider professional advice. "
         if not feedback:
             feedback = "No significant health indicators detected."
+        feedback += "\n\n**Disclaimer**: This is not a diagnostic tool. Consult a healthcare provider for medical advice."
         # Store in Salesforce
         if sf:
             store_in_salesforce(audio_file, feedback, respiratory_score, mental_health_score)
         return feedback
     except Exception as e:
         return f"Error processing audio: {str(e)}"
 def test_with_sample_audio():
     """Test the app with a sample audio file."""
+    sample_audio_path = "audio_samples/sample.wav"  # Or "audio_samples/common_voice_sample.wav"
     if os.path.exists(sample_audio_path):
         return analyze_voice(sample_audio_path)
     return "Sample audio file not found."
 )
 if __name__ == "__main__":
+    print(test_with_sample_audio())  # Run test on startup
     iface.launch(server_name="0.0.0.0", server_port=7860)