Spaces:

root16285
/

cough_ai

Runtime error

QnxprU69yCNg8XJ commited on 12 days ago

Commit

44626f7

1 Parent(s): 0d28e32

we can start now

Files changed (6) hide show

.gitattributes CHANGED Viewed

@@ -33,3 +33,4 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text

 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
+root_env filter=lfs diff=lfs merge=lfs -text

app.py CHANGED Viewed

@@ -1,11 +1,22 @@
-from fastapi import FastAPI
 app = FastAPI()
 @app.get("/")
-def greet_json():
     return {"Hello": "World!"}
-# To run the app, use the command:

+from fastapi import FastAPI, File, UploadFile
+from utils.preprocessing import load_audio
+from utils.inference import get_embeddings, predict_risk
 app = FastAPI()
 @app.get("/")
+def hello():
     return {"Hello": "World!"}
+@app.post("/predict")
+async def predict(file: UploadFile = File(...)):
+    temp_path = f"/tmp/{file.filename}"
+    with open(temp_path, "wb") as f:
+        f.write(await file.read())
+    waveform, sr = load_audio(temp_path)
+    embeddings = get_embeddings(waveform, sr)
+    score = predict_risk(embeddings)
+    return {"risk_score": score}

notebooks/quick_start.ipynb ADDED Viewed

File without changes

requirements.txt CHANGED Viewed

@@ -1,2 +1,6 @@
 fastapi
 uvicorn[standard]

 fastapi
 uvicorn[standard]
+torch
+torchaudio
+numpy
+transformers

utils/inference.py ADDED Viewed

+import torch
+from transformers import AutoFeatureExtractor, AutoModel
+# Charger HeAR depuis Hugging Face
+MODEL_NAME = "google/hear"
+feature_extractor = AutoFeatureExtractor.from_pretrained(MODEL_NAME)
+hear_model = AutoModel.from_pretrained(MODEL_NAME)
+hear_model.eval()
+def get_embeddings(waveform, sr):
+    """
+    Transforme un audio en embeddings HeAR
+    """
+    # Transformer waveform en input pour HeAR
+    inputs = feature_extractor(waveform, sampling_rate=sr, return_tensors="pt")
+    with torch.no_grad():
+        embeddings = hear_model(**inputs).last_hidden_state
+    # embeddings : (batch, sequence, features)
+    return embeddings
+def predict_risk(embeddings):
+    """
+    Pour le moment : score factice basé sur la norme L2 des embeddings
+    Plus tard : utiliser ton classifieur pneumonie
+    """
+    score = torch.norm(embeddings, dim=-1).mean().item()
+    return score

utils/preprocessing.py ADDED Viewed

+import torchaudio
+def load_audio(file_path, target_sr=16000):
+    waveform, sr = torchaudio.load(file_path)
+    if sr != target_sr:
+        waveform = torchaudio.transforms.Resample(orig_freq=sr, new_freq=target_sr)(waveform)
+    return waveform, target_sr