Spaces:

erayman09
/

bLoOd_AI

Sleeping

App Files Files Community

erayman09 commited on Dec 9, 2024

Commit

9e4acbd

verified ·

1 Parent(s): 60ea1bc

Update app.py

Browse files

Files changed (1) hide show

app.py +41 -17

app.py CHANGED Viewed

@@ -1,25 +1,49 @@
 import streamlit as st
 from PIL import Image
-import easyocr
-# Title of the App
-st.title("Image-to-Text Converter for Blood Test Reports")
-# Allow user to upload an image
-uploaded_image = st.file_uploader("Upload a Blood Test Report Image", type=["png", "jpg", "jpeg"])
-if uploaded_image is not None:
-    # Display the uploaded image
-    st.image(uploaded_image, caption="Uploaded Blood Test Report", use_container_width=True)
-    # Initialize EasyOCR Reader
-    st.write("Extracting text...")
-    reader = easyocr.Reader(['en'])  # Specify language
-    image = Image.open(uploaded_image)
-    # Perform OCR
-    extracted_text = reader.readtext(image, detail=0)  # Extract text without bounding box details
-    # Display the extracted text
-    st.subheader("Extracted Text:")
-    st.text("\n".join(extracted_text))

 import streamlit as st
 from PIL import Image
+import pytesseract
+import re
+import pandas as pd
+# Streamlit App
+st.title("Blood Test Report Parser")
+# File uploader
+uploaded_file = st.file_uploader("Upload a blood test report image", type=["jpg", "jpeg", "png"])
+if uploaded_file is not None:
+    # Display uploaded image
+    image = Image.open(uploaded_file)
+    st.image(image, caption="Uploaded Image", use_container_width=True)
+    # Extract text using Tesseract OCR
+    with st.spinner("Extracting text from image..."):
+        extracted_text = pytesseract.image_to_string(image)
+    st.text_area("Extracted Text", extracted_text, height=300)
+    # Regex Pattern for Parsing
+    pattern = r"(?P<component>[A-Za-z\s%]+?)\s+(?P<your_value>[\d.]+)\s+(?P<range>[\d.]+ - [\d.]+)\s+(?P<units>[\w/%]+)(?:\s+(?P<flag>[LH]))?"
+    # Parse Extracted Text
+    data = []
+    for match in re.finditer(pattern, extracted_text):
+        component = match.group("component").strip()
+        your_value = float(match.group("your_value"))
+        range_min, range_max = map(float, match.group("range").split(" - "))
+        units = match.group("units")
+        flag = match.group("flag") if match.group("flag") else "Normal"
+        data.append({
+            "Component": component,
+            "Your Value": your_value,
+            "Min": range_min,
+            "Max": range_max,
+            "Units": units,
+            "Flag": flag
+        })
+    # Convert to DataFrame
+    if data:
+        df = pd.DataFrame(data)
+        st.success("Parsed Data Successfully!")
+        st.dataframe(df)
+    else:
+        st.error("No valid data found in the extracted text.")