Spaces:

saattrupdan
/

foqa-validation

Sleeping

App Files Files Community

saattrupdan commited on Feb 21

Commit

fc538a4

verified ·

1 Parent(s): 13cd28e

Update app.py

Browse files

Files changed (1) hide show

app.py +14 -11

app.py CHANGED Viewed

@@ -7,7 +7,6 @@ import gradio as gr
 from datasets import Dataset, load_dataset
 import logging
 import pandas as pd
-import os
 from dotenv import load_dotenv
 load_dotenv()
@@ -16,12 +15,15 @@ logging.basicConfig(level=logging.INFO)
 logger = logging.getLogger("foqa")
-dataset = load_dataset(
-    "alexandrainst/foqa", split="train", token=os.getenv("HF_HUB_TOKEN")
-)
 assert isinstance(dataset, Dataset)
 df = pd.DataFrame(dataset.to_pandas())
 def non_validated_samples() -> Generator[tuple[str, str, str], None, None]:
     """Iterate over non-validated samples in the FoQA dataset.
@@ -33,12 +35,16 @@ def non_validated_samples() -> Generator[tuple[str, str, str], None, None]:
         if sample.validation is None:
             yield str(idx), sample.question, sample.answers["text"][0]
 itr = non_validated_samples()
 def main():
-    idx, question, answer = next(itr)
     with gr.Blocks(theme="monochrome", title="FoQA validation") as demo:
         gr.Markdown("""
@@ -79,10 +85,7 @@ def main():
         )
         save_results_btn.click(fn=save_results)
-    auth = [
-        ("admin", os.environ["ADMIN_PASSWORD"]),
-        ("annika", os.environ["ANNIKA_PASSWORD"]),
-    ]
     demo.launch(auth=auth)
@@ -91,7 +94,7 @@ def save_results() -> None:
     logger.info("Saving results...")
     gr.Info(message="Saving results...")
     Dataset.from_pandas(df, preserve_index=False).push_to_hub(
-        repo_id="alexandrainst/foqa", token=os.getenv("HF_HUB_TOKEN")
     )
     gr.Info(message="Saved results!")
     logger.info("Saved results.")
@@ -179,4 +182,4 @@ def assign_incorrect_answer(
 if __name__ == "__main__":
-    main()

 from datasets import Dataset, load_dataset
 import logging
 import pandas as pd
 from dotenv import load_dotenv
 load_dotenv()
 logger = logging.getLogger("foqa")
+dataset = load_dataset("alexandrainst/foqa", split="train")
 assert isinstance(dataset, Dataset)
 df = pd.DataFrame(dataset.to_pandas())
+logger.info(
+    f"Loaded dataset with {len(df)} samples, where "
+    f"{len(df) - df.validation.isnull().sum()} are validated."
+)
 def non_validated_samples() -> Generator[tuple[str, str, str], None, None]:
     """Iterate over non-validated samples in the FoQA dataset.
         if sample.validation is None:
             yield str(idx), sample.question, sample.answers["text"][0]
+    # Yield example at the end
+    sample = df.iloc[0]
+    yield str(0), sample.question, sample.answers["text"][0]
 itr = non_validated_samples()
 def main():
+    idx, question, answer = next(itr, ("All samples are validated!", "", ""))
     with gr.Blocks(theme="monochrome", title="FoQA validation") as demo:
         gr.Markdown("""
         )
         save_results_btn.click(fn=save_results)
+    auth = [("admin", os.environ["ADMIN_PASSWORD"])]
     demo.launch(auth=auth)
     logger.info("Saving results...")
     gr.Info(message="Saving results...")
     Dataset.from_pandas(df, preserve_index=False).push_to_hub(
+        repo_id="alexandrainst/foqa"
     )
     gr.Info(message="Saved results!")
     logger.info("Saved results.")
 if __name__ == "__main__":
+    main()