Spaces:

Kamarov
/

ts_explorer

Sleeping

App Files Files Community

Liu Yiwen commited on Jan 26

Commit

1c081e2

1 Parent(s): 40e5362

增加了根据起止位置绘图和统计的功能

Browse files

Files changed (3) hide show

__pycache__/utils.cpython-311.pyc +0 -0
app.py +8 -6
utils.py +9 -3

__pycache__/utils.cpython-311.pyc CHANGED Viewed

Binary files a/__pycache__/utils.cpython-311.pyc and b/__pycache__/utils.cpython-311.pyc differ

app.py CHANGED Viewed

@@ -267,9 +267,9 @@ with gr.Blocks() as demo:
         with gr.Column(scale=3):
             plot = gr.Plot()
     with gr.Row():
-        user_input_box = gr.Textbox(placeholder="输入一些内容", label="输入", lines=5, interactive=True)
-        user_output_box = gr.Textbox(label="回答", lines=5, interactive=False)
-    user_io_buttom = gr.Button("发送", interactive=True)
     # componets.append({"select_sample_box": select_sample_box,
     #                   "statistics_textbox": statistics_textbox,
     #                   "user_input_box": user_input_box,
@@ -299,11 +299,13 @@ with gr.Blocks() as demo:
                 ret[plot] = gr.update(value=create_plot(df_list, id_list))
             elif dataset == 'YY26/TS_DATASETS':
                 df, max_page, info = get_page(dataset, config, split, page)
                 lotsa_config, lotsa_split, lotsa_page = 'traffic_hourly', 'train', eval(df['ts_id'][0])
                 # lotsa_subtargets = eval(df['target_id'][0])
                 df_list, id_list = process_salesforce_data('Salesforce/lotsa_data', lotsa_config, lotsa_split, lotsa_page, [1])
-                ret[statistics_textbox] = gr.update(value=create_statistic(df_list, id_list))
-                ret[plot] = gr.update(value=create_plot(df_list, id_list))
                 ret[user_input_box] = gr.update(value=df['question'][0])
                 ret[user_output_box] = gr.update(value=df['answer'][0])
             else:
@@ -380,7 +382,7 @@ with gr.Blocks() as demo:
     cp_split.change(show_dataset_at_config_and_split, inputs=[cp_dataset, cp_config, cp_split], outputs=all_outputs)
     cp_goto_page.click(show_dataset_at_config_and_split_and_page, inputs=[cp_dataset, cp_config, cp_split, cp_page], outputs=all_outputs)
     cp_goto_next_page.click(show_dataset_at_config_and_split_and_next_page, inputs=[cp_dataset, cp_config, cp_split, cp_page], outputs=all_outputs)
-    user_io_buttom.click(send_msg_to_server, inputs=[user_input_box], outputs=[user_output_box])
     # select_buttom.click(show_dataset_at_config_and_split_and_page, inputs=[cp_dataset, cp_config, cp_split, select_sample_box, select_subtarget_box], outputs=all_outputs)

         with gr.Column(scale=3):
             plot = gr.Plot()
     with gr.Row():
+        user_input_box = gr.Textbox(label="question", interactive=False)
+        user_output_box = gr.Textbox(label="answer", interactive=False)
+    # user_io_buttom = gr.Button("发送", interactive=True)
     # componets.append({"select_sample_box": select_sample_box,
     #                   "statistics_textbox": statistics_textbox,
     #                   "user_input_box": user_input_box,
                 ret[plot] = gr.update(value=create_plot(df_list, id_list))
             elif dataset == 'YY26/TS_DATASETS':
                 df, max_page, info = get_page(dataset, config, split, page)
+                # TODO: 修改lotsa_config的读取逻辑
                 lotsa_config, lotsa_split, lotsa_page = 'traffic_hourly', 'train', eval(df['ts_id'][0])
+                start_index, end_index = df['start_index'][0], df['end_index'][0]
                 # lotsa_subtargets = eval(df['target_id'][0])
                 df_list, id_list = process_salesforce_data('Salesforce/lotsa_data', lotsa_config, lotsa_split, lotsa_page, [1])
+                ret[statistics_textbox] = gr.update(value=create_statistic(df_list, id_list, interval=[start_index, end_index]))
+                ret[plot] = gr.update(value=create_plot(df_list, id_list, interval=[start_index, end_index]))
                 ret[user_input_box] = gr.update(value=df['question'][0])
                 ret[user_output_box] = gr.update(value=df['answer'][0])
             else:
     cp_split.change(show_dataset_at_config_and_split, inputs=[cp_dataset, cp_config, cp_split], outputs=all_outputs)
     cp_goto_page.click(show_dataset_at_config_and_split_and_page, inputs=[cp_dataset, cp_config, cp_split, cp_page], outputs=all_outputs)
     cp_goto_next_page.click(show_dataset_at_config_and_split_and_next_page, inputs=[cp_dataset, cp_config, cp_split, cp_page], outputs=all_outputs)
+    # user_io_buttom.click(send_msg_to_server, inputs=[user_input_box], outputs=[user_output_box])
     # select_buttom.click(show_dataset_at_config_and_split_and_page, inputs=[cp_dataset, cp_config, cp_split, select_sample_box, select_subtarget_box], outputs=all_outputs)

utils.py CHANGED Viewed

@@ -52,12 +52,14 @@ def flatten_ndarray_column(df, column_name, rows_to_include):
     return df
-def create_plot(dfs:list[pd.DataFrame], ids:list[str]):
     """
     创建一个包含所有传入 DataFrame 的线图。
     """
     fig = go.Figure()
     for df, df_id in zip(dfs, ids):
         for i, column in enumerate(df.columns[1:]):
             fig.add_trace(go.Scatter(
                 x=df[df.columns[0]],
@@ -82,13 +84,16 @@ def create_plot(dfs:list[pd.DataFrame], ids:list[str]):
     )
     return fig
-def create_statistic(dfs: list[pd.DataFrame], ids: list[str]):
     """
     计算数据集列表的统计信息。
     """
     stats_list = []
     for df, id in zip(dfs, ids):
         df_values = df.iloc[:, 1:]
         # 计算统计值
         mean_values = df_values.mean().round(2)
@@ -102,7 +107,8 @@ def create_statistic(dfs: list[pd.DataFrame], ids: list[str]):
             'mean': mean_values.values,
             'std': std_values.values,
             'max': max_values.values,
-            'min': min_values.values
         })
         stats_list.append(stats_df)

     return df
+def create_plot(dfs:list[pd.DataFrame], ids:list[str], interval:list[int, int]=None) -> go.Figure:
     """
     创建一个包含所有传入 DataFrame 的线图。
     """
     fig = go.Figure()
     for df, df_id in zip(dfs, ids):
+        if interval:
+            df = df.iloc[interval[0]:interval[1]]
         for i, column in enumerate(df.columns[1:]):
             fig.add_trace(go.Scatter(
                 x=df[df.columns[0]],
     )
     return fig
+def create_statistic(dfs: list[pd.DataFrame], ids: list[str], interval:list[int, int]=None) -> pd.DataFrame:
     """
     计算数据集列表的统计信息。
     """
     stats_list = []
     for df, id in zip(dfs, ids):
+        total_rows = len(df)
+        if interval:
+            df = df.iloc[interval[0]:interval[1]]
         df_values = df.iloc[:, 1:]
         # 计算统计值
         mean_values = df_values.mean().round(2)
             'mean': mean_values.values,
             'std': std_values.values,
             'max': max_values.values,
+            'min': min_values.values,
+            'total_sample_num': total_rows
         })
         stats_list.append(stats_df)