DoubleML
diff --git a/‎.github/workflows/did_sim.yml
Lines changed: 1 addition & 0 deletions b/‎.github/workflows/did_sim.yml
Lines changed: 1 addition & 0 deletions
diff --git a/‎doc/_website.yml
Lines changed: 2 additions & 1 deletion b/‎doc/_website.yml
Lines changed: 2 additions & 1 deletion
diff --git a/‎doc/did/did_cs_multi.qmd
Lines changed: 322 additions & 0 deletions b/‎doc/did/did_cs_multi.qmd
Lines changed: 322 additions & 0 deletions
diff --git a/‎doc/did/did_multi.qmd renamed to ‎doc/did/did_pa_multi.qmd
Lines changed: 5 additions & 5 deletions b/‎doc/did/did_multi.qmd renamed to ‎doc/did/did_pa_multi.qmd
Lines changed: 5 additions & 5 deletions
diff --git a/‎doc/index.qmd
Lines changed: 2 additions & 0 deletions b/‎doc/index.qmd
Lines changed: 2 additions & 0 deletions
diff --git a/‎monte-cover/src/montecover/did/__init__.py
Lines changed: 2 additions & 1 deletion b/‎monte-cover/src/montecover/did/__init__.py
Lines changed: 2 additions & 1 deletion
@@ -20,6 +20,7 @@ jobs:
           'scripts/did/did_pa_atte_coverage.py',
           'scripts/did/did_cs_atte_coverage.py',
           'scripts/did/did_pa_multi.py',
+          'scripts/did/did_cs_multi.py',
         ]
 
     steps:
 
@@ -27,7 +27,8 @@ website:
           - plm/pliv.qmd
       - text: "DID"
         menu:
-          - did/did_multi.qmd
+          - did/did_pa_multi.qmd
+          - did/did_cs_multi.qmd
           - did/did_pa.qmd
           - did/did_cs.qmd
       - text: "SSM"
 
@@ -0,0 +1,322 @@
+---
+title: "DiD for Cross-Sectional Data over Multiple Periods"
+
+jupyter: python3
+---
+
+```{python}
+#| echo: false
+
+import numpy as np
+import pandas as pd
+from itables import init_notebook_mode
+import os
+import sys
+
+doc_dir = os.path.abspath(os.path.join(os.getcwd(), ".."))
+if doc_dir not in sys.path:
+    sys.path.append(doc_dir)
+
+from utils.style_tables import generate_and_show_styled_table
+
+init_notebook_mode(all_interactive=True)
+```
+
+## ATTE Coverage
+
+The simulations are based on the [make_did_cs_CS2021](https://docs.doubleml.org/dev/api/generated/doubleml.did.datasets.make_did_cs_CS2021.html)-DGP with $2000$ observations. Learners are both set to either boosting or a linear (logistic) model. Due to time constraints we only consider the following DGPs:
+
+ - Type 1: Linear outcome model and treatment assignment
+ - Type 4: Nonlinear outcome model and treatment assignment
+ - Type 6: Randomized treatment assignment and nonlinear outcome model
+
+The non-uniform results (coverage, ci length and bias) refer to averaged values over all $ATTs$ (point-wise confidence intervals).
+
+::: {.callout-note title="Metadata"  collapse="true"}
+
+```{python}
+#| echo: false
+metadata_file = '../../results/did/did_cs_multi_metadata.csv'
+metadata_df = pd.read_csv(metadata_file)
+print(metadata_df.T.to_string(header=False))
+```
+
+:::
+
+```{python}
+#| echo: false
+
+# set up data
+df = pd.read_csv("../../results/did/did_cs_multi_detailed.csv", index_col=None)
+
+assert df["repetition"].nunique() == 1
+n_rep = df["repetition"].unique()[0]
+
+display_columns = ["Learner g", "Learner m", "DGP", "In-sample-norm.", "Bias", "CI Length", "Coverage", "Uniform CI Length", "Uniform Coverage"]
+```
+
+### Observational Score
+
+```{python}
+#| echo: false
+generate_and_show_styled_table(
+    main_df=df,
+    filters={"level": 0.95, "Score": "observational"},
+    display_cols=display_columns,
+    n_rep=n_rep,
+    level_col="level",
+    coverage_highlight_cols=["Coverage", "Uniform Coverage"]
+)
+```
+
+```{python}
+#| echo: false
+generate_and_show_styled_table(
+    main_df=df,
+    filters={"level": 0.9, "Score": "observational"},
+    display_cols=display_columns,
+    n_rep=n_rep,
+    level_col="level",
+    coverage_highlight_cols=["Coverage", "Uniform Coverage"]
+)
+```
+
+
+### Experimental Score
+
+The results are only valid for the DGP 6, as the experimental score assumes a randomized treatment assignment.
+
+```{python}
+#| echo: false
+generate_and_show_styled_table(
+    main_df=df,
+    filters={"level": 0.95, "Score": "experimental"},
+    display_cols=display_columns,
+    n_rep=n_rep,
+    level_col="level",
+    coverage_highlight_cols=["Coverage", "Uniform Coverage"]
+)
+```
+
+```{python}
+#| echo: false
+generate_and_show_styled_table(
+    main_df=df,
+    filters={"level": 0.9, "Score": "experimental"},
+    display_cols=display_columns,
+    n_rep=n_rep,
+    level_col="level",
+    coverage_highlight_cols=["Coverage", "Uniform Coverage"]
+)
+```
+
+## Aggregated Effects
+
+These simulations test different types of aggregation, as described in [DiD User Guide](https://docs.doubleml.org/dev/guide/models.html#difference-in-differences-models-did).
+
+The non-uniform results (coverage, ci length and bias) refer to averaged values over all $ATTs$ (point-wise confidence intervals).
+
+### Group Effects
+
+```{python}
+#| echo: false
+
+# set up data
+df_group = pd.read_csv("../../results/did/did_cs_multi_group.csv", index_col=None)
+
+assert df_group["repetition"].nunique() == 1
+n_rep_group = df_group["repetition"].unique()[0]
+
+display_columns = ["Learner g", "Learner m", "DGP", "In-sample-norm.", "Bias", "CI Length", "Coverage", "Uniform CI Length", "Uniform Coverage"]
+```
+
+#### Observational Score
+
+```{python}
+#| echo: false
+generate_and_show_styled_table(
+    main_df=df_group,
+    filters={"level": 0.95, "Score": "observational"},
+    display_cols=display_columns,
+    n_rep=n_rep_group,
+    level_col="level",
+    coverage_highlight_cols=["Coverage", "Uniform Coverage"]
+)
+```
+
+```{python}
+#| echo: false
+generate_and_show_styled_table(
+    main_df=df_group,
+    filters={"level": 0.9, "Score": "observational"},
+    display_cols=display_columns,
+    n_rep=n_rep_group,
+    level_col="level",
+    coverage_highlight_cols=["Coverage", "Uniform Coverage"]
+)
+```
+
+#### Experimental Score
+
+The results are only valid for the DGP 6, as the experimental score assumes a randomized treatment assignment.
+
+```{python}
+#| echo: false
+generate_and_show_styled_table(
+    main_df=df_group,
+    filters={"level": 0.95, "Score": "experimental"},
+    display_cols=display_columns,
+    n_rep=n_rep_group,
+    level_col="level",
+    coverage_highlight_cols=["Coverage", "Uniform Coverage"]
+)
+```
+
+```{python}
+#| echo: false
+generate_and_show_styled_table(
+    main_df=df_group,
+    filters={"level": 0.9, "Score": "experimental"},
+    display_cols=display_columns,
+    n_rep=n_rep_group,
+    level_col="level",
+    coverage_highlight_cols=["Coverage", "Uniform Coverage"]
+)
+```
+
+### Time Effects
+
+```{python}
+#| echo: false
+
+# set up data
+df_time = pd.read_csv("../../results/did/did_cs_multi_time.csv", index_col=None)
+
+assert df_time["repetition"].nunique() == 1
+n_rep_time = df_time["repetition"].unique()[0]
+
+display_columns = ["Learner g", "Learner m", "DGP", "In-sample-norm.", "Bias", "CI Length", "Coverage", "Uniform CI Length", "Uniform Coverage"]
+```
+
+#### Observational Score
+
+```{python}
+#| echo: false
+generate_and_show_styled_table(
+    main_df=df_time,
+    filters={"level": 0.95, "Score": "observational"},
+    display_cols=display_columns,
+    n_rep=n_rep_time,
+    level_col="level",
+    coverage_highlight_cols=["Coverage", "Uniform Coverage"]
+)
+```
+
+```{python}
+#| echo: false
+generate_and_show_styled_table(
+    main_df=df_time,
+    filters={"level": 0.9, "Score": "observational"},
+    display_cols=display_columns,
+    n_rep=n_rep_time,
+    level_col="level",
+    coverage_highlight_cols=["Coverage", "Uniform Coverage"]
+)
+```
+
+#### Experimental Score
+
+The results are only valid for the DGP 6, as the experimental score assumes a randomized treatment assignment.
+
+```{python}
+#| echo: false
+generate_and_show_styled_table(
+    main_df=df_time,
+    filters={"level": 0.95, "Score": "experimental"},
+    display_cols=display_columns,
+    n_rep=n_rep_time,
+    level_col="level",
+    coverage_highlight_cols=["Coverage", "Uniform Coverage"]
+)
+```
+
+```{python}
+#| echo: false
+generate_and_show_styled_table(
+    main_df=df_time,
+    filters={"level": 0.9, "Score": "experimental"},
+    display_cols=display_columns,
+    n_rep=n_rep_time,
+    level_col="level",
+    coverage_highlight_cols=["Coverage", "Uniform Coverage"]
+)
+```
+
+### Event Study Aggregation
+
+```{python}
+#| echo: false
+
+# set up data
+df_es = pd.read_csv("../../results/did/did_cs_multi_eventstudy.csv", index_col=None)
+
+assert df_es["repetition"].nunique() == 1
+n_rep_es = df_es["repetition"].unique()[0]
+
+display_columns = ["Learner g", "Learner m", "DGP", "In-sample-norm.", "Bias", "CI Length", "Coverage", "Uniform CI Length", "Uniform Coverage"]
+```
+
+#### Observational Score
+
+```{python}
+#| echo: false
+generate_and_show_styled_table(
+    main_df=df_es,
+    filters={"level": 0.95, "Score": "observational"},
+    display_cols=display_columns,
+    n_rep=n_rep_es,
+    level_col="level",
+    coverage_highlight_cols=["Coverage", "Uniform Coverage"]
+)
+```
+
+```{python}
+#| echo: false
+generate_and_show_styled_table(
+    main_df=df_es,
+    filters={"level": 0.9, "Score": "observational"},
+    display_cols=display_columns,
+    n_rep=n_rep_es,
+    level_col="level",
+    coverage_highlight_cols=["Coverage", "Uniform Coverage"]
+)
+```
+
+#### Experimental Score
+
+The results are only valid for the DGP 6, as the experimental score assumes a randomized treatment assignment.
+
+
+```{python}
+#| echo: false
+generate_and_show_styled_table(
+    main_df=df_es,
+    filters={"level": 0.95, "Score": "experimental"},
+    display_cols=display_columns,
+    n_rep=n_rep_es,
+    level_col="level",
+    coverage_highlight_cols=["Coverage", "Uniform Coverage"]
+)
+```
+
+```{python}
+#| echo: false
+generate_and_show_styled_table(
+    main_df=df_es,
+    filters={"level": 0.9, "Score": "experimental"},
+    display_cols=display_columns,
+    n_rep=n_rep_es,
+    level_col="level",
+    coverage_highlight_cols=["Coverage", "Uniform Coverage"]
+)
+```
@@ -36,7 +36,7 @@ The non-uniform results (coverage, ci length and bias) refer to averaged values
 
 ```{python}
 #| echo: false
-metadata_file = '../../results/did/did_multi_metadata.csv'
+metadata_file = '../../results/did/did_pa_multi_metadata.csv'
 metadata_df = pd.read_csv(metadata_file)
 print(metadata_df.T.to_string(header=False))
 ```
@@ -47,7 +47,7 @@ print(metadata_df.T.to_string(header=False))
 #| echo: false
 
 # set up data
-df = pd.read_csv("../../results/did/did_multi_detailed.csv", index_col=None)
+df = pd.read_csv("../../results/did/did_pa_multi_detailed.csv", index_col=None)
 
 assert df["repetition"].nunique() == 1
 n_rep = df["repetition"].unique()[0]
@@ -122,7 +122,7 @@ The non-uniform results (coverage, ci length and bias) refer to averaged values
 #| echo: false
 
 # set up data
-df_group = pd.read_csv("../../results/did/did_multi_group.csv", index_col=None)
+df_group = pd.read_csv("../../results/did/did_pa_multi_group.csv", index_col=None)
 
 assert df_group["repetition"].nunique() == 1
 n_rep_group = df_group["repetition"].unique()[0]
@@ -190,7 +190,7 @@ generate_and_show_styled_table(
 #| echo: false
 
 # set up data
-df_time = pd.read_csv("../../results/did/did_multi_time.csv", index_col=None)
+df_time = pd.read_csv("../../results/did/did_pa_multi_time.csv", index_col=None)
 
 assert df_time["repetition"].nunique() == 1
 n_rep_time = df_time["repetition"].unique()[0]
@@ -258,7 +258,7 @@ generate_and_show_styled_table(
 #| echo: false
 
 # set up data
-df_es = pd.read_csv("../../results/did/did_multi_eventstudy.csv", index_col=None)
+df_es = pd.read_csv("../../results/did/did_pa_multi_eventstudy.csv", index_col=None)
 
 assert df_es["repetition"].nunique() == 1
 n_rep_es = df_es["repetition"].unique()[0]
 
@@ -264,3 +264,5 @@ fig.show()
 ```
 
 :::
+
+:::
@@ -1,5 +1,6 @@
 """Monte Carlo coverage simulations for DiD."""
 
+from montecover.did.did_cs_multi import DIDCSMultiCoverageSimulation
 from montecover.did.did_pa_multi import DIDMultiCoverageSimulation
 
-__all__ = ["DIDMultiCoverageSimulation"]
+__all__ = ["DIDMultiCoverageSimulation", "DIDCSMultiCoverageSimulation"]
Original file line number	Diff line number	Diff line change
`@@ -20,6 +20,7 @@ jobs:`
`20`	`20`	`'scripts/did/did_pa_atte_coverage.py',`
`21`	`21`	`'scripts/did/did_cs_atte_coverage.py',`
`22`	`22`	`'scripts/did/did_pa_multi.py',`
	`23`	`+ 'scripts/did/did_cs_multi.py',`
`23`	`24`	`]`
`24`	`25`
`25`	`26`	`steps:`
-Original file line number
+Diff line change
 ```
 :::
++
 +:::