diff --git a/README.md b/README.md index cc93b06..2d1b50a 100644 --- a/README.md +++ b/README.md @@ -1,8 +1,13 @@ -# stembureau-meting +# Stembureau meting +Dit project heeft als doel de stemlokalen van de gemeenteraadsverkiezingen van 2022 te analyseren. Het wordt uitgevoerd door Open State Foundation in opdracht van het ministerie van Binnenlandse Zaken en Koninkrijksrelaties. -Dit project heeft als doel visualisaties te maken over de gemeenteraadsverkiezingen van 2022 met open data. Dit project was gedaan door de open state foundation in opdracht van het ministerie van binnenlandse zaken. +# Vereisten +De analyse wordt uitgevoerd via Python code in een Jupyter Notebook. De meeste informatie kun je direct bekijken op https://github.com/openstate/stembureau-meting/blob/main/jupyter/stembureau_data.ipynb. - -# Requirements - -[Anaconda](https://www.anaconda.com/) +Als je de code zelf wilt uitvoeren of aanpassen, installeer dan [Jupyter Notebook](https://docs.jupyter.org/en/latest/install/notebook-classic.html): +- Of door [Anaconda te installeren](https://www.anaconda.com/products/distribution) (dit is een grote installatie waarmee je ook Python installeert) +- Of als je al Python hebt op bv. een systeem dat Linux draait: + - `pip3 install --upgrade pip` + - `pip3 install jupyter` + - `pip3 install -r requirements.txt` + - `python3 -m notebook` hiermee start je de Notebook diff --git a/jupyter/stembureau_data.ipynb b/jupyter/stembureau_data.ipynb index 54a8111..a4cb9b5 100644 --- a/jupyter/stembureau_data.ipynb +++ b/jupyter/stembureau_data.ipynb @@ -4,17 +4,15 @@ "cell_type": "markdown", "metadata": {}, "source": [ - "# Data gemeenteraadsverkiezingen 2022 Nederland\n", - "\n", - "Dit notebook is voor het verwerken van de data van de gemeenteraadsverkiezingen van 2022. Er zal hier stap voor stap door de data gelopen worden om het proces reproduceerbaar te maken voor latere verkiezingen. De eerste stap was de data ophalen van de bronnen, zowel de overheid als waar is mijn stemlokaal (voor geografische data van de stemlokalen). De bronnen gebruikt voor de data zijn voor de verkiezingen van 2022 is als volgt:\n", - "\n", + "# Datasets gemeenteraadsverkiezingen 2022\n", + "Deze notebook heeft als doel de stemlokalen van de gemeenteraadsverkiezingen van 2022 te analyseren. Er zal hier stap voor stap door de data gelopen worden om het proces reproduceerbaar te maken voor latere verkiezingen. De eerste stap was de data ophalen van de bronnen, zowel van de overheid als van 'Waar is mijn stemlokaal' (voor geografische data van de stemlokalen). Deze bronnen zijn voor de verkiezingen van 2022 gebruikt:\n", "- [Verkiezingsuitslagen Gemeenteraad 2022](https://data.overheid.nl/dataset/08b04bec-3332-4c76-bb0c-68bfaeb5df43)\n", - " - [Directe link naar uitslagen per gemeente CSV](https://data.overheid.nl/sites/default/files/dataset/08b04bec-3332-4c76-bb0c-68bfaeb5df43/resources/GR2022_2022-03-29T15.14.zip)\n", + " - [Directe link naar uitslagen per gemeente EML](https://data.overheid.nl/sites/default/files/dataset/08b04bec-3332-4c76-bb0c-68bfaeb5df43/resources/GR2022_2022-03-29T15.14.zip)\n", " - [Directe link naar kandidatenlijst met uitslagen CSV](https://data.overheid.nl/sites/default/files/dataset/08b04bec-3332-4c76-bb0c-68bfaeb5df43/resources/GR2022_alle-kandidaten_2022-02-22T08.34.csv)\n", - "- [Waar is mijn stemlokaal stembureau data](https://waarismijnstemlokaal.nl/data)\n", - " - [Directe link naar waar is mijn stemlokaal gemeenteraad 2022 CSV (CKAN)](https://ckan.dataplatform.nl/datastore/dump/d6a1b4c4-73c8-457b-9b75-a38428bded68)\n", - " - [Verkiezingsuitslagen gemeenteraadsverkiezingen 2022 geodata (Volkskrant)](https://data.openstate.eu/dataset/verkiezingsuitslagen-gemeenteraadsverkiezingen-2022)\n", - " - [Directe link naar GEOJSON bestand](https://data.openstate.eu/dataset/a1767f1b-bf0c-409b-b3b1-3af9954b57f4/resource/413be255-5070-48f4-b631-895097976abb/download/2022gr.geo.json)\n", + "- ['Waar is mijn stemlokaal' stembureau data](https://waarismijnstemlokaal.nl/data)\n", + " - [Directe link naar 'Waar is mijn stemlokaal' gemeenteraad 2022 CSV (CKAN)](https://ckan.dataplatform.nl/datastore/dump/d6a1b4c4-73c8-457b-9b75-a38428bded68)\n", + " - [Verkiezingsuitslagen gemeenteraadsverkiezingen 2022 geodata vab Open State Foundation en de Volkskrant (OSF/VK)](https://data.openstate.eu/dataset/verkiezingsuitslagen-gemeenteraadsverkiezingen-2022)\n", + " - [Directe link naar GeoJSON bestand](https://data.openstate.eu/dataset/a1767f1b-bf0c-409b-b3b1-3af9954b57f4/resource/413be255-5070-48f4-b631-895097976abb/download/2022gr.geo.json)\n", "- [CBS Wijk- en buurtkaart 2021](https://www.cbs.nl/nl-nl/dossier/nederland-regionaal/geografische-data/wijk-en-buurtkaart-2021)\n", " - [Directe link naar zip bestand met SHP bestand er in](https://www.cbs.nl/-/media/cbs/dossiers/nederland-regionaal/wijk-en-buurtstatistieken/wijkbuurtkaart_2021_v1.zip)\n", "- [CBS bevolkingsdichtheid kaart 100 bij 100 meter](https://www.cbs.nl/nl-nl/dossier/nederland-regionaal/geografische-data/kaart-van-100-meter-bij-100-meter-met-statistieken)\n", @@ -23,7 +21,9 @@ " - [Directe link naar 7z bestand met SHP bestand er in](https://www.cbs.nl/-/media/cbs/dossiers/nederland-regionaal/vierkanten/500/2021-cbs_vk500_2020_v1.zip)\n", "- [CBS schatting van kiesgerechtigden per gemeente](https://www.cbs.nl/nl-nl/maatwerk/2020/52/schatting-van-het-aantal-kiesgerechtigden-in-nederland)\n", "\n", - "De eerste stap die we moeten maken is de data importeren voor de analyse, daarna kunnen we kijken hoe goed de data is, hoe we het aan kunnen vullen, en wat er mee te doen. De makkelijkste structuur die we vonden was het geojson bestand van open state en de Volkskrant, daar staan alle stemlokalen al in een lijst, en we hebben een makkelijk framework om het te importeren; geopandas. We laden deze dan ook als eerste in." + "# Data inladen en eerste analyse\n", + "## OSF/VK GeoJSON dataset: verkiezingsuitslagen per stembureau inclusief coördinaten\n", + "Als eerste importeren we de data voor de analyse, daarna kunnen we kijken hoe goed de data is, hoe we het aan kunnen vullen, en wat er mee te doen. We kijken eerst naar het GeoJSON bestand van Open State Foundation en de Volkskrant (OSF/VK). Daarin zijn de coördinaten van alle locaties van bijna alle stembureaus toegevoegd aan de lijst met stembureaus uit de officiële uitslagen zoals gepubliceerd door de Kiesraad. We kunnen een GeoJSON bestand direct inladen met geopandas." ] }, { @@ -54,7 +54,8 @@ "cell_type": "markdown", "metadata": {}, "source": [ - "We importeren nu de gemeente shapefile kaart van het CBS, om de overlay van onze stemlokalen eroverheen te kunnen doen. " + "## CBS dataset: gemeentegrenzen en informatie\n", + "We importeren nu de gemeente shapefile kaart van het CBS, om de overlay van onze stemlokalen eroverheen te leggen." ] }, { @@ -65,7 +66,7 @@ { "data": { "text/plain": [ - "" + "" ] }, "execution_count": 73, @@ -76,7 +77,7 @@ "data": { "image/png": "", "text/plain": [ - "
" + "" ] }, "metadata": { @@ -87,7 +88,16 @@ ], "source": [ "nl_map = gpd.read_file(r'../data/shape/Netherlands_shapefile/gemeente_2021_v1.shp')\n", - "nl_map.to_crs(epsg=4326).plot()\n" + "plot = nl_map.to_crs(epsg=4326).plot()\n", + "plot.set_title('Plot van de gemeenten uit de CBS Wijk- en buurtkaart 2021')\n", + "plot\n" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "De CBS Wijk- en buurtkaart 2021 bevat ook naast de gemeentegrenzen ook informatie (bv. aantal inwoners) over de gemeenten. We printen dat hier uit om daar een beeld van te krijgen." ] }, { @@ -159,6 +169,13 @@ "print(nl_map)" ] }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "Hieronder plotten we de gegevens van stembureaus op de kaart van het CBS:" + ] + }, { "cell_type": "code", "execution_count": 75, @@ -167,7 +184,7 @@ { "data": { "text/plain": [ - "" + "Text(0.5,1,'Stembureaus op de gemeentekaart van het CBS')" ] }, "execution_count": 75, @@ -178,7 +195,7 @@ "data": { "image/png": "iVBORw0KGgoAAAANSUhEUgAAAGMAAAI/CAYAAABj6GcwAAAAOXRFWHRTb2Z0d2FyZQBNYXRwbG90bGliIHZlcnNpb24zLjUuMiwgaHR0cHM6Ly9tYXRwbG90bGliLm9yZy8qNh9FAAAACXBIWXMAAAsTAAALEwEAmpwYAAANdklEQVR4nO3cb2xd913H8fenTsu60nWJaluhXXE1RWiI/alklaI8gYVMEUEkmlRpE0N+UC1PmLRqSMwwJDSJCfNk4glPAkxYasdaaeSP1qnMMlQTqCt1SGhaWvA2vNAkit2WUlindm2/PPCJ8BI799rX9/oTn89Lqs7/nJ/y7jnnHic3qirCww1bPYD4f4lhJDGMJIaRxDCSGEZ2DPJkt99+e42NjQ3ylHZOnTr1UlUNr7ZtoDHGxsaYm5sb5CntSPrBWttymzKSGEYSw0hiGEkMI4lhJDGMJIaRxDCSGEYSw0hiGEkMI4lhJDGMJIaRxDCSGEYSw0hiGEkMIwP92yHXs+Onz/O5R87wzhXrd777Rl59/cf8zHtv5vyrP7rquE/ddxd/dPiDXZ0jMdbwm3/+JP/4vVc67vdfr/8YYNUQAA995xxAV0Fym1pFtyG69dB3znH35GMcP33+mvvlyljh+OnzfP7rz/DGW1fejHpXwIOPnOGGm9+za619EqNx/PR5HnzkTN/Ps+O2kbvX2pbbVGMQITpJDCOJAR0frIOSGMAXjp3d6iEAiQHAD998e6uHACTGwL3z5o9eW2tb62OMTT420PO99cr5+bW2tTrGoEN00toYbiGgpTEcQ0ALY/zil2a2eghratXPplyviMtaEWP/l59gfvGHWz0MFqYOoj9Ze/u2j/GhP3yc197Y+pe6hamDHffZ1s+MPzh+1iLE3vev+UcYP2Fbx3i4+SPPrbT3/bt4+NO/1NW+2/o2tVX/4N+7hsQLX/q1dR+3ra+MrbKREJAYVhLDyLaO8Z6fGhr4OUdvvWnDx27rB/gzXzzQ9XvGnpFbmPncL1+1fr1v7U99Yf+69l9pW8eA5SCXrfYmfvONN/DHH/8Qh++5Y9XjF6YODuzHKNs+xkqr/Z/vZFs/MzbLoJ49idGFlbe6a+nl4Q1dxpC0IOmspDOS5pp1uyTNSJpvpjt7Gom5hamD6BrbR2+9qaeHN6zvmfErVfXSiuVJYLaqpiRNNsuf72k05v6ji5+89qKX29QhYLqZnwYO9zyalus2RgHfknRK0pFm3WhVXQRopiP9GGCbdHub2ltVFySNADOSXuj2BE28IwB33XXXBobYHl1dGVV1oZkuAseAe4FLknYDNNPFNY49WlXjVTU+PLzqvzodjY4xJN0i6dbL88DHgGeBk8BEs9sEcKJfg2yLbm5To8AxSZf3/2pVPS7paeBRSQ8A54D7+zfMdugYo6q+D3x4lfUvA/v6Mai2yhu4kcQwkhhGEsNIYhhJDCOJYSQxjCSGkcQwkhhGEsNIYhhJDCOJYSQxjCSGkcQwkhhGEsNIYhhJDCOJYSQxjCSGkcQwkhhGEsNIYhhJDCOJYSQxjCSGkcQwkhhGEsNIYhhJDCOJYSQxjCSGkcQwkhhGEsNIYhhJDCOJYSQxjCSGkcQwkhhGEsNIYhhJDCOJYSQxjCSGkcQwkhhGEsNIYhhJDCOJYSQxjCSGkcQwkhhGEsNIYhhJDCOJYSQxjCSGkcQwkhhGEsNIYhhJDCOJYSQxjCSGkcQwkhhGuo4haUjSaUnfaJZ3SZqRNN9Md/ZvmO2wnivjs8DzK5Yngdmq2gPMNsvRg65iSLoTOAj8xYrVh4DpZn4aOLypI2uhbq+MPwV+F3hnxbrRqroI0ExHNndo7dMxhqRfBxar6tRGTiDpiKQ5SXNLS0sb+SVao5srYy/wG5IWgK8BH5X0EHBJ0m6AZrq42sFVdbSqxqtqfHh4eJOGvT11jFFVv1dVd1bVGPAJ4O+q6lPASWCi2W0CONG3UbZEL+8ZU8B+SfPA/mY5erBjPTtX1RPAE838y8C+zR9Se+UN3EhiGEkMI4lhJDGMJIaRxDCSGEYSw0hiGEkMI4lhJDGMJIaRxDCSGEYSw0hiGEkMI4lhJDGMJIaRxDCSGEYSw0hiGEkMI4lhJDGMJIaRxDCSGEYSw0hiGEkMI4lhJDGMJIaRxDCSGEYSw0hiGEkMI4lhJDGMJIaRxDCSGEYSw0hiGEkMI4lhJDGMJIaRxDCSGEYSw0hiGEkMI4lhJDGMJIaRxDCSGEYSw0hiGEkMI4lhJDGMJIaRxDCSGEYSw0hiGEkMI4lhJDGMJIaRxDCSGEYSw0hiGEkMIx1jSHqXpH+S9C+SnpP0xWb9Lkkzkuab6c7+D3d76+bKeAP4aFV9GPgIcEDSfcAkMFtVe4DZZjl60DFGLfvfZvHG5r8CDgHTzfpp4HA/BtgmXT0zJA1JOgMsAjNV9RQwWlUXAZrpSN9G2RJdxaiqt6vqI8CdwL2SfqHbE0g6ImlO0tzS0tIGh9kO6/o0VVWvAk8AB4BLknYDNNPFNY45WlXjVTU+PDzc22i3uW4+TQ1Lem8zfzPwq8ALwElgotltAjjRpzG2xo4u9tkNTEsaYjneo1X1DUlPAo9KegA4B9zfx3G2QscYVfUMcM8q618G9vVjUG2VN3AjiWEkMYwkhpHEMJIYRhLDSGIYSQwjiWEkMYwkhpHEMJIYRhLDSGIYSQwjiWEkMYwkhpHEMJIYRhLDSGIYSQwjiWEkMYwkhpHEMJIYRhLDSGIYSQwjiWEkMYwkhpHEMJIYRhLDSGIYSQwjiWEkMYwkhpHEMJIYRhLDSGIYSQwjiWEkMYwkhpHEMJIYRhLDSGIYSQwjiWEkMYwkhpHEMJIYRhLDSGIYSQwjiWEkMYwkhpHEMJIYRhLDSGIYSQwjiWEkMYwkhpHEMJIYRhLDSGIYSQwjiWEkMYwkhpGOMSS9T9LfS3pe0nOSPtus3yVpRtJ8M93Z/+Fub91cGW8Bv1NVHwDuA35b0s8Dk8BsVe0BZpvl6EHHGFV1sar+uZn/H+B54A7gEDDd7DYNHO7TGFtjXc8MSWPAPcBTwGhVXYTlYMDIpo+uZbqOIemnga8DD1bVa+s47oikOUlzS0tLGxlja3QVQ9KNLId4uKr+pll9SdLuZvtuYHG1Y6vqaFWNV9X48PDwZox52+rm05SAvwSer6ovr9h0Epho5ieAE5s/vHbZ0cU+e4HfAs5KOtOs+31gCnhU0gPAOeD+voywRTrGqKp/ALTG5n2bO5x2yxu4kcQwkhhGEsNIYhhJDCOJYSQxjCSGkcQwkhhGEsNIYhhJDCOJYSQxjCSGkcQwkhhGEsNIYhhJDCOJYSQxjCSGkcQwkhhGEsNIYhhJDCOJYSQxjCSGkcQwkhhGEsNIYhhJDCOJYSQxjCSGkcQwkhhGEsNIYhhJDCOJYSQxjCSGkcQwkhhGEsNIYhhJDCOJYSQxjCSGkcQwkhhGEsNIYhhJDCOJYSQxjCSGkcQwkhhGEsNIYhhJDCOJYSQxjCSGkcQwkhhGEsNIYhhJDCOJYSQxjCSGkcQwkhhGOsaQ9BVJi5KeXbFul6QZSfPNdGd/h9kO3VwZfwUcuGLdJDBbVXuA2WY5etQxRlV9G3jlitWHgOlmfho4vLnDaqeNPjNGq+oiQDMd2bwhtVffH+CSjkiakzS3tLTU79Nd1zYa45Kk3QDNdHGtHavqaFWNV9X48PDwBk/XDhuNcRKYaOYngBObM5x26+aj7V8DTwI/J+lFSQ8AU8B+SfPA/mY5erSj0w5V9ck1Nu3b5LG0Xt7AjSSGkcQwkhhGEsNIYhhJDCOJYSQxjCSGkcQwkhhGEsNIYhhJDCOJYSQxjCSGkcQwkhhGEsNIYhhJDCOJYSQxjCSGkcQwkhhGEsNIYhhJDCOJYSQxjCSGkcQwkhhGEsNIYhhJDCOJYSQxjCSGkcQwkhhGEsNIYhhJDCOJYSQxjCSGkcQwkhhGEsNIYhhJDCOJYSQxjCSGkcQwkhhGEsNIYhhJDCOJYSQxjCSGkcQwkhhGEsNIYhhJDCOJYSQxjCSGkcQwkhhGEsNIYhhJDCOJYSQxjCSGkcQw0lMMSQck/Zuk70qa3KxBtdWOjR4oaQj4M2A/8CLwtKSTVfWv1zpubPKxq9YtTB3c6DC2lV6ujHuB71bV96vqTeBrwKFrHXD2/H+vun61QG3US4w7gP9csfxisy42qJcYWmVdXbWTdETSnKS5t19f/cqIZb3EeBF434rlO4ELV+5UVUeraryqxofefVsPp9v+eonxNLBH0t2SbgI+AZzcnGG104Y/TVXVW5I+A/wtMAR8paqeu9YxH7zjNl5aZX0+TS3bcAyAqvom8M31HJPf+LXlDdxIYhhJDCOJYSQxjCSGkcQwkhhGEsNIYhhJDCOJYSQxjCSGkcQwkhhGEsNIYhhJDCOJYURVV/29s/6dTFoCftAs3g6r/mURJ/0Y489W1fBqGwYa4ydOLM1V1fiWnLxLgx5jblNGEsPIVsY4uoXn7tZAx7hlz4y4Wm5TRgYe43r5HqCkBUlnJZ2RNDeQcw74PWMI+HdWfA8Q+GSn7wFuBUkLwHhVDexdaNBXxrq/B9gmg45xPX0PsIBvSTol6cggTtjT9zM2oKvvAZrYW1UXJI0AM5JeqKpv9/OEg74yuvoeoIOqutBMF4FjLN9i+2rQMa6L7wFKukXSrZfngY8Bz/b7vAO9TW3ke4BbZBQ4JgmWf4++WlWP9/ukeQM3kjdwI4lhJDGMJIaRxDCSGEYSw0hiGPk/ybK/hEkCShEAAAAASUVORK5CYII=", "text/plain": [ - "
" + "" ] }, "metadata": { @@ -192,7 +209,8 @@ "\n", "fig, ax = plt.subplots(figsize = (10,10))\n", "nl_map.to_crs(epsg=4326).plot(ax=ax, color='lightgrey')\n", - "df_geojson.plot(ax=ax)" + "df_geojson.plot(ax=ax)\n", + "ax.set_title('Stembureaus op de gemeentekaart van het CBS')" ] }, { @@ -1006,7 +1024,7 @@ "text": [ "/tmp/ipykernel_112022/291552514.py:3: UserWarning: Geometry is in a geographic CRS. Results from 'centroid' are likely incorrect. Use 'GeoSeries.to_crs()' to re-project geometries to a projected CRS before this operation.\n", "\n", - " mobiel_mask = df_geojson['geometry'].centroid.x == 0\n" + " \"\"\"\n" ] }, { @@ -1081,8 +1099,10 @@ } ], "source": [ - "#de waarschuwing over de projectie die niet klopt kan genegeerd worden, we zoeken naar data die x = 0 is, de projectie gaat geen effect hebben op die data in Nederland\n", - "#filter de data en print welke waardes 0 hebben op x\n", + "# De waarschuwing over de projectie die niet klopt kan genegeerd worden, we zoeken naar data die x = 0 is,\n", + "# de projectie gaat geen effect hebben op die data in Nederland.\n", + "\n", + "# Filter de data en print welke waardes 0 hebben op x.\n", "mobiel_mask = df_geojson['geometry'].centroid.x == 0\n", "i = 0\n", "for item in mobiel_mask:\n", @@ -1207,12 +1227,20 @@ "metadata": {}, "outputs": [], "source": [ - "#let's also check if none fell through the cracks, it might be some mobile polls did actually have a location posted erroneously.\n", + "# Let's also check if none fell through the cracks, it might be some mobile polls did actually have a location\n", + "# posted erroneously\n", "#mobiel_mask_name = df_geojson_clean['description'].str.contains('Mobiel')\n", "#df_geojson_clean = df_geojson_clean[~mobiel_mask_name]\n", "#df_geojson_clean" ] }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "## 'Waar is mijn stemlokaal' dataset (wims)" + ] + }, { "cell_type": "code", "execution_count": 86, @@ -2083,9 +2111,11 @@ } ], "source": [ - "\n", + "# Convert the wims data to a geopandas dataframe\n", "gdf_wims = gpd.GeoDataFrame(\n", - " df_wims, geometry=gpd.points_from_xy(df_wims.Longitude, df_wims.Latitude)).set_crs(epsg=4326, inplace=True)\n", + " df_wims,\n", + " geometry=gpd.points_from_xy(df_wims.Longitude, df_wims.Latitude)\n", + ").set_crs(epsg=4326, inplace=True)\n", "\n", "gdf_wims" ] @@ -2523,11 +2553,33 @@ } ], "source": [ - "gdf_wims_dedupe = gdf_wims.drop_duplicates(subset =\"geometry\", keep = False)\n", - "df_geojson_dedupe = df_geojson_clean.drop_duplicates(subset =\"geometry\", keep = False)\n", + "# We only want to analyse stemlokalen so deduplicate the stembureaus based on their location's coordinates\n", + "gdf_wims_dedupe = gdf_wims.drop_duplicates(subset=\"geometry\", keep=False)\n", + "df_geojson_dedupe = df_geojson_clean.drop_duplicates(subset=\"geometry\", keep=False)\n", "gdf_wims_dedupe" ] }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "Voor dit onderzoek zijn we enkel geïnteresseerd in de locaties van stembureaus, oftewel de stemlokalen. Hierboven hebben we de stembureaus uit de wims dataset gededupliceerd op basis van de coördinaten van hun locatie.\n", + "\n", + "Het aantal stembureaus: 9275\n", + "\n", + "Het aantal stemlokalen: 8089\n", + "\n", + "Er zijn dus 1186 stembureaus gevestigd op een locatie van minimaal één ander stembureau." + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "## Plots van alle stemlokalen op de kaart\n", + "### Stemlokalen uit de wims dataset" + ] + }, { "cell_type": "code", "execution_count": 89, @@ -2578,7 +2630,7 @@ { "data": { "text/plain": [ - "
" + "" ] }, "metadata": { @@ -2593,6 +2645,13 @@ "gdf_wims_dedupe.plot(ax=ax)" ] }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "### Stemlokalen uit de OSF/VK GeoJSON dataset" + ] + }, { "cell_type": "code", "execution_count": null, @@ -2631,7 +2690,7 @@ "cell_type": "markdown", "metadata": {}, "source": [ - "Nu we een mooie kaart hebben van nederland met de stemlokalen erop, kunnen we gaan kijken naar hoe dit verhoud met de bevolkingsdichtheid als eerste voorbeeld. De kaart is opgehaald van het CBS, eerst gaan we kijken hoe de kaart er op zichzelf met dezelfde projectie uitziet." + "Nu we een kaart van nederland met de stemlokalen erop hebben, kunnen we als eerste voorbeeld gaan kijken hoe dit zich verhoudt met de bevolkingsdichtheid. De kaart is opgehaald van het CBS, eerst gaan we kijken hoe de kaart er op zichzelf met dezelfde projectie uitziet." ] }, { @@ -2671,7 +2730,7 @@ "cell_type": "markdown", "metadata": {}, "source": [ - "Het verwerken van de 100m bij 100m vierkanten kaar duurde heel lang (langer dan een half uur) op de laptop, en is dus niet ideaal tenzij we dit niveau van detail écht nodig hebben. Er is namelijk nog een andere kaart met dezelfde gegevens beschikbaar, maar met een grid van 500 bij 500 meter in plaats van 100 bij 100. Laten we dus kijken hoe vaak een stemlokaal dichterbij dan 100 meter van de dichtstbijzijnde andere is. De makkelijkste manier om dat te doen zonder alle punten met alle andere te vergelijken (heel veel moeite), is een extra dataframe maken als een kopie, alle indexen 1 opschuiven (want alle stemlokalen zijn al in een volgorde van clustering), en dan de laagste afstand bekijken." + "Het verwerken van de 100m bij 100m vierkanten kaart duurde lang (langer dan een half uur) op de laptop, en is dus niet ideaal tenzij we dit niveau van detail écht nodig hebben. Er is namelijk nog een andere kaart met dezelfde gegevens beschikbaar, maar met een grid van 500 bij 500 meter in plaats van 100 bij 100. Laten we dus kijken hoe vaak een stemlokaal dichterbij dan 100 meter van de dichtstbijzijnde andere is. De makkelijkste manier om dat te doen zonder alle punten met alle andere te vergelijken (wat lang duurt), is een extra dataframe maken als een kopie, alle indexen 1 opschuiven (want alle stemlokalen zijn al in een volgorde van clustering), en dan de laagste afstand bekijken." ] }, { @@ -2683,22 +2742,23 @@ "name": "stdout", "output_type": "stream", "text": [ - "11165 0.002608\n", - "1021 0.004853\n", - "3196 0.004875\n", - "1923 2.693202\n", - "3757 3.609362\n", - " ... \n", - "7444 253385.654588\n", - "9711 263408.187856\n", - "4392 266925.200994\n", - "9297 271954.076837\n", - "0 NaN\n", - "Name: distance, Length: 11670, dtype: float64\n" + "12595 0.000000\n", + "7470 0.000000\n", + "1263 0.000000\n", + "7578 0.000000\n", + "7580 0.000000\n", + " ... \n", + "2235 499.159730\n", + "6809 499.369706\n", + "4749 499.451620\n", + "7965 499.453972\n", + "0 NaN\n", + "Name: distance, Length: 2357, dtype: float64\n" ] } ], "source": [ + "# Use Rijksdriehoekscoördinaten (EPSG:28992) as this uses meters as unit so we can calculate the distance in meters\n", "df_shifted = df_geojson_clean.to_crs('EPSG:28992')\n", "\n", "df_shifted['geometry (shifted)'] = df_shifted['geometry'].shift(periods=1)\n", @@ -2713,7 +2773,7 @@ "cell_type": "markdown", "metadata": {}, "source": [ - "We kunnen dus vaststellen dat afstanden van onder de 500 meter waarschijnlijk zeldzaam zijn, en we verder kunnen gaan met de 500 meter bij 500 meter kaart. Laten we nu dus een projectie proberen te maken met de bevolkingsdichtheid erop om het te vergelijken met de stemlokalen en hun posities en clustering." + "Los van bovenstaande resultaten blijkt het dat de 100m kaart niet dezelfde inwonersgegevens heeft als de 500m kaart. Deze hebben we echter nodig voor de analyse, dus we gaan verder met de 500 bij 500 meter kaart. Laten we nu een projectie proberen te maken met de bevolkingsdichtheid erop om het te vergelijken met de stemlokalen en hun posities en clustering." ] }, { diff --git a/requirements.txt b/requirements.txt new file mode 100644 index 0000000..28a31bb --- /dev/null +++ b/requirements.txt @@ -0,0 +1 @@ +geopandas==0.9.0