7  Tekstfuncties

Hieronder volgen een aantal functies die gebruikt kunnen worden in een tekst.

7.1 Maak percentage

De functie maak_percentage() berekent een percentage van een indicator. De functie geeft als output het percentage (getal) met een %-teken als character, bijvoorbeeld 88%.

7.1.1 Nodige argumenten:

  • var_inhoud:
    Een character vector met de naam van de indicator waarvan je het percentage wil berekenen.

7.1.2 Optionele argumenten:

  • value:
    Een getal dat aangeeft welk value van de de variabele vergeleken wordt. Default is 1.

  • niveau:
    Het gebiedsniveau waarop je het percentage wil berekenen. Kan “regio”, “gemeente” of “nl” zijn. Default is “regio”.

  • huidig_jaar:
    Het jaar waarover je het percentage wil berekenen. Default is 2024.

  • var_jaar:
    De indicator die aangeeft uit welk jaar de deelnemer is. Default is “AGOJB401”.

  • ongewogen
    Standaard op FALSE. Wanneer TRUE worden ongewogen percentages uitgerekend.

7.1.3 Standaard percentage

# Standaard percentage:
monitor_df %>%
  maak_percentage(var_inhoud = 'GZGGA402')
[1] "63%"

7.1.4 Bereken standaard percentage en toon in bol grafiek

# Percentage in bol grafiek
monitor_df %>%
  maak_percentage(var_inhoud = 'LVPKS403') %>% # bereken percentage
  bol_met_cijfer() # toon in bol grafiek
# Origineel 0 0 225 75 51% 51%

7.2 Maak tekstuele vergelijking

De functie maak_vergelijking() maakt een vergelijking tussen de categorieën van een uitsplitsing voor een bepaalde indicator. Bijvoorbeeld een vergelijking tussen het percentage mannen en vrouwen dat zich gelukkig voelt. Hiervoor berekent de functie het percentage en de confidence intervallen van een indicator en bepaalt vervolgens of er overlap zit tussen deze confidence intervallen. De functie geeft als output een zin waarin aangegeven of de uitsplitsingen al dan niet vergelijkbaar zijn.

7.2.1 Nodige argumenten:

  • var_inhoud:
    Een character vector met de naam van de indicator waarvan je de percentages wil vergelijken.

  • var_crossing:
    Een character vector met de naam van de indicator waarover je wil uitsplitsen. De indicator moet minimaal 2 categorieën en maximaal 3 categorieën bevatten. var_crossing kan leeg gelaten worden indien je meerdere niveaus aangeeft. Dan zal niveau gebruikt worden als crossing.

7.2.2 Optionele argumenten:

  • variabele_label:
    Een character variabele met een alternatief label voor de variabele. Default is NULL (automatisch label o.b.v. label van variabele in data).

  • value:
    Een getal dat aangeeft welk value van de de variabele vergeleken wordt. Default is 1.

  • niveau:
    Het gebiedsniveau waarop je het percentage wil berekenen. Kan “regio”, “gemeente” of “nl” zijn. Default is “regio”. Je kan ook meerdere niveaus invoeren, dan wordt niveau gebruikt als crossing. In dit geval moet je var_crossing leeg laten.

  • huidig_jaar:
    Het jaar waarover je het percentage wil berekenen. Default is 2024.

  • var_jaar:
    De indicator die aangeeft uit welk jaar de deelnemer is. Default is “AGOJB401”.

7.2.3 Standaard vergelijking tussen mannen en vrouwen

# Bij een vergelijking tussen gender of tussen leeftijdscategorieën worden de labels aangepast. 
# Bij gebruik van andere indicatoren worden de labels uit de data gebruikt

# Standaard vergelijking tussen mannen en vrouwen:
monitor_df %>% maak_vergelijking(var_inhoud = 'GZGGA402', 
                                 variabele_label = "hun eigen gezondheid als (zeer) goed ervaart",
                                 var_crossing = 'AGGSA402')
[1] "In de regio is het percentage dat hun eigen gezondheid als (zeer) goed ervaart onder mannen gelijk aan dat van vrouwen."

7.2.4 Vergelijking tussen 3 groepen

# Bij gebruik van andere indicatoren dan gender en leeftijdscategorieën worden de labels uit de data gebruikt.

# Vergelijking tussen migratieachtergrond in 3 categorieën:
monitor_df %>% maak_vergelijking(var_inhoud = 'GZGGA402', 
                                 variabele_label = "hun eigen gezondheid als (zeer) goed ervaart",
                                 var_crossing = 'LVTEA401')
[1] "In de regio is het percentage dat hun eigen gezondheid als (zeer) goed ervaart gelijk onder niet tevreden (cijfer 5 of lager), tevreden (cijfer 6 of 7) en zeer tevreden (cijfer 8 of hoger)."

7.3 Maak top

De functie maak_top() sorteert indicatoren van hoogst naar laagst percentage. De functie geeft als output een zin met het label van de indicator en het bijbehorende percentage.

7.3.1 Nodige argumenten:

  • var_inhoud:
    Een character vector met de na(a)m(en) van de indicator(en) waarvan je de percentages van hoog naar laag wil sorteren.

7.3.2 Optionele argumenten:

  • top:
    Een getal dat aangeeft welke percentages van de top je als output wil. Dit kan een getal zijn (bv. 3, dan is de output het op 2-na-hoogste percentage) of een reeks van getallen (bv. 1:5, dan is de output de top 5 van hoogste percentages). Default is 1.

  • toon_label:
    Boolean (TRUE of FALSE) die aangeeft of het label van het percentage bij de output gegeven moet worden. TRUE geeft aan dat het label bij de output komt. Default is TRUE.

  • value:
    Een getal dat aangeeft welk value van de de variabele vergeleken wordt. Default is 1.

  • niveau:
    Het gebiedsniveau waarop je het percentage wil berekenen. Kan “regio”, “gemeente” of “nl” zijn. Default is “regio”. Je kan ook meerdere niveaus invoeren, dan wordt niveau gebruikt als crossing. In dit geval moet je var_crossing leeg laten.

  • huidig_jaar:
    Het jaar waarover je het percentage wil berekenen. Default is 2024.

  • var_jaar:
    De indicator die aangeeft uit welk jaar de deelnemer is. Default is “AGOJB401”.

7.3.3 Bereken hoogste percentage

# Top 1 zonder label
monitor_df %>% maak_top(var_inhoud = c("LVVTA404", "LVVTA405", "LVVTA406", "LVVTA407", "LVVTA408", "LVVTA409", "LVVTA410"),
                        toon_label = FALSE, # Wijzig FALSE naar TRUE om label te tonen.
                        top = 1)
[1] "65%"

7.3.4 Bereken top 3 van meerdere indicatoren

# Top 3
monitor_df %>% maak_top(var_inhoud = c("LVVTA404", "LVVTA405", "LVVTA406", "LVVTA407", "LVVTA408", "LVVTA409", "LVVTA410"),
                        top = 1:3)
[1] "heeft (heel) veel zorgen over de woningmarkt (65%)"                             
[2] "heeft (heel) veel zorgen over het klimaat (42%)"                                
[3] "heeft (heel) veel zorgen over discriminatie van groepen in de samenleving (37%)"

7.3.5 Bereken top 3 binnen indicator

# Top 3 
monitor_df %>% maak_top(var_inhoud = 'AGLFA401',
                        value = 1:3, # Vul hier alle values in die voorkomen bij indicator
                        top = 1:3)
[1] "21-25 jaar (48%)" "18-20 jaar (30%)" "16-17 jaar (22%)"