00:14
Das Jobbarometer ist das neue Tool des AMS und ich darf heute
00:17
unsere Methodik, aber auch die Datengrundlage davon vorstellen.
00:21
Grundlegend ist das AMS JobBarometer ein Tool, was Auskunft darüber gibt, welche Berufe sich in
00:25
Onlineinseraten wie entwickeln. Das heißt:
00:28
Was wird gesucht? Wie verändert sich die Tätigkeitenstruktur in den Berufen?
00:33
Wie werden die meisten Berufe nachgefragt?
00:35
Das heißt, wie viele Online
00:36
Inserate wurden über die Jahre gesucht und auch in den Bundesländern.
00:39
Zusätzlich haben wir auch eine Prognose, die wir für jeden Beruf,
00:42
den es in Österreich gibt, darstellen können.
00:45
Grundlegend hat das Jobbarometer ganz, ganz viele Inhalte.
00:48
Es geht um Textliches, es geht um zusätzliche Analysen.
00:51
Aber das Wichtigste sind unsere Daten, die aus dem Inseraten herauskommen.
00:56
Das heißt, die sind da für die Bundesländer, für die einzelnen Berufe,
01:00
die Entwicklung in den vergangenen Jahren, der Vergleich mit ähnlichen Berufen,
01:03
auch im Bundesländervergleich und natürlich, wie schon gesagt,
01:06
wie sich diese Berufsprofile über die Zeit auch verändern.
01:09
Ich denke, am besten ist es, wir gehen in aller Kürze
01:12
auf eine Detailseite in unserem Jobbarometer.
01:16
Was wir hier relativ schön sehen,
01:18
ist eine kurze Darstellung, wie ein Job
01:21
im Jobbarometer ausschaut und man hat mehrere Informationen.
01:24
Es sind unsere Daten dargestellt über die Zeit,
01:27
man hat die Daten über ähnliche Berufe, im Bundesländervergleich.
01:31
Man sieht schön, welche Kompetenzen gefragt sind und
01:34
das ist wahrscheinlich hier das Interessanteste.
01:37
Wir haben auch dieses Dreiergespann an Grafiken, die sich mit dem Trend
01:40
und der Bedeutung des Berufs auseinandersetzen.
01:43
Hier sehen wir ganz schön, dass dieser Job,
01:45
in diesem Fall Softwareentwickler,
01:49
einen sehr hohen Anteil am Inseratenaufkommen hat.
01:52
Das war im Jahr 2022 77.450 Inserate, die gesucht worden sind.
01:57
Der Anteil ist wie gesagt, hoch,
01:59
und die Prognose, die im Hintergrund läuft, ist sehr positiv.
02:02
Diese Prognose wir sehen das hier, ich zoom hinein,
02:05
ist eine Infografik, ein sogenannter Barometerwert, woher auch
02:09
der Name des Jobbarometer kommt.
02:11
Im Hintergrund ist natürlichnoch sehr viel mehr als nur
02:15
diese Informationsgrafik.
02:17
Zu den Daten:
02:18
Das ist nämlich das Wichtigste, was wir hier darstellen wollten.
02:20
Das Ganze ist sehr stark datengetrieben.
02:22
Wir schauen, dass wir Zeitreihen darstellen können,
02:24
die Vergleichbarkeit der Berufe darstellen können.
02:26
Und auch für die Prognose selbst, sind die Daten natürlich unerlässlich.
02:31
Und was das Ganze als Datenbasis hergibt, sind offene Stellen des AMS,
02:34
aber auch ergänzende Stellenangebote aus dem Internet,
02:37
die von unserem Data Provider, der Firma Text Kernel aus Holland,
02:41
mit den täglichen offenen Stellen vom AMS noch zusätzlich angereichert werden.
02:46
Und die durchsuchen Datenquellen aus dem Internet.
02:49
Das sind jetzt zum Beispiel die klassischen Karriereplattformen
02:51
nach Jobinseraten mit sogenannten Spidertechnologien.
02:55
Da gibt es zwei Unterschiedliche,
02:56
man hat jetzt Wildspider, die das Internet etwas breiter durchsuchen
03:00
und sogenannte Directspider,
03:03
die auf einzelne Seiten maßgeschneidert sind,
03:06
um dort die Informationsstrukturbesser abgreifen zu können.
03:09
Die Daten werden gespeichert und werden klassifiziert.
03:12
Das heißt hier werden Jobtitel, aber auch Berufstexte,
03:16
die dann nach Kompetenz abgesucht werden, nach der Systematik
03:20
des Berufsinformationssystem des AMS klassifiziert und normiert.
03:25
Zusätzlich werden diese Daten aber auch dedupliziert,
03:29
das bedeutet, mehrfache Inserate werden bereinigt, weil es natürlich sein kann,
03:32
dass dieser gleiche Job auf sehr vielen Stellenplattformen gesucht wird.
03:37
Wir überprüfen diese Daten, bereinigen sie noch ein Stück weit, aber vor allem
03:41
kommen diese Daten bei uns als Content auf die Website, aber eben auch
03:45
als Datenbasis für unsere Prognose. Wie so etwas ausschaut,
03:50
dafür gehen wir vielleicht ganz kurz auf eines unserer Dashboards,
03:52
wo wir schön sehen können,
03:54
die Daten selbst sind im Tool jährlich dargestellt.
03:57
Das sind Jahresdaten für uns, weil auch die Prognose dann über die Zeit
04:01
länger geht.
04:02
Aber natürlich sind die Daten hochfrequent.
04:04
Wir haben das als Tagesdaten zur Verfügung
04:06
und man kann sich hier sehr schön anschauen,
04:08
wie die Inserate nach Wochen ausschauen, wie die Inserate
04:11
in den Bundesländern verteilt sind, an welchen einzelnen Tagen hier
04:15
zum Beispieldie Inserate besonders oft geschaltet werden.
04:17
Aber auch, was die meisten Inserate waren,
04:20
das heißt, was sind jetzt besonders wichtige Berufe
04:24
in Inseraten, die gefunden worden sind, was man hier schön sieht.
04:31
Das Ganze kommt bei uns dann in diesen Barometer Wert,
04:35
deswegen ja auch Jobbarometer, der die Prognose umfasst.
04:39
Diese Jobprognose hat im Endeffekt drei verschiedene Stufen.
04:43
Die erste Stufe sind die Daten selbst, auf die ich hier schon eingegangen bin.
04:47
Die zweite Stufe sind Ähnlichkeitsverhältnisse,
04:49
weil es durchaus interessant ist,auch ähnliche Berufe und deren Entwicklung
04:53
mit betrachten zu können.
04:55
Und das Dritte, diese Stufe geht im Endeffekt darum,
04:58
dass man auch andere Datenquellen, auch Literatur, auch qualitative
05:02
Informationen in die Prognosemit einfließen lassen kann.
05:05
Das Ganze ist ein Bajon Vektor autoregressives Model,
05:09
welches für die Schätzung genutzt wird und dann in weiterer Folge
05:13
für den Barometer in eine Infografik übersetzt wird.
05:17
Natürlich gibt es da auch nochregelmäßige Validierungen,
05:19
denn schon am Anfang des Projektshaben wir uns angeschaut,
05:21
wie diese Methode auch gegen andere Zeitreihen Ansätze performen würde.
05:25
Und das ist ein sehr guter Ansatz, um dieser Komplexität auch gerecht
05:29
werden zu können.
05:30
Ich bin schon drauf eingegangen,
05:31
die Datengrundlage sind Jobinseratedaten von Text Kernel,
05:35
die täglich und automatisiert aus dem Internet abgegriffen werden,
05:38
normalisiert werden, dedupliziert werden.
05:40
Und wir betrachten dann die Zeitreihe der relativen Bedeutung
05:44
am gesamten Inseratenmarkt von diesen Berufen.
05:47
Das ist die Datengrundlage.
05:49
Darauf ist die Zeitreihen Komponente basiert.
05:52
Dann schaut man sich an nach der Systematik des Berufsinformationssystems,
05:57
was sind verwandte Berufe mit Näheverhältnissen
06:00
und wie haben die sich entwickelt?
06:02
Das heißt, auch das kann einen Informationsgehalt haben.
06:04
Aus zwei Gründen.
06:06
Denn einerseits basiert die Normalisierung auf Machine Learning Ansätzen,
06:10
und sie ist auch als Menschnicht immer leicht,
06:12
diese Inserate tatsächlich einem Job zuzuordnen.
06:14
Manchmal könnte hier mehreres passen,
06:16
das heißt, diese Information
06:17
können wir mit einbeziehen, aber auch, dass man sagen kann,
06:21
es ist nicht unplausibel zu denken, dass ähnliche Berufe
06:24
durchaus ähnliche Entwicklungstrajektoren aufweisen können.
06:28
Dementsprechend ist diese Informationauch nicht unwichtig.
06:31
Das heißt, verwandte Berufe sind hier ebenfalls eine wichtige Bedeutung
06:35
in unserer Prognose.
06:36
Und der letzte Teil ist jetzt eben das Spannende,
06:39
da ist einerseits ein wissenschaftlicher Redaktionsprozess im Hintergrund,
06:43
wofür die Berufe in Literatur, anderen Datenquellen, vielleicht auch in
06:47
internationalen Prognosen betrachtet werden und in diesem Redaktionsteam
06:52
dann als Annahme, als sogenannte A-Priori steady-state Values definiert werden.
06:57
Das heißt, das Ganze wird definiert als Mittelwert.
06:59
Wie entwickelt sich das Ganze auf einer Fünfer Skala, die auf Basis
07:03
der alten Daten von der letzten Periode schaut,
07:07
was wäre ein Wert, der zum Beispiel positiv steigt?
07:09
Was wäre ein Wert, der tendenziell negativ steigt?
07:12
Das wäre dann der Mittelwert, aber auch die Sicherheit im Redaktionsprozess.
07:17
Das heißt im Endeffekt, wie sicher ist sich der wissenschaftliche Redakteur,
07:21
dass diese Schätzung, diese A-Priori-Annahme durchaus stichhaltig ist?
07:25
Denn diese Varianz und da kommen wir später
07:27
noch dazu spielt dann auch eine große Rolle,
07:31
wie die Prognose geprägt wird von den qualitativen Daten.
07:34
Da könnte ich jetzt wieder ein weiteres Dashboard herzeigen.
07:37
Hier sehen wir zum Beispiel die Konjunkturkomponente, die wir haben.
07:40
Wir können uns anschauen,
07:41
wie sich die Arbeitslosigkeitentwickelt hat,
07:43
die auch nach
07:44
unterschiedlichen Merkmalen zu betrachten ist, zum Beispiel nach Geschlecht.
07:47
Man könnte dann aber auch sagen,wie sich die Stellenanzeigen entwickelt haben.
07:50
Aber auch wenn wir jetzt an Corona denken, zum Beispiel
07:52
die Kurzarbeitszahlen, die durchaus nicht unspannend sind,
07:55
und all das sind durchaus Informationen,
07:57
die wir einfließen lassen können und die wir über diesen qualitativen Prozess
08:01
eigentlich gut einbinden können
08:03
in diesen Bajon Vektor
08:05
autoregressiven Model.
08:07
Das Kunststück ist aber eigentlich die Literatur im Hintergrund,
08:11
denn hier haben wir diesen
08:12
ganze Redaktionsprozessin einer Wissensdatenbank abgespeichert,
08:15
wo wir wirklich zu den Berufen auch einzelne Trends darstellen können.
08:20
Das heißt,
08:20
wir haben hier diese Datenbank,die jetzt als Netzwerk dargestellt werden
08:24
kann,wo einzelne Berufe auch darstellbar sind.
08:27
Man kann auf die draufklicken, man sieht dann gleich okay,
08:30
welche globalen Trends wirkenauf diese Berufe.
08:33
Kann dann aber auch
08:34
wenn ich mir einen Trend direkt anschaue, zum Beispiel wie hier Industrie 4.0,
08:36
auf welche Berufe wirkt sichder zum Beispiel aus?
08:40
Geht es immer nach Obergruppen oder der European Green Deal?
08:42
Oder eben der Fachkräftemangel, der sich natürlich auf sehr vieles,
08:45
vor allem angebotsseitig auswirkt.
08:47
Aber eben wie hier die Bock die man eben anschauen kann
08:50
und was damit für interessante Veränderungen verknüpft sind.
08:55
Genau.
08:55
Und all diese Informationen sind da gespeichert und werden dann vom Redakteur
09:00
übersetzt in eine qualitative Annahme,
09:03
die man dann übersetzen kann, in eine Verteilung.
09:06
Und das schauen wir uns auch ganz kurz an
09:10
Was man hier sieht, ist eine Grafik, wo drei Verteilungen sind.
09:14
Wir haben die Likelihood Verteilung aus den Daten,
09:16
der schwarz gepunktete Bereich.
09:19
Das wäre quasi, was man aus einer Prognose mit reinen Zeitreihen erwarten würde.
09:24
Dann hat man die A-Priori Verteilung und diese A-Priori Verteilung,
09:28
das ist die grau gestrichelte Linie, die in diesem Fall zum Beispiel
09:31
tendenziell negativ wäre und auch relativ sicher,
09:34
weil man hat hier eine relativ spitze Verteilung, wenn man so will.
09:37
Man sieht da recht schön,
09:38
dass dann diese A-Priori Annahme die Prognose durchaus beeinflusst,
09:43
weil die goldene Kurve die A-Posteriori-Verteilung, woraus
09:46
dann der Prognosewert gesampelt wird,
09:48
ist jetzt noch weiter nach links gerückt, als die Daten es vorschlagen würden.
09:53
Und natürlich und das ist jetzt nur eine kleine Darstellung zur Illustration,
09:56
je stärker wir hier diese Kurven verändern,
10:00
man kann sie verschieben,
10:01
aber man kann auch die Varianz dieser Verteilung durchaus verändern.
10:06
Wenn jetzt diese Varianz größer ist,
10:08
das heißt, wenn es zum Teil sogarkomplett uninformativ geworden ist,
10:12
dann degradiert dieses gesamte Modell zu den klassischen Zeitreihen Modell,
10:15
also zu einem normalen Vektorautoregressiven Modell.
10:18
Das andere hingegen wäre, wenn ich zum Beispiel sehr genau wüsste,
10:22
wie sich ein Beruf entwickelt.
10:23
Man könnte jetzt zum Beispielan Planstellen in der Justiz denken,
10:27
wenn man wüsste,
10:28
hier gibt es jetzt eine gewisse Nachfrage in den kommenden Jahren
10:30
und die ist auch relativ fix ausgeschrieben,
10:33
dann könnte man hier eine sehr spitze Verteilung,
10:35
also mit einer sehr, sehr geringen Varianz darstellen,
10:38
in welche Richtung sich diese ganze Nachfrage entwickeln wird.
10:42
Wenn man aber jetzt gleichzeitig annimmt, dass bedenkt, wo man eine Nische hat,
10:46
wo vielleicht
10:46
in internationalen Studien zu diesem Job kaum Informationen zu finden sind,
10:50
dann könnte man so eine Verteilung haben,
10:52
wo man einfach nur eine ganz, ganz flache Gleichverteilung annimmt,
10:55
wo man einfach keinen Erkenntnisgewinn daraus zieht
10:57
und wo die A-Posteriori-Verteilung
11:00
nichts anderes ist als die Liklihood Verteilung aus den Daten.
11:03
Und alle Fälle dazwischen sind eben möglich,
11:06
wobei sich die finale Prognose entsprechend verschiebt.
11:13
Und was das Ganze dann darstellt,
11:15
das ist eben schon aus dem Barometer heraus, was sich ergibt.
11:18
Man sieht eine blaue Graphen, sieht also bei uns einen Zeitreihen wert.
11:22
Dieser wird prognostiziert und dann in die Infografik in den Barometer Wert
11:27
übersetzt, der dann wiederum auf der Homepage aufscheint.
11:32
Aber ich darf Sie einladen, sich selbst mit den Jobbarometer zu beschäftigen,
11:34
selbst ein bisschen herumzuspielen
11:36
und wünsche viel Spaßund viel Erfolg mit unserem Jobbarometer.