Psychometrie · 14 min Lesezeit

Warum generische Assessments für Ihr Unternehmen nicht funktionieren

SHL, TestGorilla, Harver, sie bieten allen dieselben Tests an. Warum das ein Problem ist und was die Alternative ist.

Door Ingmar van Maurik · Founder & CEO, Making Moves


Die Assessment-Branche verkauft One-Size-Fits-All

Die großen Assessment-Publisher, SHL, Harver, TestGorilla, Saville, Aon Assessment Solutions, haben ein solides Geschäftsmodell: einen Test entwickeln und an Tausende Unternehmen verkaufen. Es ist skalierbar, profitabel, und das Marketing klingt überzeugend: "validiert an 100.000+ Kandidaten", "bewiesener Vorhersagewert", "wissenschaftlich fundiert".

Das Problem: Ihr Unternehmen ist nicht dasselbe wie diese Tausende anderer Unternehmen. Der Entwickler, der bei einer Großbank erfolgreich ist, hat ein anderes Profil als der Entwickler, der bei einem schnell wachsenden Startup aufblüht. Der Sales Manager, der in einer Enterprise-Umgebung Spitzenleistungen erbringt, hat andere Eigenschaften als jemand, der in einem KMU-Team glänzt.

Und dennoch verwenden all diese Unternehmen denselben Test, mit derselben Normgruppe und derselben Interpretation.

Das grundlegende Problem mit generischen Tests

Generische Normgruppen verfehlen den Kontext

Die Scores eines generischen Assessments werden mit einer Normgruppe aus Tausenden zufälligen Personen verglichen. Diese Normgruppe ist ein statistischer Durchschnitt, der für niemanden spezifisch relevant ist:

  • Ihr idealer Developer könnte bei Extraversion niedriger abschneiden als der Marktdurchschnitt, aber genau das funktioniert in Ihrer introvertiertenfreundlichen Engineering-Kultur
  • Ein Kandidat, der "durchschnittlich" in der generischen Normgruppe abschneidet, könnte in Ihrem Kontext ein absoluter Top-Performer sein
  • Ein hoher Score bei "Gewissenhaftigkeit" sagt Erfolg bei einer Wirtschaftsprüfungsgesellschaft voraus, könnte aber bei einer Kreativagentur Mikromanagement-Tendenzen signalisieren
  • Die Folge: Sie filtern gute Kandidaten heraus und lassen weniger geeignete durch, einfach weil Sie den falschen Maßstab anlegen.

    Kein Unternehmenskontext oder Cultural Fit

    Ein Persönlichkeitstest, der "Teamarbeit" misst, berücksichtigt nicht, wie Teamarbeit in Ihrer spezifischen Kultur aussieht:

  • Bei Unternehmen A bedeutet Teamarbeit tägliche Standups, Pair Programming und konsensbasierte Entscheidungsfindung
  • Bei Unternehmen B bedeutet Teamarbeit autonome Beiträge zu einem gemeinsamen Ziel, mit wöchentlichen Meetings
  • Bei Unternehmen C bedeutet Teamarbeit cross-funktionale Zusammenarbeit mit hoher Konflikttoleranz
  • Derselbe "Teamarbeit"-Score kann bei Unternehmen A ein perfekter Match und bei Unternehmen C eine völlige Fehlbesetzung sein. Der generische Test macht diesen Unterschied nicht.

    Statische Modelle in einer dynamischen Welt

    Der Test ändert sich nicht. Ob Sie ihn 2020 oder 2026 durchführen, es ist derselbe Test mit derselben Normgruppe und derselben Interpretation. Aber Ihr Unternehmen verändert sich kontinuierlich:

  • Der Technologie-Stack entwickelt sich weiter, die Fähigkeiten, die vor 3 Jahren relevant waren, sind heute andere
  • Kultur verschiebt sich, nach einer Fusion, Reorganisation oder dem Wachstum von 50 auf 200 Mitarbeiter ändert sich, was einen guten Fit ausmacht
  • Rollen transformieren sich, der Stelleninhalt eines "Product Managers" unterscheidet sich heute von vor 5 Jahren
  • Marktbedingungen, in einem engen Arbeitsmarkt werden andere Kompetenzen kritisch als in einem entspannten Markt
  • Ein statisches Assessment kann diese Dynamik per Definition nicht abbilden.

    Begrenzte Vorhersagekraft

    Betrachten wir die Zahlen ehrlich. Forschung zeigt, dass generische kognitive Tests eine Korrelation von r = 0,30-0,50 mit der Arbeitsleistung haben. Klingt vernünftig, aber was bedeutet das in der Praxis?

  • Eine Korrelation von 0,30 erklärt nur 9 % der Varianz in der Arbeitsleistung
  • Das bedeutet, 91 % der Varianz werden durch andere Faktoren bestimmt
  • Selbst bei r = 0,50 werden nur 25 % erklärt
  • Das ist besser als nichts, und sicherlich besser als unstrukturierte Interviews (r = 0,20), aber weit entfernt von der Genauigkeit, die Unternehmen zu bekommen glauben, wenn sie für ein "wissenschaftlich validiertes" Assessment bezahlen.

    Die Kosten summieren sich

    Generische Assessments sind nicht günstig:

    AnbieterKosten pro KandidatKosten bei 500 Kandidaten/Jahr

    |----------|---------------------|-------------------------------|

    SHL€80-€150€40.000-€75.000 Harver€50-€100€25.000-€50.000 TestGorilla€30-€60€15.000-€30.000 Assessment Center€500-€2.000€250.000+ (selektiv)

    Und das exklusive ATS-Integration, Schulung für die Interpretation und die Zeit, die Recruiter mit dem Lesen von Berichten verbringen, die sie oft nicht vollständig verstehen.

    Die Alternative: Maßgeschneiderte Assessments

    Schritt 1: Analysieren Sie Ihre Top-Performer

    Statt generische Tests zu verwenden, beginnen Sie mit der Analyse Ihrer besten Mitarbeiter:

  • Welche kognitiven Fähigkeiten teilen sie? Vielleicht ist es nicht abstraktes Denken, sondern Mustererkennung in komplexen Daten oder schneller Kontextwechsel zwischen Aufgaben
  • Welche Persönlichkeitsmerkmale sagen Erfolg voraus? Nicht basierend auf generischer Theorie, sondern basierend auf Ihren Daten
  • Welches Verhalten zeigen sie in bestimmten Situationen? Wie reagieren Ihre Top-Performer auf Ambiguität, Konflikte oder Druck?
  • Welche Motivationsmuster gibt es? Werden Ihre besten Leute von Autonomie, Meisterschaft oder Sinnhaftigkeit angetrieben?
  • Das ergibt ein Erfolgsprofil, das einzigartig für Ihre Organisation ist, und es kann je nach Rolle variieren.

    Schritt 2: Eigene Normgruppen aufbauen

    Ihre Scores werden mit Ihren eigenen Mitarbeitern verglichen, nicht mit dem Markt:

  • Ein neuer Developer wird mit Ihren aktuellen Developern verglichen, segmentiert nach Senioritätsstufe und Team
  • Ein Sales-Kandidat wird gegen Ihre bewährten Top-Performer im Vertrieb gebenchmarkt
  • Die Normgruppe wächst mit jeder Einstellung, was den Vergleich immer genauer macht
  • Schritt 3: Kontinuierliche Verbesserung

    Nach jeder Einstellung wird das Modell validiert:

    1. Der Kandidat absolviert das Assessment

    2. Nach 6 Monaten: Leistungsbeurteilung

    3. Korrelation berechnen: War die Vorhersage korrekt?

    4. Modell basierend auf Ergebnissen anpassen

    5. Wiederholen, das System wird immer intelligenter

    Das ist das Prinzip der kontinuierlichen Validierung: Ihr Assessment entwickelt sich mit Ihrer Organisation. Nach 50-100 Einstellungen haben Sie ein Modell, das signifikant besser vorhersagt als jedes generische Assessment.

    Schritt 4: In den Hiring-Flow integrieren

    Maßgeschneiderte Assessments liefern den größten Mehrwert, wenn sie nahtlos integriert sind:

  • Kandidat bewirbt sich über Ihre [Stellenseite](/de/artikelen/high-converting-job-pages)
  • Unmittelbar nach der Bewerbung startet das Assessment, keine separaten Links, keine externen Tools
  • Ergebnisse werden automatisch mit [AI-CV-Screening](/de/artikelen/ai-replacing-cv-screening) und optional einem [AI Pre-Interview](/de/artikelen/ai-pre-interviews-future) kombiniert
  • Der Recruiter sieht ein integriertes Profil, nicht separate Berichte aus verschiedenen Tools
  • Der Business Case

    Nehmen wir an, Sie nehmen 100 Einstellungen pro Jahr vor, mit einer durchschnittlichen Fehlbesetzungsrate von 15 % (dem Marktdurchschnitt).

    Aktuelle Situation mit generischen Assessments:

  • 15 Fehlbesetzungen pro Jahr
  • [Kosten pro Fehlbesetzung](/de/artikelen/how-much-bad-hire-costs): €50.000-€100.000
  • Gesamtschaden: €750.000-€1.500.000 pro Jahr
  • Nach Implementierung maßgeschneiderter Assessments:

  • 20-30 % Verbesserung der Vorhersagevalidität
  • 10-11 Fehlbesetzungen statt 15
  • Einsparungen: 4-5 Fehlbesetzungen x €50.000-€100.000 = €200.000-€500.000 pro Jahr
  • Die Investition in Ihr eigenes Assessment-System, als Teil einer kompletten Hiring-Plattform, amortisiert sich innerhalb des ersten Jahres. Und es wird jedes Jahr wertvoller, da das Modell dazulernt.

    Über finanzielle Einsparungen hinaus:

  • Bessere Candidate Experience, integrierter Flow statt separater Tools
  • Schnellere Time-to-Hire, automatisches Scoring ohne manuelle Interpretation
  • Mehr Diversität, Bias-Monitoring an Ihrer spezifischen Population
  • Strategische Einblicke, was macht Menschen in Ihrem Unternehmen erfolgreich?
  • Wichtigste Erkenntnisse

    Generische Assessments sind ein Kompromiss aus der Not heraus: Sie waren die beste Option, als unternehmensspezifische Lösungen zu teuer und zu komplex waren. Aber diese Zeit ist vorbei.

    Mit moderner Technologie und Ihren eigenen Daten können Sie Assessments aufbauen, die:

  • Auf Ihren Top-Performern basieren, nicht auf generischen Normgruppen
  • Sich kontinuierlich verbessern nach jeder Einstellung
  • Nahtlos integriert in Ihren Hiring-Flow sind
  • Signifikant besser vorhersagen, wer erfolgreich wird
  • Die Zukunft der Assessments ist nicht generisch. Sie ist unternehmensspezifisch, datengesteuert und kontinuierlich lernend.

    Möchten Sie herausfinden, wie unternehmensspezifische Assessments in der Praxis funktionieren? Vereinbaren Sie eine Demo oder entdecken Sie unser AI-Hiring-System, das maßgeschneiderte Assessments als Kernfunktionalität bietet.


    Erstgespräch vereinbaren · Unser AI Hiring System ansehen