Sandheden om AI og personlighedstest: Kan AI fake resultater?

Du har slået et job op, og ansøgningerne strømmer ind – i den perfekte verden. Men hvor stopper kandidatens indsats, og hvor tager AI over?

Alle HR-professionelle stiller det samme spørgsmål. Et hurtigt LinkedIn-scroll viser rekrutteringskonsulenter der ærgrer sig over at AI nu skriver ansøgninger, redigerer CV’er, udfører interviewopgaver – og nogle hævder endda at kandidater forsøger at snyde psykometriske tests. Det ændrer spillet, er svært at bestride, og det gør rekruttering meget mere besværligt.

Men det fik os til at tænke. Kan AI virkelig snyde personlighedstest? Og hjælper det kandidater? Vi tester det!

Først og fremmest – og helt klart: Hos Thomas er vi stærke tilhængere af AI. Det kan fremskynde CV-screening, strømline interviews og endda forbedre kommunikationen på arbejdspladsen.

Men selvom der er tusindvis af gode anvendelsesområder for AI, er dét at bruge det til at fake eller snyde i test ikke en af dem. Faktisk giver det ikke engang potentielle kandidater en fordel.

Forskning* har vist at når der er et klart ‘rigtigt’ svar (for eksempel på en IQ-test uden tidsbegrænsning), så kan AI klare sig rigtig godt. Men på de tidsbegrænsede test der ofte bruges i rekruttering (såsom Thomas’ intelligenstest ), kommer AI i øjeblikket ikke i nærheden af ​​at præstere som menneske, så den ville ikke være til nogen nytte til at fake et resultat.

Knapt så ligetil er det om AI kan forudsige de ‘korrekte’ eller ‘optimale’ svar i en personlighedstest. Har den hvad der skal til for præcist at forudsige en kandidats egnethed til en stilling?

Kan AI fake den personlighed du har brug for, for at få succes?

Vi testede om AI, og også mennesker, kunne gennemføre vores personlighedstest (Thomas HPTI) og fake de træk der er afgørende for succes i bestemte jobroller.

Thomas HPTI måler seks træk: Resiliens/Emotionel robusthed, Kompleksitetshåndtering, Samvittighedsfuldhed, Risikovillighed, Åbenhed over for nyt og Konkurrencemindedhed. Den består af 78 spørgsmål og tager omkring 20 minutter at gennemføre.

Thomas’ særlige jobprofileringssystem giver ansættelsesteams mulighed for at arbejde med en jobprofil og derefter sammenligne ansøgernes testresultater med denne ideelle profil. Kandidater der scorer højt i match, vil være bedre matchet til kravene i den pågældende rolle, hvilket hjælper dig med at identificere den person der bedst passer til dine behov.

Eksperimentet:

  • Vi bad fem forskellige AI-platforme om at generere de ‘ideelle’ svar på hvert af personlighedsspørgsmålene (HPTI) for hver af jobrollerne. Vores prompts bad specifikt AI om at svare positivt, som om de tog testen som en del af en rekrutteringsproces.
  • Vi bad også en stikprøve på 18 personer om at besvare personlighedstesten (HPTI) på en socialt ønskelig måde for tre af jobroller. Vi ønskede at de bevidst skulle forsøge at overdrive lidt og snyde i testen.
  • For at grounde vores resultater yderligere trak vi på vores databaser for at se på data fra allerede ansatte medarbejdere, hvilket gav os mulighed for at forstå de gennemsnitlige jobrollematch for personer, der allerede var i hver af disse roller.

Resultatet:

På tværs af alle 10 jobroller klarede rigtige medarbejdere sig altid bedre end AI og de fake menneskelige test-tagere. Jobindehaverne havde altid et bedre samlet match i sammenligning med den gennemsnitlige AI-genererede score og de menneskelige fake svar.

Interessant nok viser dette at både AI og mennesker kæmper med at fake personlighedstest for at virke mere egnede. Og det ser ud til at de ansatte i stillingen har træk der stemmer overens med deres rolle, som vi ville forvente.

Generelt så det ud til at mennesker og AI havde en tendens til at have samme match-vurdering som ikke var særlig optimal. Dette viser at hverken AI eller mennesker ved præcis hvordan en god præstation ser ud, og faktisk baserer deres svar på generelle stereotyper. For eksempel var AI og mennesker generelt ret præcise i at skildre høj “konkurrenceevne” som ønskeligt for en sælger, men dette syntes ikke at være tilfældet med nogle andre træk. Da AI er trænet på menneskelige data, er det ikke særlig overraskende at se at mennesker og AI har samme bias og fake vurderinger og reaktioner.

Interessant nok syntes der også at være uoverensstemmelser og stor variation inden for de forskellige AI-systemer og menneskelige fake vurderinger når vi kiggede på den samlede match-vurdering. Så ikke alene ved AI og mennesker ikke hvad der rent faktisk driver fremragende præstationer i en rolle, men de kan også være inkonsekvente og have svært ved at skjule deres manglende forståelse af hvad der forventes. AI’s reaktioner varierede meget på tværs af platforme, hvilket understreger at den kæmper med konsistens.

Konklusion: Snyd i psykometriske test skader mere end det hjælper

Heldigvis for HR er kunstig intelligens lige så dårlig til at snyde psykologiske psykometriske konstruktioner som mennesker er. Vi bør dog bemærke at vores  jobmatchsystem sikrer at succes er baseret på reelle prædiktorer – ikke stereotyper. Dette kan have været grunden til at AI havde svært ved at snyde, da jobprofiler ikke er baseret på stereotype personligheder i givne jobroller, men på det vi ved gør etablerede medarbejdere succesfulde. Det er også vigtigt at nævne at denne undersøgelse var baseret på vores egen personlighedstest (HPTI). AI kan se anderledes ud i andre testkonstruktioner.

*https://www.maximumtruth.org/p/massive-breakthrough-in-ai-intelligence

Mere for de nysgerrige:

When Machines Make Hiring Decisions: Examining the Risks and Limitations of AI-Based Recruitment Tools – (Taylor O’Brien, 2024)

How Candidates Use AI to Cheat in Assessments—and What Employers Can Do About It | Onrec

Del denne blog/artikel