10 almindeligt stillede dataforskerens interviewspørgsmål

Datavidenskabsområdet er i konstant udvikling, der spænder over flere brancher og kræver et omfattende færdigheder, der inkluderer matematik, statistik, programmering og marketing. Som sådan kræver det at blive dataforsker en imponerende blanding af teknisk dygtighed, kreativitet og kommunikation.

Jobbeskrivelser for datavidenskabsmænd kan variere meget, selvom alle søger kandidater med en lang liste over de mest ønskelige jobfærdigheder som kritisk tænkning, problemløsning, dataanalyse, følelsesmæssig intelligens, opmærksomhed på detaljer og teamwork. Dette betyder, at interviewspørgsmål til dataforskere kan spænde over flere forskellige emner og spænder fra typiske spørgsmål om bløde færdigheder til ekstremt tekniske diskussioner.

Data videnskabsinterview kræver meget forberedelse. Uanset om du er frisk fra en top computervidenskabelige skole, eller du ønsker at skifte til en anden virksomhed eller branche, bør du tage dig tid til at gennemgå de vigtigste koncepter i dit arbejde. Ligesom du ved, hvordan man kører, men muligvis har problemer med at recitere specifikke regler for vejen, kan du muligvis sidde fast i et interview, hvor du prøver at formulere, hvordan en specifik algoritme fungerer.

For at hjælpe dig med at forberede os har vi samlet 10 af de mest almindelige spørgsmål om dataforsker. Fra tidlige screeninger til anden og tredje fase video og on-site interviews, vil du støde på en lang række undersøgelser som disse af dine tekniske færdigheder, kommunikationsevner og arbejdsstil.

1. 'Fortæl os mere om det seneste projekt i din portefølje.'

Dataforskere er efterspurgte i mange forskellige brancher, men virksomheder er ofte på udkig efter nogen med meget specifikke færdigheder såvel som en god kulturpasform. En detaljeret online portefølje, der viser den type arbejde, du er i stand til, samt en stærk tilstedeværelse på sociale medier og et personligt brand, hjælper dig med at skille sig ud fra andre kandidater samt forbinde dig med at ansætte ledere og rekrutterere til job, du er perfekt egnet til.

Vær forberedt på ethvert datavidenskabsinterview til at tale omfattende om alle elementer i dit CV, portefølje eller websted. Skræddersy dit svar om et projekt, der passer til dit publikum. Hvis det er en indledende screening eller et panel med deltagere fra forskellige afdelinger, skal dit fokus være på måderne, dit arbejde skabte positive resultater for klienten og deres virksomhed.

Når du kommer til den del af interviewprocessen, hvor du møder en anden dataforsker, ingeniør, analytiker eller anden teknisk person, kræves en mere detaljeret beskrivelse af de data og processer, der er involveret i dit arbejde.

2. 'Hvorfor vil du arbejde for dette firma?'

Selv hvis du blev kontaktet direkte gennem din online portefølje eller LinkedIn-profil og blev inviteret til at interviewe for en åben stilling, vil virksomheden stadig gerne vide, hvorfor du har accepteret, og hvorfor du synes, du vil være en god pasform til jobbet.

Bortset fra at uddybe dine tekniske færdigheder, bør din forberedelse til interviewet omfatte forskning i den virksomhed, du ansøger til. Oplysninger om deres branche, mission, personale, nøjagtigt hvad de gør, og hvor godt de gør det, vil hjælpe dig med at skabe et specifikt skræddersyet svar på dette spørgsmål.

Adresser, hvordan dit skillset hjælper dem med at nå deres mål. Find en måde at udtrykke lidenskab omkring et eller flere aspekter af din jobrolle, herunder virksomhedens mission, filosofi, innovation eller produktlinje. Hvis dette er dit drømmejob, kan det være værd at tid til at sammensætte et datavidensprojekt forud for samtalen, der løser et problem for dem - som at appellere til en ny demografisk eller planlægge leverancer mere effektivt.

3. 'Navngiv de data, som videnskabsmænd du mest beundrer, og forklar hvorfor.'

Selvom dette er et meget personligt spørgsmål, der ikke teknisk har et rigtigt svar, er de svar, du vælger, meget vigtige. Din forskning på virksomheden såvel som dem på interviewpanelet kan hjælpe dig med at gøre et godt førsteindtryk med dette spørgsmål alene.

At kende de mennesker, der er fremtrædende inden for området såvel som dem, der i øjeblikket skaber bølger, viser interviewerne, at du både er vidende og brænder for branchen. Det er nyttigt at diskutere datavidenskabsmænd, der er værdsat i den specifikke karrierearena, du ansøger om, som finans, medicin eller aktiemarkedet.

Dette spørgsmål er mere end bare en imponerende liste over navne. 'Hvorfor' -delen af ​​ligningen vil også vise dine potentielle arbejdsgivere, hvad du værdsætter inden for dit felt, og hvordan du nærmer dig dit arbejde. Hvis din forskning har vist, at virksomheden værdsætter innovation, integritet eller endda en bestemt statistisk metode, er dette en god mulighed for at lade dem vide, at du deler de samme værdier.

4. 'Hvordan vil du forklare en anbefalingsmotor til nogen fra Marketingafdelingen?'

En af de vigtige egenskaber, der adskiller dataforskere fra andre tekniske genier, er evnen til at konvertere, vise og forklare data på en måde, som ikke-tekniske mennesker kan forstå. Det gør en forespørgsel som denne til en af ​​de vigtigste dataforskerens interviewspørgsmål, du vil støde på. Interviewere ønsker at se, hvor godt du kan kommunikere koncepter som datamodellering, beslutningstræer og lineær regression til ethvert publikum.

I dette specifikke tilfælde ønsker du først at forklare i enkle termer, hvordan en anbefalingsmotor fungerer, med eksempler på både indholdsbaseret filtrering og samarbejdsfiltrering. Så vil du diskutere, hvordan du kan arbejde med marketingafdelingen for at kombinere deres evner til at appellere til kunder med kraften i algoritmen, der bruger indsamlede data til at hjælpe med at finde ud af, hvad forbrugerne ønsker.

5. 'Hvad er forskellene mellem overvåget og uovervåget læring?'

Du kan begynde med at opsummere, at den største forskel mellem disse to er, at overvåget læring har træningsdata, som algoritmen kan lære af og give svar. Uovervåget læring kræver, at ting grupperes efter ligheder, almindelige afvigelser og andre mønster-søgende processer snarere end ved hårde og hurtige data.

Intervieweren vil have dig til at gå nærmere ind på, så det er vigtigt at angive de specifikke forskelle og være i stand til at tale om de forskellige anvendte algoritmer.

Overvåget læring

  • bruger kendte og mærkede data som input
  • har en feedbackmekanisme
  • bruges til forudsigelse
  • dets fælles algoritmer inkluderer beslutningstræ, logistisk regression, lineær regression, supportvektormaskine og tilfældig skov

Uovervåget læring

  • bruger umærkede data som input
  • har ingen feedbackmekanisme
  • bruges til analyse
  • dets almindelige algoritmer inkluderer K-betyder klynge, hierarkisk klynge, autoencodere og associeringsregler

Du vil gerne have nogle eksempler, enten generiske eller fra et specifikt projekt, du har arbejdet på, for at illustrere forskellene mellem disse to typer maskinlæring og i hvilke tilfælde hver enkelt kan bruges. For eksempel kan uovervåget læring bruges, når der lanceres et nyt produkt, hvor kundens demografi, det måtte appellere til, er ukendt.

Tilmeld

Tilmeld dig vores nyhedsbrev for mere awesome indhold og få 20% FRA vores karriere test!

Tilmeld

6. 'Hvordan undgår du valg af bias?'

Dette spørgsmål kan antage mange former i et datavidenskabsinterview. Du kan blive bedt om at definere udvælgelsesbias, hvordan man undgår det eller give et specifikt eksempel på, hvordan det spillede en rolle i et projekt, du arbejdede på.

Det vigtigste problem med selektionsbias er, at der er trukket konklusioner fra en ikke-tilfældig prøve. Det er klart, at den nemmeste løsning altid er at vælge fra en tilfældig prøve af en klart defineret population. Du bliver nødt til at uddybe, hvorfor det ikke altid er muligt.

Vær opmærksom på, at eftersom selektionsknap kan være forsætlig - med emneudvælgelse eller eliminering af data målrettet udført for at bevise en forudfattet teori eller fremskrivning - kan dette være en indirekte måde for ansættelsespanelet at stille et af disse hårde interviewspørgsmål om etik og integritet på arbejdet .

Du ønsker i sidste ende at understrege, hvordan valg af bias oftere er et tilfælde af utilsigtede eller uundgåeligt partiske data. Sørg for at uddybe nogle af de områder, hvor selektionsbias kan forekomme, herunder sampling, tidsinterval, data og slid. Giv derefter nogle eksempler på, hvordan løftestangsteknikker som resampling og boosting kan hjælpe dig med at arbejde omkring ikke-tilfældige prøver.

Hvis du er i en del af et interview, når du taler med repræsentanter fra mindre tekniske afdelinger, skal du bruge et let fordøjeligt eksempel, der tydeligt illustrerer valg af bias. Datavidenskabsmand Eric Hollingsworth refererer til en lektion fra aviær influenzaudbruddet i 2011, hvor 'kun meget syge personer blev talt' i en statistisk stikprøve af 'bekræftede tilfælde'. De resulterende 80% rapporterede dødsfrekvens, så alvorlig på grund af selektionsbias, skabte en betydelig udbredt frygt.

7. 'Hvordan kan outlier-værdier behandles?'

Dette er et almindeligt interviewspørgsmål for dataforskere, da det afslører, hvordan du bruger de data, du får, de metoder, du bruger til at behandle disse data, og om du er villig til at lægge tid til at evaluere hvert stykke data.

Du vil først tale om, hvad der udgør en udligger, som tal, der findes langt uden for klyngen af ​​data på en graf, som 2-3 standardafvigelser væk fra middelværdien, og så videre. Det næste trin til at håndtere outliers er at evaluere, hvorfor de skete.

En lille mængde outliers, der kan tilskrives simpel menneskelig eller maskinfejl, fjernes let. Vær dog opmærksom på, at selv en enkelt outlier kan være et vigtigt datapunkt snarere end et problem, da det kan indikere succes med en enkelt markedsføringstaktik, en ny lægemiddelbestanddel eller produktlinje.

Dernæst ønsker du at forklare, hvordan man håndterer et stort antal outliers, som kræver mere komplekse løsninger. For eksempel kan det være nødvendigt at ændre den model, du bruger, normalisere dataene til gennemsnittet eller bruge en tilfældig skovalgoritme. Prøv endnu en gang at bruge en sag fra det virkelige liv fra din erfaring som dataforsker til at forklare den rigtige taktik.

8. "Hvorfor er rengøring af data vigtig?"

Dataindsamling og rengøring er en dominerende del af dit job som dataforsker og tager op til 80% af din tid. Uanset hvilken branche du bruger på, vil interviewspørgsmålene altid omfatte en om, hvorfor rengøring af data er vigtig. Interviewere vil også spørge om dine foretrukne renseteknikker og programmer.

Du skal understrege, hvor rene data er nødvendige for at drage de rigtige konklusioner, men det handler ikke kun om tallene. Forklar, hvordan man starter med komplette, nøjagtige, gyldige og ensartede data direkte påvirker deres forretning. De vigtigste fordele at diskutere inkluderer:

  • forbedret beslutningstagning om virksomhedens mål
  • hurtigere erhvervelse af kunder og ommålretning af tidligere kunder
  • tids- og ressourcebesparelser på grund af at eliminere unøjagtige eller duplikerede data
  • forbedret produktivitet
  • øget holdmoral takket være gentagne effektive og nøjagtige resultater

9. "Hvad er målet med A / B-test?"

Spørgsmål om A / B-test under dit interview for en dataforskerposition kan begynde med en mere generisk henvisning til at bruge eksperimentelt design til at besvare en enkelt forespørgsel om brugeradfærd eller præferencer. Målet med at teste en webside-, app- eller nyhedsbrevdesignvariabel er ganske enkelt at evaluere, om en ændring vil øge interessen, engagementet og konverteringsfrekvensen.

En måde at skelne dig ud på ved besvarelsen af ​​disse typer interviewspørgsmål er at diskutere, hvordan andre dataforskere må drage de forkerte konklusioner fra A / B-test. Mulige faldgruber inkluderer:

  • ikke indsamling af tilstrækkelige data over en lang nok periode
  • test for mange variabler på én gang
  • ikke regnskabsmæssigt for eksterne faktorer, der kan påvirke trafikken i testperioden
  • ignorerer små gevinster, der kan bygge over tid og kombinere med andre positive ændringer for øget indtægt
  • mangler tolkninger i stort billede som netto økonomiske gevinster eller tab i forhold til konverteringskurser

Bortset fra at påpege disse problemer, skal du udtrykke, hvordan du ville løse dem - eller endnu bedre, hvordan du allerede har undgået dem i dine tidligere datavidensprojekter.

10. 'Du har 48 timer til at løse denne kodningsudfordring.'

Kodningsudfordringen kan være en første måde at screene potentielle datavidenskabsmænd, eller det kan være et andet trin i interviewprocessen, efter at du har ryddet det første forhindring med en rekrutterer eller ansættelsesleder. Dette kan være en test på stedet, der tager 30 minutter til 2 timer, hvor du skal kode på et tavle eller på et tastatur inden for interviewets synspunkt. Du får ofte et valg af sprog, men vær klar til at kode i SQL eller Python.

Nogle virksomheder tildeler længere opgaver med frister op til en uge. Whiteboard-udfordringer kræver muligvis skrivning af relativt enkle SQL-forespørgsler, men længere test er naturligvis mere komplekse. Typisk får du data og bliver bedt om at foretage specifikke forudsigelser ved hjælp af disse data, og du bliver nødt til at vise dit arbejde. For eksempel fik et nyligt datavidenskabsintervjuemne Airbnb-data og blev bedt om at forudsige huspriser baseret på indkvarteringsfunktioner.

Interviewterne vil diskutere dine valg med dig, de antagelser, du har foretaget, de funktioner, du valgte, hvorfor du brugte bestemte algoritmer og mere. Ofte er svaret, du ankommer til, mindre vigtigt end din proces, kreativitet, kodelæsbarhed og design.

Dette kan være en nervepirrende samtaleoplevelse, så forbered dig selv ved at oprette og afslutte praksis-kodning udfordringer med venner eller kolleger inden for datavidenskabsfeltet. Du kan også besøge steder som Leetcode og SQLZOO til kodningsøvelser. Faktiske spotte interviews, der involverer algoritmiske og systemdesignproblemer, er gratis tilgængelige via Interviewing.io.

Som du kan se, kan interviewspørgsmål til dataforskere være vanskelige, og den overordnede proces kan være langvarig og uhyggelig. Et af de vigtigste interviewtips er at forblive positiv, selvom du føler, at en del af interviewprocessen gik dårligt. Vi er ofte sværere for os selv end andre, og du kunne stadig lande jobbet på trods af at du ikke fik ethvert svar så perfekt, som du kunne have ønsket.

Hvis du går glip af muligheden, skal du bede om feedback og bruge den til at forbedre din næste samtaleoplevelse. Når alt kommer til alt blev mange veletablerede dataforskere afvist fra adskillige positioner og gik stadig videre til succes i de job, der i sidste ende var bedre egnet!

Hvilke spørgsmål og kodningsudfordringer stødte du på, da du forsøgte at lande et data science-job? Deltag i diskussionen i kommentarerne herunder og hjælp dine kolleger med datavidenskabsmænd at forberede sig til deres næste interview!

Efterlad Din Kommentar

Please enter your comment!
Please enter your name here