Questions d'entretiens - Junior data engineer

705

Questions d'entretien pour Junior Data Engineer partagées par les candidats

Principales questions d'entretien

Trier: Pertinence|Populaires|Date
Allstate
On a demandé à Junior Data Scientist...5 janvier 2017

If a jar has X red balls and Y blue balls, what is the minimum number of draws that is necessary to ensure that you have one ball of each color?

3 réponses

max(X, Y)+1

It is max, the first reply was correct. I you have 5 blue balls and 2 red balls : - If it was min : you take 3 balls, it is still possible to have picked 3 blue balls. - with max : you take 6 balls, the worst case is that you have picked 5 blue and 1 red balls. Moins

min(X,Y) + 1 is correct, not max()

Automatic

If the coefficient of an independent variable in linear regression has an opposite sign than it should be, what might be the reason

1 réponses

multicollinearity

Actori

Introductory questions. Describing yourself. Your skills. Your past experiences. Presentation of a Case Study that was provided a few days before the interview.

1 réponses

I answered honestly. I sounded genuine and friendly. Smiling all the time. Presented the Case Study and answered the questions that followed. Moins

Tell us about your programming learning experience?

1 réponses

Talked about my learning experience

Are you a challenging person?

1 réponses

I said yes

Schwarz Dienstleistung

Wann benutzt man Decision Trees, wann Neuronale Netze? Wenn ein neuronales Netz 90% Accuracy auf dem Training Set hat, aber 50% auf dem Test Set, was haben wir dann? -> Overfitting ..Basics zu Machine Learning

1 réponses

Wann benutzt man Decision trees: Um herauszufinden, ob das Problem ML überhaupt benötigt und /oder um eine Benchmark zu bekommen, die das NN schlagen sollte. Unterliegt das NN, weiß ich, dass ich den Data Scientist rausschmeißen kann, da er Fake ist. Wenn ich ein modernes Framework (z. B. Tensoflow) verwende, sind NN den DT in jeder hinsicht überlegen und bieten keinen Vorteil, außer vlt. kürzere Trainingszeit unter bestimmten Bedingungen. Das ist aber vernachlässigbar. Accuracy ist im Training höher als Test: Es kann natürlich Overfitting (das NN lernt die Trainingsdaten auswendig) sein. Genauso kann aber ein Auto, dass nicht anspringt entweder einen Motorschaden oder einen leeren Tank haben. Man müsste erstmal die Lernkurve ansehen (z. B. TensorBoard) und dann einen Blick auf die Daten werfen: Sind die Daten vlt. noch sortiert? Sind die Daten in Test und Training gleich verteilt? -> Ich mache [train, test].shuffle und splitte danach, was für Werte habe ich nun Habe ich Features die zu stark gewertet werden? -> sind IDs drinnen oder zu genaue Timstamps, habe ich alle Werte normalisiert Welche Architektur hat mein NN? Was passiert wenn ich verschiedene Parameter durchprobiere (Hyperparameter Tuning)? Moins

Enhance IT

Given a list of words, sort these words from lowest character length to highest.

1 réponses

Just make sure to know the common sorting methods in your programming language of choice. Moins

Allstate

If you have a bag of jelly beans with a large number of two different colors, whats the minimum you need to pick out to guarantee that you have at least 2 of the same color? Then the question in the general case.

1 réponses

3, and for the general case picking m with the same color from n classes you'd need: m * n + 1. Use "worst case scenario" analysis. Moins

Allstate

Taje a jar with stones of three colors, how many draws do you need to get two stones of the same color? Generalise to n colors, k stones.

1 réponses

Answer is 4 draws and the formula is n(k-1)+1 = 3(2-1)+1 = 4

A1 Hrvatska

What was your favourite subject at college?

1 réponses

Machine learning

1 - 10 sur 705 Questions d'entretien