Fragen und Antworten zum Vorstellungsgespräch als Data Scientist • BUOM

5. März 2021

Arbeitgeber, die Bewerber für Stellen im Bereich Data Science interviewen, sollten die Fähigkeiten und Kenntnisse des Bewerbers in den Bereichen Algorithmen, Programmierung und Statistik bewerten. Daher stellt der Personalmanager Fragen im Vorstellungsgespräch, bei denen die Bewerber nachweisen müssen, dass sie bestimmte Datenbegriffe und Gleichungen kennen. Bereiten Sie sich auf Ihr Vorstellungsgespräch als Datenwissenschaftler vor, indem Sie mögliche Fragen durchgehen. In diesem Artikel werden wir allgemeine, Hintergrund- und detaillierte Interviewfragen für Datenwissenschaftler auflisten und Beispielantworten geben.

Hauptfragen

Allgemeine Fragen helfen dem Personalmanager, Ihre Persönlichkeit, Ihren Hintergrund und Ihr Interesse am Unternehmen und an der Position zu verstehen:

  • Was möchten Sie in fünf Jahren machen?

  • Warum möchten Sie für dieses Unternehmen arbeiten?

  • Warum interessiert Sie diese Arbeit?

  • Was wird Ihnen Ihrer Meinung nach an diesem Job am meisten Spaß machen?

  • Was wird Ihnen an diesem Job Ihrer Meinung nach am wenigsten gefallen?

  • Nennen Sie fünf Adjektive, die Sie beschreiben.

  • Was ist deine größte Stärke?

  • Welche Interessen oder Hobbys haben Sie?

  • Bist du ein Anführer oder ein Teamkollege?

  • Was dich motiviert?

  • Wie arbeiten Sie in Hochdrucksituationen?

  • Auf welche Ihrer Leistungen sind Sie besonders stolz?

  • Listen Sie drei Dinge auf, die Ihnen in Ihrem Job am wichtigsten sind.

  • Was für ein Buch hast du als letztes gelesen?

  • Was ist Ihre Lieblingswebsite?

  • Welchen Datenwissenschaftler bewundern Sie am meisten?

  • Welches ist Ihr Lieblings-Data-Science-Startup?

  • Warum willst du Karriere in der Datenwissenschaft?

  • Was ist Ihr ideales Arbeitsumfeld?

  • Wie heißt der CEO unseres Unternehmens?

  • Was hoffen Sie in Ihren ersten 90 Tagen im Unternehmen zu erreichen?

  • Worauf achten Sie bei einem Arbeitgeber?

Fragen zu Erfahrung und Hintergrund

Um herauszufinden, ob Sie für die Stelle gut geeignet sind und ob Sie die Werte des Unternehmens teilen, stellen Interviewer die folgenden Arten von Fragen:

  • Wie hat Sie Ihre bisherige Berufserfahrung auf diesen Job vorbereitet?

  • Welche Eigenschaften zeichnen einen großartigen Datenwissenschaftler aus?

  • Welche Fähigkeiten würden Sie für diesen Job mitbringen?

  • Listen Sie drei Dinge auf, die Ihr bisheriger Chef gerne von Ihnen verbessern würde.

  • An welchem ​​Projekt haben Sie zuletzt gearbeitet?

  • Welche Schritte befolgen Sie normalerweise in einem Analyseprojekt?

  • Wie gehen Sie mit Misserfolgen um?

  • Welche Programme und Computerprogramme kennen Sie?

  • Beschreiben Sie Ihren analytischen Stil.

  • Erzählen Sie mir von einer Situation, in der Sie mit Ihrem Chef nicht einverstanden waren, und wie Sie damit umgegangen sind.

  • Erzählen Sie mir von einer Situation, in der Sie mit einem Kollegen nicht einverstanden waren, und wie Sie damit umgegangen sind.

  • Beschreiben Sie eine Zeit, in der Sie über die Anforderungen eines Projekts hinausgegangen sind.

  • Welche Schritte haben Sie unternommen, um Ihre analytischen Fähigkeiten zu verbessern?

  • Erzählen Sie mir von dem letzten Fehler, den Sie in einem Algorithmus gemacht haben, und was Sie getan haben, um ihn zu beheben.

  • Erzählen Sie mir von dem größten Datensatz, den Sie verarbeitet haben, und wie er verwendet wurde.

Ausführliche Fragen

Diese Fragen geben dem Interviewer einen besseren Einblick in die Art und Weise, wie Sie Daten analysieren und über Ihre Entscheidungs- und Problemlösungsfähigkeiten:

  • Ist es besser, zu viele falsch-positive oder falsch-negative Ergebnisse zu haben?

  • Überprüfen Sie den Algorithmus, den Sie kürzlich in einem Projekt verwendet haben.

  • Welche Software und Tools haben Sie bei Ihrem letzten Projekt verwendet und warum haben Sie sich dafür entschieden?

  • Beschreiben Sie eine Herausforderung, mit der Sie während des Projekts konfrontiert waren, und wie Sie diese gemeistert haben.

  • Was sind Korrelation und Kovarianz?

  • Was ist der Zweck von A/B-Tests? Beschreiben Sie, wie Sie A/B-Tests in letzter Zeit eingesetzt haben.

  • Erklären Sie die Schritte zum Erstellen eines Entscheidungsbaums.

  • Geben Sie ein Beispiel für eine Zeit, in der Sie einen Entscheidungsbaumalgorithmus verwendet haben.

  • Beschreiben Sie mir eine Zeit, in der Sie Ensemble-Lernmethoden angewendet haben.

  • Wie würden Sie der Geschäftsleitung erklären, warum der Datensatz wichtig ist?

  • Warum wird Deep Learning Ihrer Meinung nach immer beliebter?

  • Wie würden Sie jemandem die logistische Regression erklären?

  • Können Sie mir ein Beispiel dafür nennen, wie Sie kürzlich die logistische Regression verwendet haben?

  • Bevorzugen Sie Python oder R? Warum?

  • Was sind Ihre Lieblingstools zur Datenvisualisierung?

  • Welche Methode verwenden Sie, um definitive Antworten vorherzusagen?

  • Wie wählt man K für K-Mittel aus?

  • Kennen Sie wirtschaftliche Begriffe wie Preisoptimierung, Preiselastizität, Bestandsverwaltung und Wettbewerbsintelligenz? Wenn ja, definieren Sie diese bitte.

  • Welche Einschränkungen gibt es bei Resampling-Methoden?

  • Wann hilft Parallelität Ihren Algorithmen und wann tut sie weh?

  • Wie stehen Sie zu den Emissionen?

  • Wie bewerten Sie das Logistikmodell?

  • Wie gehen Sie mit fehlenden Werten während der Analyse um?

  • Erstellen Sie eine Funktion mit zwei sortierten Listen, die eine sortierte Liste generiert, die die beiden verkettet.

  • Welche Probleme löst die Regularisierung?

  • Was sind die Vor- und Nachteile von Regularisierungsmethoden?

  • Wie kann man Multikollinearität überwinden?

  • Wie interpretieren Sie Konfidenzintervalle?

  • Welche Sprache verwenden Sie für die Fuzzy-Zusammenführung?

  • Wie können Sie feststellen, ob Ihr lineares Regressionsmodell zu bestimmten Daten passt?

  • Erklären Sie, wie Sie eine Beziehung zwischen einer kontinuierlichen Variablen und einer kategorialen Variablen finden würden.

  • Wenn Sie eine Münze 1000 Mal werfen und sie 575 Mal „Kopf“ ergibt, ist die Münze dann verzerrt?

  • Welcher Algorithmus für maschinelles Lernen gefällt Ihnen am besten? Warum?

  • Sind mehr Daten besser als weniger? Erklären.

  • Wie können Sie sicherstellen, dass Sie nichts analysieren, das zu bedeutungslosen Ergebnissen führt?

  • Wie kann eine Überanpassung bei der Entwicklung eines statistischen Modells verhindert werden?

Interviewfragen mit Beispielantworten

Bevor Sie sich für eine Stelle als Datenwissenschaftler bewerben, üben Sie die Beantwortung dieser Fragen im Vorstellungsgespräch für Datenwissenschaftler und vergleichen Sie Ihre Antworten mit den Beispielantworten:

1. Wie oft werden Sie den Algorithmus aktualisieren?

Datenwissenschaftler müssen ihre Algorithmen regelmäßig aktualisieren, um relevante und genaue Daten bereitzustellen und zu sammeln. Personalmanager können diese Frage stellen, um Ihre Entscheidungsfähigkeiten zu bewerten und zu sehen, ob Sie Ihre Algorithmen so oft aktualisieren, wie es erforderlich ist.

Beispiel: „Ich aktualisiere den Algorithmus, wenn ich möchte, dass sich das Modell weiterentwickelt, während Daten durch seine Infrastruktur fließen, wenn sich seine Datenquelle ändert, wenn die Daten instationär sind, wenn die Ergebnisse des Algorithmus ungenau sind oder wenn der Algorithmus nicht so funktioniert.“ erwartet.”

2. Können Sie den Unterschied zwischen Validierungssatz und Testsatz erklären?

Datenwissenschaftler nutzen Datensätze, um Modelle und Algorithmen zu trainieren und zu aktualisieren. Sie müssen wissen, was jeder Satz tut, welchen Sie verwenden müssen, um die gewünschten Ergebnisse zu erzielen, und in der Lage sein, sicherzustellen, dass die Algorithmen ordnungsgemäß funktionieren.

Beispiel: „Der Validierungssatz ist Teil des Trainingssatzes. Ich verwende es, um Parameter auszuwählen und eine Überanpassung beim Erstellen eines Modells zu verhindern. Der Testsatz bewertet die Leistung des trainierten Modells. Ich könnte einen Testsatz verwenden, um die Generalisierung und Vorhersagekraft zu bewerten. „

3. Beschreiben Sie die Regularisierung und ihre Bedeutung

Regularisierung ist ein wichtiges Konzept beim maschinellen Lernen und maschinelles Lernen ist ein wichtiger Teil der Datenwissenschaft. Personalmanager möchten wissen, wie gut Sie verschiedene Aspekte des maschinellen Lernens verstehen.

Beispiel: „Regularisierung fügt dem Modell einen Optimierungsparameter hinzu, der eine Überanpassung verhindert und das Problem im Wesentlichen besser löst.“ Normalerweise füge ich dem vorhandenen Gewichtsvektor einen konstanten Multiplikator wie L1 oder L2 hinzu. Das Ziel besteht darin, den Durchschnittswert der Verlustfunktion oder des Fehlers zu reduzieren, der anhand des regulierten Trainingssatzes geschätzt wird.“

4. Was ist ein Selektionsbias und warum ist er wichtig?

Datenwissenschaftler stoßen bei der Analyse von Daten häufig auf Selektionsverzerrungen. Wenn eine Verzerrung auftritt, werden die Ergebnisse nicht mehr randomisiert und sind daher weder genau noch repräsentativ für diese Population oder diesen Datensatz. Personalmanager möchten sicherstellen, dass Sie Auswahlverzerrungen verstehen, damit Sie sie überwachen und verhindern können, dass sie auftreten.

Beispiel: „Stichprobenverzerrungen treten auf, wenn nicht zufällige Stichproben einer Grundgesamtheit zu Fehlern im Modell führen.“ Auswahlverzerrungen verzerren die Datenanalyse und führen zu ungenauen Ergebnissen. Ich verwende Boosting-, Resampling- und Gewichtungstechniken, um Auswahlverzerrungen zu korrigieren, wenn sie unvermeidbar sind.“

5. Bevorzugen Sie bei der Textanalyse Python oder R?

Python und R sind Open-Source-Programmiersprachen, die in der Datenwissenschaft weit verbreitet sind. Personalchefs möchten sicherstellen, dass Sie verstehen, wann Sie die einzelnen Elemente verwenden müssen.

Beispiel: „Ich bevorzuge Python für Textanalysen, weil es eher eine Allzweck-Skriptsprache als R ist. Für alle Textanalysen ist es schneller als R.“ Es verfügt außerdem über benutzerfreundliche Datenstrukturen und hervorragende Datenanalysetools. R ist nützlicher. für Statistik und maschinelles Lernen.“

6. Was ist der Unterschied zwischen maschinellem Lernen und Deep Learning?

Maschinelles Lernen und Deep Learning sind wichtige Teilbereiche der künstlichen Intelligenz. Beide beinhalten das Studium von Computeralgorithmen. Datenwissenschaftler müssen beides verstehen und nutzen können.

Beispiel: „Maschinelles Lernen nutzt Algorithmen, die es Computern ermöglichen, zu lernen, ohne dass sie programmiert werden müssen.“ Die drei Arten des maschinellen Lernens sind überwachtes, unbeaufsichtigtes und verstärkendes Lernen. Deep Learning ist eine Form des maschinellen Lernens, bei der Algorithmen von künstlichen neuronalen Netzen beeinflusst werden. Maschinelles Lernen trifft Entscheidungen auf der Grundlage dessen, was es von Algorithmen gelernt hat, während Deep Learning Algorithmen so überlagert, dass es Entscheidungen selbstständig trifft.

7. Was ist Resampling und welchen Nutzen hat es?

Datenwissenschaftler nutzen Resampling, um die Genauigkeit der Datenerfassung zu verbessern. Einstellungsmanager möchten sicherstellen, dass Datenwissenschaftler das Resampling korrekt anwenden und Maßnahmen ergreifen, um genaue Daten zu sammeln.

Beispiel: „Resampling beinhaltet das Sammeln wiederholter Stichproben aus einer Schlüsseldatenstichprobe, um eine genauere Parameterschätzung zu erhalten.“ Resampling-Methoden sind hilfreich, wenn versucht wird, festzustellen, ob die Stichprobenstatistik korrekt ist, wenn die Bezeichnungen von Datenpunkten während Signifikanztests geändert werden und wenn zufällige Teilmengen verwendet werden. um Modelle zu testen.

8. Beschreiben Sie die Schritte, die Sie in einem Analyseprojekt unternehmen werden

Personalmanager stellen diese Frage möglicherweise, um zu verstehen, wie Sie Probleme lösen und an Projekten arbeiten. Sie suchen nicht so sehr nach der richtigen Antwort, sondern nach Ihren Methoden zur Problemlösung. Ihre Schritte müssen gut durchdacht und organisiert sein.

Beispiel: „Normalerweise befolge ich sechs grundlegende Schritte, wenn ich an einem Analyseprojekt arbeite. Zunächst ermittle ich, was das Problem ist und wie es sich auf das Unternehmen auswirkt. Dann sammle ich die Daten und mache mich mit ihnen vertraut. Sobald ich die Daten verstehe, erkenne ich Ausreißer. , Variablen transformieren und fehlende Werte verarbeiten, um Daten für die Modellierung vorzubereiten. Sobald alles fertig ist, führe ich das Modell aus, interpretiere und analysiere das Ergebnis und nehme dann Änderungen am Ansatz vor. Ich wiederhole diesen Schritt nach Bedarf, bis ich die gewünschten Ergebnisse erhalte.

Danach verwende ich den neuen Datensatz, um das Modell zu testen. Schließlich beginne ich mit der Verwendung des neuen Modells und verfolge seine Ergebnisse, um seine Wirksamkeit im Laufe der Zeit zu verfolgen.“

9. Schreiben Sie eine Formel zur Bestimmung des R-Quadrats.

Diese Art von Frage liefert dem Interviewer den Beweis, dass Sie Ihre Gleichungen, Formeln und Algorithmen kennen. Sie sollten in der Lage sein, gängige Formeln aus dem Gedächtnis aufzulisten.

Beispiel: „Die Formel, die ich zur Berechnung des R-Quadrats verwende, ist eins minus die Restsumme der Quadrate dividiert durch die Gesamtsumme der Quadrate.“

10. Wie würden Sie eine Taxonomie entwickeln, um wichtige Kundentrends auf der Grundlage unstrukturierter Daten zu identifizieren?

Auch hier möchte der Personalmanager wissen, wie Sie das Problem lösen, welche Schritte Sie unternehmen und mit wem Sie kommunizieren. Sie möchten Beispiele für Prozesse und Methoden, die Sie in Ihrer Antwort verwenden könnten.

Beispiel: „Ich habe zunächst mit dem Manager oder Eigentümer des Unternehmens gesprochen, um den Hauptgrund für die Klassifizierung dieser Daten herauszufinden. Anschließend würde ich neue Datenproben sammeln, das Modell verbessern und seine Genauigkeit testen. Ich habe weiterhin mit dem Manager kommuniziert. oder Eigentümer, um sicherzustellen, dass das Modell die gewünschten Ergebnisse liefert, und um Wege zu finden, es im Laufe der Zeit weiter zu verbessern.“

Ähnliche Beiträge

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert