Τα κορυφαία στελέχη στην Ελλάδα μιλούν για τον κλάδο του Data Science.

Πώς βλέπουν το επάγγελμα του Data Scientist όσοι ασχολούνται με αυτό; Γιατί το επέλεξαν και επένδυσαν σε αυτόν τον χώρο; Ποια είναι τα στοιχεία που τους βοήθησαν να διακριθούν και να ανελιχθούν στην αγορά εργασίας; Τι ζητούν από τους επαγγελματίες που θα ενταχθούν στις ομάδες τους; Ποιά είναι η γνώμη τους για την εξ αποστάσεως εργασία ?

Αναμφίβολα, ο κλάδος του Data Science και της Ανάλυσης Δεδομένων, έχει αναδειχθεί ως ένας από τους πιο δημοφιλείς τομείς στην αγορά εργασίας, με όλο και περισσότερους υποψηφίους να στρέφονται σε αυτόν λόγω της μεγάλης ζήτησης, των υψηλών απολαβών και των επαγγελματικών ευκαιριών που προσφέρει.

Ας δούμε τι λένε τα κορυφαία στελέχη των πιο επιτυχημένων Ελληνικών εταιρειών, που βρίσκονται χώρο του Data Science και πώς περιγράφουν τη δική τους εμπειρία, μέσα από αποσπάσματα από τις συνεντεύξεις τους στο Workearly και το Βήμα.

 

Γεράσιμος Μαρκέτος- Director of Product, Hack The Box 

 

Μία μικρή περιγραφή για εσένα, την εμπειρία σου στον κλάδο του Data Science, την τωρινή σου δραστηριότητα και τις αρμοδιότητες σου περιληπτικά.

Είχα την ευκαιρία να αποκτήσω ερευνητική και επαγγελματική εμπειρία στο χώρο της διαχείρισης και ανάλυσης δεδομένων. Στα πλαίσια του διδακτορικού μου ασχολήθηκα με την επέκταση τεχνολογιών data warehousing και mining με στόχο την αξιοποίηση χωροχρονικών δεδομένων. Επαγγελματικά, ξεκίνησα να ασχολούμαι το 2005 με σχεδιασμό λύσεων Business Intelligence και analytics.

Από εκεί πέρασα στο χώρο του cybercrime/fraud prevention με χρήση analytics και machine learning μοντέλων – τότε είχα την ευκαιρία να δω πως αυτές οι τεχνολογίες μπορούν να αξιοποιηθούν πέρα από reporting, ως μερος εφαρμογών με έμφαση τον εντοπισμό outliers και γενικότερα περιπτώσεων απόκλισης από γνωστά πρότυπα.

Τα τελευταία δύο χρόνια βρίσκομαι στην Hack The Box, ως Head of Product, και ασχολούμαι με σχεδιασμό προϊόντων που βοηθούν cybersecurity ομάδες να αποκτήσουν τις δεξιότητες που χρειάζονται ώστε να ανταπεξέλθουν στις καθημερινές προκλήσεις που αντιμετωπίζουν.

Τί σου αρέσει περισσότερο όσον αφορά την εργασία σου στον κλάδο του Data Science?

Το εύρος των προβλημάτων στα οποία βρίσκουν εφαρμογή αυτές οι τεχνολογίες και το γεγονός ότι μπορούν να μας οδηγήσουν σε σημαντική γνώση αξιοποιώντας δεδομένα που σε πρώτη ματιά μπορεί να φαίνονται μη σημαντικά ή μη συσχετιζόμενα.

Τί είναι αυτό που παρατηρείς ως major event, τάση ή αλλαγή που θα αλλάξει τον κλάδο του Data Science και των Analytics τα επόμενα 5 χρόνια? Ποιά είναι η άποψη σου για το remote working?

Θα έλεγα ότι παρατηρούμε την ωρίμανση και σε μεγάλο βαθμό το “commoditization” τεχνολογιών του χώρου που εμφανίστηκαν πριν μερικά χρόνια. Πλέον δε συζητάμε αν χρειαζόμαστε αυτές τις τεχνολογίες ή πώς θα γίνει η ενσωμάτωση τους στις διαδικασίες ενος οργανισμού. Αντιθέτως, θεωρούμε δεδομένη τη χρήση τους ως μέρος διαδικασιών και συστημάτων.

Σχετικά, με το remote working: ανοίγει νέες προοπτικές τόσο για τους εργαζόμενους όσο και για τις εταιρείες. Ειδικά στο χώρο των analytics, που παρατηρείται όλο και μεγαλύτερη εξειδίκευση, βλέπουμε να γίνεται τάση η αναζήτηση ταλέντων σε παγκόσμιο επίπεδο.

Ποιά είναι τα skills που χρειάζεται ένας/μια  επαγγελματίας στον κλαδο του Data Science ώστε να πετύχει ? Ποιά είναι τα ιδανικά χαρακτηριστικά που θα ήθελες να δεις σε έναν candidate ώστε να ενταχθεί στις ομάδες σου στην “Hack The Box”  ?

 Η ομάδα των analytics στην Hack The Box αποτελείται από αναλυτές και μηχανικούς που γνωρίζουν άριστα το αντικείμενο τους και, έχοντας κατανοήσει σε βάθος την περιοχή στην οποία εστιάζουν, χρησιμοποιούν δεδομένα για να λύσουν προβλήματα και να υποστηρίξουν αποφάσεις. Επιπλέον, παρακολουθούν τις τάσεις στην περιοχή των analytics και ενσωματώνουν νέες τεχνικές και τεχνολογίες που ταιριάζουν στο περιβάλλον μας.

Αυτά θα έλεγα είναι και τα χαρακτηριστικά ενός καλού επαγγελματία στη συγκεκριμένη περιοχή. Ένας συνδυασμός τεχνικών γνώσεων με ενδιαφέρον ή και περιέργεια ακόμα να μάθουν περισσότερα για το περιβάλλον στο οποίο λειτουργούν.

Πώς η “Hack The Box” χρησιμοποιεί την επιστήμη των Δεδομένων για να βελτιώσει το προϊόν της και το user experience ?

Χρησιμοποιούμε analytics για την επεξεργασία και ανάλυση μεγάλου όγκου δεδομένων που μας βοηθούν να κατανοήσουμε με ποιό τρόπο οι χρήστες χρησιμοποιούν τα προϊόντα μας, τη διαχρονική τους πορεία πάνω στις πλατφόρμες μας, τις προτιμήσεις τους κτλ. Επιπλέον, ως εργαλεία που ενσωματώνουμε στα προϊόντα μας για να παρέχουμε insights πάνω στις δεξιότητες που αποκτούν μεμονωμένοι χρήστες, ομάδες ή και σε επίπεδο οργανισμού.

Όπως ανέφερα και προηγουμένως, μελετάμε επίσης την επίδραση που έχουν αυτές οι τεχνολογίες στο χώρο της κυβερνοασφάλειας: ως εργαλεία άμυνας/επίθεσης ή και ως στόχοι επιθέσεων.

Ποιά συμβουλή θα έδινες σε κάποιον/α που θέλει να ξεκινήσει την καριέρα του στον κλάδο την Ανάλυσης Δεδομένων? Το Workearly παρέχει τα πρώτα εκπαιδευτικά προγράμματα Data Science στην Ελλάδα που προσομοιώνουν πραγματικές συνθήκες εξ αποστάσεως εργασίας μέσω της εκπαίδευσης, με projects σε πραγματικά datasets και task based training. Ποία είναι η άποψη σου για την πρωτοβουλία αυτή και την λογική της hands on εκπαίδευσης ?»         

Να αποκτήσει τις βασικές γνώσεις γύρω από το αντικείμενο και να φροντίζει να τις επεκτείνει συνεχώς. Υπάρχουν πολλά εργαλεία, προγραμματιστικές βιβλιοθήκες κτλ εκεί έξω αλλά είναι σημαντικό να μη χρησιμοποιούνται “τυφλά”, να γνωρίζουμε τις θεμελιώδεις αρχές πάνω στις οποίες έχουν υλοποιηθεί.

Η πρωτοβουλία της Workearly που στοχεύει στην πρακτική εξοικείωση με το χώρο του Data Science είναι σίγουρα προς τη σωστή κατεύθυνση μιας και παρέχει γνώσεις και εφόδια για να βρει κάποιος μια θέση εργασίας ή και να εξελιχθεί στην εργασία του.

Η απόκτηση πρακτικής εμπειρίας είναι επίσης σημαντική και υπάρχουν δυνατότητες ακόμα και πριν ξεκινήσει κάποιος την επαγγελματική του πορεία, συμμετέχοντας για παράδειγμα σε data science διαγωνισμούς μέσω Kaggle κτλ.

Μπορείτε να διαβάσετε όλη την συνέντευξη εδώ

Καποδίστριας Νικόλαος – Director of Data Science, Spotawheel

Μία μικρή περιγραφή για εσένα, την εμπειρία σου στον κλάδο του Data Science, την τωρινή σου δραστηριότητα και τις αρμοδιότητες σου περιληπτικά. 

Κατάγομαι από την όμορφη Κέρκυρα (νομίζω είναι εμφανές από το επώνυμό μου). Αν κατάγομαι και από την ιστορική οικογένεια του Καποδίστρια δε γνωρίζω με βεβαιότητα, όμως ξέρω ότι είμαστε από διπλανά χωριά. Είμαι παντρεμένος και έχω 2 μικρά παιδάκια. Σπούδασα στατιστική (πτυχίο και μεταπτυχιακό), την οποία αγαπάω πολύ ως επιστήμη, συνεπώς το data science ήρθε ως φυσική εξέλιξη των πραγμάτων. Έχω απασχοληθεί τόσο στην Accenture όσο και στο Beat app στο κομμάτι του Data Science και Machine Learning Engineering για περίπου 11 χρόνια. Πλέον ως Director του Data Science στην Spotawheel είμαι υπεύθυνος για την οργάνωση και στελέχωση του τμήματος data science, για τη δημιουργία μίας κουλτούρας όπου κάθε εργαζόμενος θα ήθελε έχει, για την δημιουργία ενός στρατηγικού προγράμματος με βάθος χρόνου και τέλος την τεχνική καθοδήγηση ώστε να χρησιμοποιούμε πάντα τεχνολογίες αιχμής.

Τί σου αρέσει περισσότερο όσον αφορά την εργασία σου στον κλάδο του Data Science? 

Εκείνο το οποίο μου αρέσει περισσότερο στον κλάδο αυτό είναι η προσπάθεια να μεταφράσεις ένα επιχειρηματικό πρόβλημα σε τεχνικό (data science), και η όλη συλλογική προσπάθεια της ομάδας τελικά να βγει στην παραγωγή. Να δεις δηλαδή εταιρικές αποφάσεις να λαμβάνονται μέσω των αποτελεσμάτων των αλγορίθμων και κατ’ επέκταση οι υπάλληλοι της εταιρείας να ασχολούνται με άλλα πιο ιδιαίτερα προβλήματα. Γενικά ο κανόνας είναι ότι 1 στα 10 data science projects βγαίνουν στην παραγωγή, συνεπώς η χαρά και η ικανοποίηση της ομάδας όταν το πετυχαίνει είναι η καλύτερη ανταμοιβή για εμένα.

Τί είναι αυτό που παρατηρείς ως major event, τάση ή αλλαγή που θα αλλάξει τον κλάδο του Data Science και των Analytics τα επόμενα 5 χρόνια? Ποιά είναι η άποψη σου για το remote working?

Κοιτώντας μπροστά βλέπω 3 major events. Στο εγγύς μέλλον οι εταιρείες λόγω κόστους δε θα μπορούν να απασχολούν data scientists, machine learning scientists, machine learning engineers και data engineers. Θα αναζητούν επαγγελματίες οι οποίοι είναι T-shaped. Δηλαδή να έχουν ένα πολύ καλό business acumen και ideation (data scientists) και παράλληλα να έχουν καλές δεξιότητες στο κομμάτι των big data αλλά και του productionisation ενός data science project. Εν ολίγοις επαγγελματίες οι οποίοι να μπορούν να εκτελέσουν ένα project από την αρχή έως το τέλος του.

Το δεύτερο major event αφορά τους κλάδους του περιβάλλοντος και των κλινικών δοκιμών. Θεωρώ ότι η χρήση του computer vision & natural language process στις κλινικές δοκιμές για ασθένειες όπως ο καρκίνος αλλά και στην κλιματική αλλαγή (η οποία τα τελευταία χρόνια έχει γίνει πολύ αισθητή παγκοσμίως) θα είναι σε μεγάλη άνθηση. Τέλος, καθώς εξελίσσεται και η τεχνολογία το επόμενο best thing είναι η χρήση του quantum computing σε data science προβλήματα. Θα ελαχιστοποιήσει τον χρόνο που χρειάζονται τώρα αλγόριθμοι να αναζητήσουν λύση σε πολύ σύνθετα προβλήματα.

Όσον αφορά το remote working πιστεύω ήρθε για να μείνει και ως ιδέα το υποστηρίζω πάρα πολύ. Ίσως ακόμα δεν μπορεί να εφαρμοστεί σε όλες τις θέσεις εργασίας κάτι το οποίο είναι λογικό. Προσωπικά μου δίνει την ευελιξία να βρίσκω επαγγελματίες σε διάφορες περιοχές της Ελλάδας και του εξωτερικού που πριν δεν μπορούσα. Εάν πχ ένας καλός υποψήφιος ζει σε μία πόλη της Ελλάδας και για προσωπικούς λόγους δεν μπορεί να φύγει από εκεί, εγώ γιατί να τον χάσω? Παράλληλα 3 χρόνια τώρα που δουλεύουμε με τις ομάδες σε καθεστώς remote working, η παραγωγικότητα της ομάδας είναι στα ίδια ή αν όχι σε υψηλότερα επίπεδα από πριν τον κορονοιό, ενώ μαζευόμαστε 1 φορά το μήνα όλοι μαζί για να μη χάνουμε και την προσωπική επαφή. Συνεπώς δε βρίσκω λόγο να μην το υποστηρίζω.

Ποιά είναι τα skills που χρειάζεται ένας/μια επαγγελματίας στον κλαδο του Data Science ώστε να πετύχει ? Ποιά είναι τα ιδανικά χαρακτηριστικά που θα ήθελες να δεις σε έναν candidate ώστε να ενταχθεί στις ομάδες σου στην Spotawheel ?

Πιστεύω ότι αρκετός κόσμος από διαφορετικές ειδικότητες μπορεί να απασχοληθεί στον τομέα του data science αλλά θα έχει και διαφορετική καμπύλη εκμάθησης. Η βάση του data science είναι η στατιστική. Για παράδειγμα, κάποιος απόφοιτος ενός τμήματος στατιστικής είναι πιο εύκολο να ενταχθεί στο data science αρκεί να μάθει καλό προγραμματισμό. Κάποιος απόφοιτος του τμήματος ηλεκτρονικών υπολογιστών ή ψηφιακών συστημάτων γνωρίζει προγραμματισμό όμως όχι στατιστική, συνεπώς θα χρειαστεί μεγαλύτερο χρόνο εκμάθησης. Πολύς κόσμος θεωρεί ότι το data science είναι η δημιουργία ενός σύνθετου αλγορίθμου και αυτό είναι το κομμάτι που τους κεντρίζει το ενδιαφέρον. Η βασική αρχή του data science είναι να λύσεις ένα πρόβλημα χωρίς να κάνεις χρήση του data science.

Στο data science είμαστε μία ζωντανή οντότητα. Δεν υπάρχουν silo ούτε one man show projects. Συνεπώς το πιο σημαντικό skill για εμένα είναι η ομαδικότητα. Κάθε επαγγελματίας θα πρέπει πρώτα απ’ όλα να μπορεί να συνεργαστεί με μία ομάδα. Να δέχεται τις απόψεις των συναδέλφων του, τη διαφορετικότητά τους και να γνωρίζει ότι όλες οι αποφάσεις είναι συλλογικές, γιατί όταν θα πετύχουμε κάτι θα το πετύχουμε ως ομάδα. Ένα επίσης σημαντικό skill είναι η προσοχή στη λεπτομέρεια. Όπως προανέφερα η προετοιμασία των δεδομένων είναι το 70% του project. Άρα ο υποψήφιος θα πρέπει να ξέρει να κάνει στατιστικές αναλύσεις, να ψάχνει λάθη στα δεδομένα και να αναζητεί εκείνες τις λεπτομέρειες που θα κάνουν τη διαφορά. Εάν έπρεπε να συμπεριλάβω ένα ακόμα skill είναι το “solve local & think bigger”.

Πώς η Spotawheel χρησιμοποιεί την επιστήμη των Δεδομένων για να βελτιώσει το προϊόν της και το user experience ?

Συχνά μου κάνουν την ερώτηση “Μα τι data science projects μπορεί να χρειάζεται μία εταιρεία σαν τη Spotawheel”? Και όμως σε βάθος χρόνου 3ετίας έχουμε δημιουργήσει ένα πλανόγραμμα με πάνω από 20 projects τα οποία σκοπό έχουν να βοηθήσουν όλους τους τομείς της εταιρείας μας. Για παράδειγμα ένα από τα σημαντικότερα project της εταιρείας είναι η τιμολόγηση των αυτοκινήτων που πωλούμε στις αγορές που δραστηριοποιούμαστε. Από πλευράς data science είναι ένα project που συνδυάζει 4 βασικά χαρακτηριστικά. Αρχικά, μία πολύ καλή προετοιμασία δεδομένων, με τη συλλογή των στοιχείων εκείνων που επηρεάζουν την τιμή ενός αυτοκινήτου- μάρκα, μοντέλο, κυβικά, ίπποι.

Αλγόριθμοι computer vision έρχονται και εμπλουτίζουν τα δεδομένα μας με επιπλέον δεδομένα τα οποία αρχικά δεν είναι διαθέσιμα. Τέλος, ένα σύνολο αλγορίθμων οι οποίοι εκπαιδεύονται σε αυτά τα δεδομένα ώστε να κάνουν μια ακριβή εκτίμηση της τιμής πώλησης.

Σε όλη αυτή τη διαδικασία φυσικά έχουμε στενή συνεργασία με συνεργάτες της εταιρείας μας οι οποίοι γνωρίζουν πως κινείται η αγορά του μεταχειρισμένου αυτοκινήτου και με τις δικές τους γνώσεις προσπαθούμε συνεχώς να κάνουμε τον αλγόριθμο ακόμη καλύτερο. Σε γενικές γραμμές ορισμένα από τα project μας αφορούν την βελτιστοποίηση της σύνθεσης του χαρτοφυλακίου των αυτοκινήτων μας σε κάθε αγορά, τον τρόπο προβολής των αυτοκινήτων στο site μας με βάση τις προσωπικές ανάγκες του κάθε πελάτη , τη γενική εξυπηρέτηση των πελατών μας με έξυπνα chatbots, αλλά και τη βελτιστοποίηση του budget για προωθητικές ενέργειες.

Μπορείτε να διαβάσετε όλη την συνέντευξη εδώ

Ακολούθησε το Βήμα στο Google news και μάθε όλες τις τελευταίες ειδήσεις.