Archivi categoria: Hobby

Come Diventare DataScientist da Autodidatta

-Dottore mio figlio vuole diventare DataScientist secondo lei è grave?

-Gravissimo signora, mi dispiace per lei, ma io l’avevo avvertita. Purtroppo la medicina non ha risposte a queste malattie. Si prepari, si prepari, suo figlio andrà all’IKEA o per risparmiare tempo comprerà delle lavagne su Amazon(https://amzn.to/2NpOImd), ne abbiamo già visti di casi del genere.

Le ha già parlato entusiasta di MonteCarlo (https://it.wikipedia.org/wiki/Metodo_Monte_Carlo)?

-Si.

-Allora è più grave di quanto pensassi.

 

Ieri o l’altro ieri mi aveva scritto Davide Sicignani , sempre un fratello del gruppo InnLab, di Terracina (quindi dietro casa), ma che ho conosciuto solo a Londra.

Da sinistra Ugo, Davide, Gabriele ed Io in un tipico pranzo della Domenica Londinese

Davide mi chiedeva un consiglio per un suo amico Biologo che vuole avvicinarsi a Python e DataScience.

In particolare mi contattava perché ho cominciato da Zero e da Autodidatta.

Non essendo la prima persona che mi ha contattato per questo motivo, anche Stefano (sempre InnLab) qualche mese fa, ho deciso di scriverci due righe.

E’ opportuno distinguere tre domini di conoscenza che rientrano a mio avviso sotto il grande cappello del DataScientist, ma lo farò in un altro post:

  • Data Engineering (Informatica)
  • Data Modeling (Probabilità e Statistica- Ricerca Operativa)
  • Business Intelligence (Capacità Analitica)

Quello che racconterò è un po’ la sintesi del mio percorso e delle risorse utilizzate.

Indubbiamente la strada migliore per essere DataScientist è la stessa che caratterizza il settore medico:

La perfetta sinergia tra Pratica, Studio e degli ottimi Mentor.

Cosa ho capito fino ad oggi:

  1. Non esistono corsi che in un mese o in una settimana ti permettono di diventare DataScientist, se dicono il contrario è una balla
  2. Non è possibile diventare DataScientist solo attraverso la pratica
  3. Non è possibile diventare DataScientist solo attraverso i libri
  4. E’ estremamente bello
  5. E’ estremamente faticoso
  6. Esistono molte persone del mestiere disposte ad aiutarti (gratis)
  7. Per iniziare a capirci qualcosa serve almeno un anno di allenamento
  8. L’anno di allenamento necessario non ti esime dal provare a trovare lavoro anche se non hai abbastanza esperienza, quello che sai fare ed hai imparato fallo valutare anche agli altri. Rischi di rimandare il tuo ingresso nel settore spaventato di non essere all’altezza

 

Ahi quanto a dir qual era è cosa dura

esta selva selvaggia e aspra e forte

che nel pensier rinova la paura!

–Dante Alighieri, Inferno, I Canto

 

Quindi quali sono le risorse da scegliere per intraprendere questo percorso?

Ecco le mie:

DataCamp.com

Ad Agosto 2017 ho iniziato a studiare su DataCamp.com ho seguito tutto il percorso per diventare DataScientist.

Consigliatissimo.

Il costo per un anno di accesso a tutti i corsi è di 130/180$ adesso non ricordo precisamente.

Ottimo investimento, corsi semplici, ma efficaci.

Questi corsi servono per una prima infarinatura sul Machine Learning e Python.

L’app mobile permette di allenarsi anche sul bus o in metro su concetti basilari.

Contro, non è assolutamente sufficiente per lavorare, sono necessarie altre risorse a supporto.

 

Python for Data Analysis: Data Wrangling with Pandas, Numpy, and IPython

Il link al libro *-> https://amzn.to/2NrqLuJ

E’ il libro scritto da Wes McKinney, l’autore della libreria Pandas, una delle più usate in Python per la manipolazione e pulizia dei dati.

Il libro me lo aveva regalato Marchetti quando ho cominciato questo percorso ed è stato una grande risorsa, perché gradualmente spiega tutto quello che è necessario sapere per la pulizia e manipolazione dei dati.

Ho impiegato un anno per studiarlo tutto e altri sei mesi servirebbero per ripassarlo ed allenarsi su tutti i concetti che vengono illustrati.

Il libro va letto, studiato, con il pc ed il notebook jupyter aperti.

In questo modo è possibile riprodurre in tempi brevi tutti i consigli ed esempi riportati nel testo.

Se non si mettono in pratica gli esempi riportati, anche modificandoli a piacere, il libro perde gran parte della sua efficacia.

 

Pratica

Questa parte è F-O-N-D-A-M-E-N-T-A-L-E

Ho avuto modo di fare pratica attraverso progetti di consulenza, progetti pro-bono, data set pubblici, durante gli step tecnici di alcuni colloqui di lavoro e lavorando su freelancer.com.

Il tempo viene dedicato in buona parte alla pulizia e manipolazione dei dati, è frustrante, ma è sempre così. 

Solo col tempo ed esperienza si diventa veloce in questa parte del lavoro.

Esistono tantissimi data set pubblici anche italiani dove acquisire dati e iniziare ad effettuare un po’ di Data  Visualization, inferenze e creare qualche modello di Machine Learning

Eccone alcuni:

 

C’è anche Kaggle

Kaggle è una piattaforma e comunity specifica per DataScientist.

Li sono presenti tantissimi dataset sui quali esercitarsi.

Avere un buon punteggio su Kaggle, partecipare alle competizioni è un’ottima strada per farsi notare da eventuali recruiter e poter dimostrare le proprie competenze

PostgreSQL

La conoscenza di SQL è la seconda skill più richiesta dopo Python negli annunci di lavoro.

Questo sulla base  delle job description analizzate (+100) per il lavoro di DataScientist a Londra

Un’ottima piattaforma gratuita per allenarsi è https://pgexercises.com/

Postgresql era uno dei DBMS più frequenti negli annunci, ne esistono anche altri, non sentitevi vincolati nella scelta.

 

Mentor

Un mentor tecnico è una risorsa chiave per vari motivi:

  • Ti sprona a fare di più
  • Può aiutarti in momenti di difficoltà a sciogliere subito eventuali nodi (ovviamente dopo che hai sbattuto la testa per almeno due giorni sul problema)
  • Rende umano un percorso fatto di numeri e righe di codice

Podcast

Esistono podcast di vario tipo sia su SoundCloud che su Spotify, ascoltarli permette nei tempi morti di essere aggiornati su tecnologie e trend del mercato.

Ingrediente Segreto

L’ingrediente segreto è uno ed uno solo: la passione

Se non vi emozionate davanti ad un bel grafico, se non vi incuriosisce la possibilità di pianificare e predire l’andamento delle vendite o valutare l’andamento delle azioni, se non impazzite all’idea di una nottata passata ad analizzare i processi esponenziali che potrebbero rappresentare la rottura di alcuni componenti elettronici, non iniziate questo percorso.

 

E’ la passione che muove tutto, le altre risorse sono secondarie.

Iniziate.

Fate.

Fate.

Fate.

Grazie per aver letto l’articolo!

Un abbraccio

Andrea

 

ps se ci sono errori di battitura o di grammatica scrivimi pure 🙂

*Con i link di affiliazione di Amazon potete aiutarmi a coprire le spese per il blog vi ringrazio in anticipo

 

Annunci

3 commenti

Archiviato in Hobby, Ingegneria

L’Ordine Del Tempo, Carlo Rovelli

Un po’ di tempo fa (quanto è relativo) dopo aver finito il libro sul ex ceo della IBM Louis Gestner ho iniziato a leggere “L’Ordine del Tempo” di Carlo Rovelli.

L’autore è un Fisico teorico, membro dell’Institut universitarie de France e dell’Accadémie internationale de philosophie des sciences.

Si è rivelata una lettura decisamente interessante, anche perché apprezzo sempre quando, con consapevolezza, si mescola la scienza con la filosofia.

In particolare mi è particolarmente piaciuta una riflessione sul secondo principio della termodinamica.

Il secondo principio afferma l’irreversibilità del passaggio di calore da un corpo caldo ad un corpo freddo.

Questa, riportando l’autore, è l’unica legge della fisica che distingue il passato dal futuro.

Ad esempio nel caso delle leggi della meccanica classica di Newton, l’elettromagnetismo di Maxwell “Se una sequenza di eventi è permessa da queste equazioni, lo è anche la stessa sequenza balzata all’indietro nel tempo. Nelle equazioni elementari del mondo la freccia del tempo appare solo quando c’è il calore”

L’autore continua la sua analisi evidenziando come il tempo non sia una variabile indipendente dal resto dell’Universo, né che scorra alla medesima velocità citando le dovute fonti bibliografiche ed immergendo il lettore in tutte le nuove scoperte della fisica quantistica e le varie implicazioni della teoria della relatività.

In questo percorso viene riconsiderata la visione aristotelica del tempo come misura del cambiamento.

Un’altra riflessione, apparentemente banale. (che poi era quello che diceva già Rafiki a Simba) , è legata all’asimmetria dell’evoluzione: il passato non si può cambiare ma il futuro si.

Le dinamiche del tempo e la loro relatività accompagnano il lettore verso una visione più soggettiva del mondo e delle sue interazioni che si può sintetizzare in una frase:

Non è importante ciò che è, ma ciò che è per te.

 

 

Se l’articolo ti è piaciuto o ti ha fatto riflettere ricondividilo 🙂

Lascia un commento

Archiviato in Hobby

Twitter come e pechè usarlo.

 

Mi trovo a scrivere perchè soprattutto negli ultimi mesi ho visto un sacco di amici iscriversi su Twitter ed abbandonarlo perchè non riuscivano a comprenderne tutte le potenzialità.

Spero questo post possa riaccendere la curiosità e la voglia di “twittare”.

 

Innanzitutto che cos è?

E’ un social media e come tale si propone di essere una piattaforma per socializzare.

Questo avviene attraverso dei messaggi dai caratteri prestabiliti pari a quelli di sms(140) è per questo anche detto “microblogging”

 

E’ possibile allegare link e per poter scrivere un commento un po’ più lungo è sempre bene accorciarli attraverso appositi siti come http://tinyurl.com/

 

 

Una volta scritto il vostro stato se avete un profilo pubblico le persone potranno commentarlo oppure “retwittarlo” perchè lo trovano interessante o simpatico.

 

Twitter rispetto a FB permette di essere informati in tempo istantaneo da parte degli altri utenti ed è questa la vera chicca!

Se per esempio vi va di sapere cosa ne pensa la comunità sulla questione delle “liberalizzazioni” o sul “caffè” o sul “tonno” scrivendo queste parole sullo spazio ricerca vi appariranno tutti i “tweet” più recenti in merito.

 

 

Altra cosa interessante è il sistema di follower e following che permette di seguire le persone o le associazioni che si ritengono interessanti o semplicemente le persone con cui si ha avuto uno scambio di tweet su un argomento. Sulla pagina iniziale una volta entrati si riceveranno così gli ultimi tweet delle persone che si seguono, ad un certo punto potrebbero diventare tanti anche nell’arco di ore è quindi utile sfruttare il sistema di liste, io ne ho quattro tre pubbliche(Società di consulenza, Ingegneria civile ed Economia) ed una privata(Amici) così che posso selezionare gli aggiornamenti di una determinata categoria.

 

Ci sono anche degli altri strumenti per gestire twitter così da non perdersi, uno molto carino e gratuito è sicuramente tweet deck http://www.tweetdeck.com/ .

Quando lo uso, scaricandolo capirete, mi piace avere una colonna solo per essere aggiornato su “Formia” così ho la possibilità di conoscere tutte le notizie di cronaca che vengono postate da agenzie di stampa come Latinaoggi Ansa o il Fatto Quotidiano.

 

 

Tirando le somme rispetto a FB Twitter è meno “cazzeggione” e permette di informarsi a livello globale. Per esempio le informazioni sull’arresto di Gheddafi, l’ultimo diluvio che c’è stato a Roma su twitter erano in costante aggiornamento. Affascinante no?

 

Con una metafora la conversazione su twitter è come un aperitivo al bar, FB è più come una birra con gli amici.

 

Due piattaforme diverse, con obiettivi, a mio parere, diversi.

 

 

Per prenderci più confidenza provate a fare queste cinque piccole cose:

  1. Twittare un vostro messaggio personale e commentare quello di qualche amico
  2. Fare una ricerca e commentare un paio di status
  3. Se seguite qualcuno RT qualche status che vi piaccia
  4. Create due liste di Following
  5. Andate sul profilo di vostri amici e vedete chi potreste seguire

 

 

ps attenzione a quando ricevete dei commenti da persone di nazionalità straniera o con pochi tweet potrebbe essere spam. Quindi prima di cliccare sul link riflettete!

Lascia un commento

Archiviato in Hobby, Intrattenimento

Buona azione a costo zero?

Come direbbe Francesco Tramontana, non ho un cazzo da fare e cosi cercando di affinare le capacità di blogging mi sono accorto di poter inserire con wordpress una piccola finestrella pubblicitaria, che trovate nella pagina iniziale in basso a sinistra, Cliccandoci voi fate donare dei soldi(non vostri ma di un brand) in beneficenza, è una idea fantastica! Almeno io la trovo innovativa, perchè va oltre il classico concetto di payperclick.  Un motivo in più per bloggare con più frequenza:

più click riceve più soldi vengono destinati per il WWF(si perchè la cosa interessante è che è possibile scegliere delle associazioni a cui devolvere i proventi della pubblicità).

Il widget in questione si chiama Social Vibe, intersting no?

Lascia un commento

Archiviato in Hobby