Logo Unione Europea
Logo Ministero
Logo Italia Domani
Logo Agritech

Metodologia e Algoritmo

Per questa attività è stato implementato un modulo basato su Decision Tree (DT), utilizzabile sia per compiti di classificazione sia di regressione. Il modulo prende in input un dataset composto da variabili numeriche e categoriche e costruisce un modello in grado di predire il valore di una variabile target apprendendo regole decisionali semplici, inferite dalle caratteristiche dei dati.

Gli alberi decisionali sono algoritmi di machine learning noti e intuitivi, adatti a compiti di classificazione e regressione. Essi rappresentano decisioni e relative conseguenze attraverso una struttura ad albero: ogni nodo corrisponde a una decisione o a un test su una specifica caratteristica, ogni ramo rappresenta l’esito di quella decisione e ogni foglia contiene l’etichetta di classe (per la classificazione) o il valore predetto (per la regressione).

Supponendo un dataset descritto da quattro variabili di input, X1, X2, X3 e X4, l’albero di regressione costruito dal modulo suddivide iterativamente lo spazio delle caratteristiche in intervalli omogenei rispetto alla variabile target, permettendo di modellare in modo interpretabile le relazioni tra le variabili di input e il risultato. Nella figura seguente è riportato un esempio di albero di regressione generato sul dataset