tstudent
Nuovo forumer
Mi sono imbattuto in questo paper relativamente recente.
In questo forum mi pare si sia molto discusso di overfitting, data-mining, data-snooping & C. , in modo spesso anche molto acceso.
Vi sottopongo una domanda: e' data snooping anche questo? In che misura?
Il modello e' molto semplice. Si cerca di estrarre un segnale dall'attivita' di trading sulle opzioni sp500 index. In particolare, se i volumi sono concentrati su ben precisi strike il mercato non e' ambiguo (cosa buona). Al contrario, se c'e' dispersione (dei volumi) su diversi strike, non v'e' un consensus ben definito, ovvero la massa degli operatori e' straziata dall'incertezza. Ambiguita' = cosa cattiva.
Tutto qui, il segnale (dentro\fuori il mercato) deriva da questo.
Le misure di performance (storiche) mi sembrano ottime.
Ma la questione che al momento piu' mi diverte e':
Quanto overfitting c'e'?
Ok ok, sono prezzi\valori pubblici facilmente reperibili da tutti. Mentre, mi pare di aver letto in passato proprio in questo forum, che condizione assolutamente fondamentale per avere 'qualche chance' sia quella di avvalersi di input non estremamente 'convenzionali' (ovvero usati su larghissima scala). In questo caso non si tratta propriamente di comode serie storiche di prezzi. C'e' da procurarsi (e lavorare successivamente in fase di testing) i volumi storici di tutte le opzioni, tutti gli strike, etc. Informazioni pubbliche per carita', forse con appena qualche scrematura....
Ma mi fermo qui.
A voi la parola
In questo forum mi pare si sia molto discusso di overfitting, data-mining, data-snooping & C. , in modo spesso anche molto acceso.
Vi sottopongo una domanda: e' data snooping anche questo? In che misura?
Il modello e' molto semplice. Si cerca di estrarre un segnale dall'attivita' di trading sulle opzioni sp500 index. In particolare, se i volumi sono concentrati su ben precisi strike il mercato non e' ambiguo (cosa buona). Al contrario, se c'e' dispersione (dei volumi) su diversi strike, non v'e' un consensus ben definito, ovvero la massa degli operatori e' straziata dall'incertezza. Ambiguita' = cosa cattiva.
Tutto qui, il segnale (dentro\fuori il mercato) deriva da questo.
Le misure di performance (storiche) mi sembrano ottime.
Ma la questione che al momento piu' mi diverte e':
Quanto overfitting c'e'?
Ok ok, sono prezzi\valori pubblici facilmente reperibili da tutti. Mentre, mi pare di aver letto in passato proprio in questo forum, che condizione assolutamente fondamentale per avere 'qualche chance' sia quella di avvalersi di input non estremamente 'convenzionali' (ovvero usati su larghissima scala). In questo caso non si tratta propriamente di comode serie storiche di prezzi. C'e' da procurarsi (e lavorare successivamente in fase di testing) i volumi storici di tutte le opzioni, tutti gli strike, etc. Informazioni pubbliche per carita', forse con appena qualche scrematura....
Ma mi fermo qui.
A voi la parola