Page 63 of 107

Re: Statistiche sabermetriche

Posted: 05/09/2009, 18:52
by rene144
koper wrote: E' abbastanza consolidata l'opinine che la valutazione offensiva di un player sia più precisa di quella difensiva, lo prova anche il fatto che le medie offensive generalmente variano nel tempo (da un anno all'altro) meno di quelle difensive.
Sample size. Un everyday player in genere ha come minimo il doppio delle possibilità offensive rispetto a quelle difensive in una stagione. Prova a prendere solo le statistiche offensive di 3 mesi e vedrai molta più variazione. Fermati ai primi 3 mesi di Ibanez o di Zobrist o altri ancora e ti chiederai come sia possibile certa roba. Ovviamente raddoppiando il sample size, viene diminuito il "rumore", rendendo più accurate le statistiche.

Ciò non toglie comunque una cosa fondamentale: se un sample size ridotto non da' la misura dell'"abilità" di un giocatore, descrive comunque ciò che è accaduto. Facciamo un esempio...

Se Pujols si prende un K, non offre alcuna indicazione su ciò che farà in futuro, perchè ovviamente 1 AB è solo 1 AB. Però intanto quel K se l'è preso, e se uno chiede "che ha fatto Pujols?", noi dobbiamo rispondere "si è preso un K", non certo "beh, ha battuto valido, ma dei sabercosi dicono che si sia preso un K", perchè equivale a distorcere la realtà.

In difesa succede lo stesso... il sample size è ridotto. Anche un giocatore forte può avere un periodo negativo, e viceversa. Se uno in una stagione va male, significa che sia un cattivo difensore? No, solo che in quel sample size sia andato male, come può accadere a chiunque. Non implica che sia un cattivo difensore, ma al tempo stesso non dobbiamo necessariamente affermare che le statistiche siano di qualità scadente solo perchè il giocatore è forte: tutti hanno momenti buoni e momenti brutti. Alla fine credo che questo fattore inganni molto la gente, che "non riesce a credere" che Tizio abbia giocato così bene o male rispetto alle sue teoriche abilità.

Re: Statistiche sabermetriche

Posted: 05/09/2009, 20:36
by Robinson Cano
rene144 wrote:Ciò non toglie comunque una cosa fondamentale: se un sample size ridotto non da' la misura dell'"abilità" di un giocatore, descrive comunque ciò che è accaduto. Facciamo un esempio...

Se Pujols si prende un K, non offre alcuna indicazione su ciò che farà in futuro, perchè ovviamente 1 AB è solo 1 AB. Però intanto quel K se l'è preso, e se uno chiede "che ha fatto Pujols?", noi dobbiamo rispondere "si è preso un K", non certo "beh, ha battuto valido, ma dei sabercosi dicono che si sia preso un K", perchè equivale a distorcere la realtà.
René ... un K è un K, un fatto oggettivo accaduto secondo le regole del gioco in una partita di baseball.
una statistica - sabermetrica o meno che sia - non è un fatto, un mezzo per leggere la realtà non è la realtà.
solo il campione dà valore alla statistica e alla sua possibile capacità di leggere correttamente una realtà, altrimenti finiamo alla storia del pollo e del vicino.

tornando al pezzo di THT, una delle ipotesi avanzate da Pat Andriola - nei commenti - è che Coors Field faccia la sua parte, ma osservando le stats delle ultime 6 stagioni degli esterni in NL salta all'occhio che mentre i LF dei Rockies sono al top della lega, CF e RF sono regolarmente tra i peggiori: Coors Field è un fattore solo per due terzi dell'outfield?

Re: Statistiche sabermetriche

Posted: 05/09/2009, 21:06
by koper
rene144 wrote: Sample size. Un everyday player in genere ha come minimo il doppio delle possibilità offensive rispetto a quelle difensive in una stagione. Prova a prendere solo le statistiche offensive di 3 mesi e vedrai molta più variazione. Fermati ai primi 3 mesi di Ibanez o di Zobrist o altri ancora e ti chiederai come sia possibile certa roba. Ovviamente raddoppiando il sample size, viene diminuito il "rumore", rendendo più accurate le statistiche.
osservazione giustissima,renè..tuttavia devi convenire che nella misurazione del valore difensivo entrano in gioco molte più variabili rispetto a quello offensivo..lo stesso autore di Plus/Minus John Dewan riconosce che ci sono ancora grandi margini di miglioramento nell'analisi difensiva

Re: Statistiche sabermetriche

Posted: 05/09/2009, 21:54
by rene144
Robinson Cano wrote: solo il campione dà valore alla statistica
E io che ho detto? :penso:
tornando al pezzo di THT, una delle ipotesi avanzate da Pat Andriola - nei commenti - è che Coors Field faccia la sua parte, ma osservando le stats delle ultime 6 stagioni degli esterni in NL salta all'occhio che mentre i LF dei Rockies sono al top della lega, CF e RF sono regolarmente tra i peggiori: Coors Field è un fattore solo per due terzi dell'outfield?
Perchè no?

Re: Statistiche sabermetriche

Posted: 06/09/2009, 9:46
by MAX
Robinson Cano wrote: René ... un K è un K, un fatto oggettivo accaduto secondo le regole del gioco in una partita di baseball.
Anche una palla raccolta (o bucata) a sette metri dal cuscino di seconda è oggettivamente una palla raccolta (o bucata) a sette metri dal cuscino di seconda.
Perché questo è un fatto di serie B mentre l'altro è un fatto di serie A?

Re: Statistiche sabermetriche

Posted: 06/09/2009, 12:12
by koper
MAX wrote: Anche una palla raccolta (o bucata) a sette metri dal cuscino di seconda è oggettivamente una palla raccolta (o bucata) a sette metri dal cuscino di seconda.
Perché questo è un fatto di serie B mentre l'altro è un fatto di serie A?
non vorrei aver frainteso le vostre opinioni e rischiare di uscire dal tema.. :penso:

il K di un battitore è una misura che mette a confronto due performance: quella del lanciatore e quella del battitore (escludendo per semplicità la chiamata del catcher) e quindi possiamo valutare un vincente e un perdente nell'evento: un valore binario vero o falso.
l'eliminazione di un battitore su palla in gioco investe più aspetti: il lancio era efficace, la battuta era efficace,l'interno è stato reattivo,la squadra era posizionata per quella battuta,il tiro era preciso,il tiro era veloce,la presa in base è stata efficace,il corridore era abbastanza veloce ? (escludendo per semplicità l'interazione del terreno sulle groundballs)
tutti aspetti correlati di difficile ripartizione dei meriti e demeriti: un calcolo complesso che inevitabilmente si porta dietro una significativa percentuale di errore

EDIT: anche la presa al volo di un esterno, che sembrerebbe di più facile valutazione, può essere influenzata da situazioni tattiche: l'esterno può preferire di rinunciare alla presa di una flyball particolarmente difficile limitandosi a subire un single piuttosto che rischiare un triplo

Re: Statistiche sabermetriche

Posted: 06/09/2009, 16:18
by rene144
koper: è più semplice... ed in effetti si parla di "three true outcomes" quando si citano BB, HR e K, perchè sono eventi definibili "binari" (anche se magari tante volte un esterno "ruba" un HR, oppure un arbitro da' il terzo strike sul quarto ball e viceversa, ma fa niente).

Il concetto è che dal singolo evento non possiamo trarre grosse indicazioni, ma nel sample size largo si. Se uno mi viene a dire che dopo 10 anni in cui ha statistiche difensive pessime, Tizio è in realtà forte, allora io non la bevo. Una volta può essere successo per un "bad hop", una volta può essere per un cattivo shift chiamato dal coach, una volta può essere per un altro motivo... ma nel corso di più e più anni è difficile che certi valori vengano stravolti. Se tu vuoi dare un Gold Glove ad uno che è +8 in UZR rispetto ad uno che è +6 ci sto tranquillamente, sia per l'accuratezza dell'UZR, sia per la casualità che ci può essere nella produzione di un giocatore. Ma alla fine è la stessa cosa per l'attacco. Solo che la gente è talmente abituata alla BA che la ritiene fondamentalmente più indicativa delle prestazioni di un giocatore. Ovviamente non lo è... per motivi analoghi (cattivo rimbalzo, cattivo posizionamento, semplice fortuna), visto che la BA è ugualmente toccata da fattori come bloops e via dicendo.

E' chiaro che le statistiche difensive non siano perfette. Ma non lo sono neanche quelle offensive. Questo non è un motivo sufficiente ad ignorarle o screditarle.

Re: Statistiche sabermetriche

Posted: 06/09/2009, 16:29
by Rasheed
domanda sul mercato...

scenario:squadra forte,in corsa per i PO e con forti idee sabermetrice nel FO...deve prendere un giocatore per fare un ulteriore salto di qualità...anche a costo di tradare qualche prospetto importante...anche se questo giocatore va in scadenza a fine stagione...

domanda:chi prende?nel senso:sapendo che questo giocatore serve subito su chi si punta?su un giocatore magari dal valore assoluto più elevato?o su un ottimo giocatore molto sfortunato nella prima parte di stagione e che perciò si pensa possa esplodere nella seconda metà per "normalizzarsi"?

anche qua:è un concetto forzato...difficilmente si prendono giocatori solo per fare 3 mesi alla grande...però mi interessa...

Re: Statistiche sabermetriche

Posted: 06/09/2009, 17:33
by rene144
Rasheed wrote: scenario:squadra forte,in corsa per i PO e con forti idee sabermetrice nel FO...deve prendere un giocatore per fare un ulteriore salto di qualità...anche a costo di tradare qualche prospetto importante...anche se questo giocatore va in scadenza a fine stagione...

domanda:chi prende?nel senso:sapendo che questo giocatore serve subito su chi si punta?su un giocatore magari dal valore assoluto più elevato?o su un ottimo giocatore molto sfortunato nella prima parte di stagione e che perciò si pensa possa esplodere nella seconda metà per "normalizzarsi"?

anche qua:è un concetto forzato...difficilmente si prendono giocatori solo per fare 3 mesi alla grande...però mi interessa...
Quello più forte. Sull'altro si punta sulla fortuna (o meglio, sul contraccolpo della sfortuna iniziale). Sempre meglio puntare sul valore vero e proprio che sulla fortuna. Anche perchè non sta scritto da nessuna parte quando (e se) ci si debba normalizzare. Ricordo: a Magglio Ordonez la BABIP è durata un anno intero. Idem a Mike Lowell nel 2005. Quindi prendi il miglior giocatore (senza guardare alla sua BABIP attuale) e via.

Re: Statistiche sabermetriche

Posted: 06/09/2009, 17:42
by koper
rene144 wrote: E' chiaro che le statistiche difensive non siano perfette. Ma non lo sono neanche quelle offensive. Questo non è un motivo sufficiente ad ignorarle o screditarle.
d'accordissimo sul fatto che anche le statistiche difensive meritino considerazione..
però non sono d'accordo nel mettere sullo stesso piano le statistiche difensive con quelle offensive
questa è la mia idea:

trascuriamo l'effetto fortuna che incide su entrambe le statistiche più o meno in maniera equivalente (soppressione del rumore di fondo)

statistica offensiva :
l'evento offensivo (battuta in campo) è una relazione che coinvolge 1 contro 9 (uno a molti) : però io posso tranquillamente semplificare l'evento come una relazione 1:1 cioè battitore contro squadra difensiva e la maggior parte delle statistiche non risente di questa semplificazione: hit/out

statistica difensiva:
l'evento difensivo è viceversa un evento molti a uno : per semplificare l'evento in maniera equivalente a quello che si fa con le stats offensive dovrei poterlo suddividere in diversi eventi (quanti sono i soggetti difensivi coinvolti) del tipo 1:1 con pesi distribuiti proporzionalmente
è evidente che un processo del genere , con gli strumenti a disposizione, al momento è irrealizzabile
e quindi si cerca di ovviare a questo con semplificazioni più grossolane che aggiungono però anche una parte di errore

questo non significa che le stats difensive non debbano essere usate: significa che quando si usano occorre tenere in considerazione anche il loro margine di errore (che a mio parere è maggiore di quelle offensive) 

Re: Statistiche sabermetriche

Posted: 06/09/2009, 18:29
by rene144
koper wrote: questo non significa che le stats difensive non debbano essere usate: significa che quando si usano occorre tenere in considerazione anche il loro margine di errore (che a mio parere è maggiore di quelle offensive) 
Su questo concordo, ma le statistiche difensive hanno raggiunto un livello qualitativo impensabile solo 2 o 3 anni fa. Purtroppo per molti (anche dell'ambiente, vedi Dayton Moore), non hanno alcuna rilevanza, e questo è a dir poco sbagliato.
Poi ripeto, mi vuoi dire che Tizio con +10 abbia avuto una stagione migliore di Caio con +6? Ci può pure stare, per il margine di errore un po' più ampio (anche causato dal sample size, che è forzatamente ridotto rispetto alle possibilità offensive). Ciò non significa che abbiano un'importanza elevatissima e che siano molto più accurate di quanto si possa pensare generalmente, soprattutto nel lungo termine.

Re: Statistiche sabermetriche

Posted: 06/09/2009, 18:51
by koper
rene144 wrote: Poi ripeto, mi vuoi dire che Tizio con +10 abbia avuto una stagione migliore di Caio con +6? Ci può pure stare, per il margine di errore un po' più ampio (anche causato dal sample size, che è forzatamente ridotto rispetto alle possibilità offensive). Ciò non significa che abbiano un'importanza elevatissima e che siano molto più accurate di quanto si possa pensare generalmente, soprattutto nel lungo termine.
riallaciandomi all'articolo citato da Rob-C , nella valutazione di due giocatori uno migliore difensivamente e l'altro con migliore media battuta, quello che volevo sottolineare è che occorre tener conto della diversa affidabilità delle due stats (naturalmente se la differenza difensiva non è molto evidente)

un'altra considerazione, e qui posso dire una fesseria..
nella valutazione di un rookie la stat difensiva potrebbe essere più affidabile di quella offensiva: nel passaggio dalle minors alle leghe maggiori (anche se abbiamo un sample size ridotto) il valore difensivo di un giocatore dovrebbe risentire meno del salto di categoria di quanto non possa essere la sua media battuta

Re: Statistiche sabermetriche

Posted: 07/09/2009, 11:55
by joesox
louis wrote: In questi giorni sto facendo una riflessione su quella che ritengo una statistica MANCANTE.
Ci ho pensato anch'io.
Credo sia impossibile avere una stat del genere.
Infatti Guthrie lancia più spesso contro Youk che contro Ramon Castro. Vero.
Ma Youk e Castro costruiscono le loro stat contro lanciatori che - a loro volta - le costruiscono contro differenti battitori.
In pratica non c'è un valore assoluto contro cui confrontarsi, non c'è un metro.
La OPS+ e la ERA+ sono gli unici metri di giudizio neutrali.

Perchè se dessimo più valore al fatto che Guthrie affronta più spesso Youk di Castro, potremmo anche dire che però Youk costruisce le sue stat contro lanciatori più o meno forti di Castro. Youk (o qualunque altro) potrebbe avere stat importantoi perchè affronta, per caso o per necessità, lanciatori deboli.

Contorto, forse anche più di te?

Re: Statistiche sabermetriche

Posted: 07/09/2009, 16:36
by louis
joesox wrote: Ci ho pensato anch'io.
Credo sia impossibile avere una stat del genere.
Infatti Guthrie lancia più spesso contro Youk che contro Ramon Castro. Vero.
Ma Youk e Castro costruiscono le loro stat contro lanciatori che - a loro volta - le costruiscono contro differenti battitori.
In pratica non c'è un valore assoluto contro cui confrontarsi, non c'è un metro.
La OPS+ e la ERA+ sono gli unici metri di giudizio neutrali.

Perchè se dessimo più valore al fatto che Guthrie affronta più spesso Youk di Castro, potremmo anche dire che però Youk costruisce le sue stat contro lanciatori più o meno forti di Castro. Youk (o qualunque altro) potrebbe avere stat importantoi perchè affronta, per caso o per necessità, lanciatori deboli.

Contorto, forse anche più di te?
Già.
Se fosse stato semplice sarebbe già di dominio comune.
Però potrebbe essere il nostro giochino per l'inverno. Inventiamoci una formula e apriamo una nuova frontiera  :forza:

Re: Statistiche sabermetriche

Posted: 07/09/2009, 18:48
by koper
ho notato che sul sito di Fangraphs per lo stesso lanciatore i tipi di lancio e le loro percentuali indicati da BIS e da Pitch/fx sono spesso molto discordanti (in alcuni casi sono presenti lanci che mancano nell'altra e viceversa)
quale delle due è più attendibile ?