Page 38 of 107

Re: Statistiche sabermetriche

Posted: 21/04/2008, 18:35
by randyjohnson
Ci ho pensato un paio di minuti.. e probabilmente è una cavolata però se può essere utile butto la mia idea.

Faccio un esempio di ricerca.

Analiziamo la carriera di 100 giocatori, per assurdo ognuno ha fatto 20 anni di carriera. Il totale anni giocati quindi è uguale a 2000


100 giacatori

2000 anni giocati.



Ognuno di questi giocatori ha avuto nella sua carriera 1 CY (CY=carrier years, cioè l'anno migliore della sua carriera) quindi 100 CY


Dividiamo i 100 CY per gli anni di attività dei nostri giocatori, cioè i 2000 anni giocati.

per cui 100/2000, abbiamo ovviamente un 1/20 che è la probabilità a parita di altri condizioni che un anno giocato sia anche CY.


Mettiamo per assurdo che ognuno dei 100 giocatori abbia avuto nei suoi 20 anni di carriera 3 Contract Years (MY... Money Years... cosi alla peggio la prima cosa mi è venuta in mente come simbolo).

Il totale dei MY dei 100 player sarà quindi 3 x 100 = 300 MY.


Dividendo il totale dei MY per la probabiltà di avere CY cioè 1/20... troviamo    15 che è il numero di volte medio che ci un CY sarà anche MY.



Cioè nei 2000 anni di attività, se troviamo più di 15 volte una situazione in cui CY e MYsono presenti nello stesso anno significherà che c'è una correlazione positiva tra la presenza di CY e MY...  viceversa se troviamo meno di 15 volte questa situazione significa che nei MY i giocaotori hanno più difficolta a ottenere CY.




Non sono un esperto di statistica, probabilmente ho fatto qualche errore...e possiamo discutere ovviamente su cosa intendete per CY, e cosa intendente per MY.   UNa volta però deciso cosa si intende per CY, e cosa per MY... questo procedimento dovrebbe avere un qualche significato.

Re: Statistiche sabermetriche

Posted: 21/04/2008, 22:28
by rene144
Robinson Cano wrote: career year per l'attacco, non per la difesa.
Ovviamente. Tutti valutano quasi solo l'attacco in realtà quando firmano i contrattoni o si riferiscono ai career years. Posada in difesa è stato pessimo, ma ha la sua età e può solo peggiorare. Anche Pudge è sempre peggio.
BA/BIP fortunatissima dici, su 589 PA? hail il numero di Jorge che gli chiedo i numeri al lotto?  :penso:
589 PA sono pochissime e possono essere soggette a parecchia fortuna. Vediamo la sua BABIP...
1998: .317
1999: .293
2000: .359
2001: .339
2002: .336
2003: .308
2004: .301
2005: .291
2006: .307
2007: .389
Carriera: .323
Trova l'intruso...

Nel 2007 ha sicuramente giocato bene con la mazza. Però guarda qui:
2002: 22.7% LD%, 40.8% GB%, 36.5% FB%, .336 BABIP
2007: 22.1% LD%, 40.4% GB%, 37.5% FB%, .389 BABIP
Prestazioni identiche, con BABIP clamorosamente diversa.

La BABIP è determinata da LD% in primis, e velocità nell'ottenere infield singles sulle groundballs successivamente. Allora o è diventato incredibilmente veloce (stile Figgins o Ichiro) nel 2007, oppure ha avuto una BABIP di circa 50 punti troppo alta rispetto alla LD% (66 punti sopra la media in carriera). La potenza isolata è stata in linea con la carriera (.206 contro una media di .202 in carriera). Ergo ciò che ha fatto svoltare la stagione di Posada non è stato il numero di doppi, tripli o HR, ossia i contatti "duri", quanto il numero di singoletti, determinato da una BABIP incredibilmente elevata e fuori linea sia con la sua carriera, sia con la tipologia di giocatore non veloce, sia con la LD% (solo 1.8% superiore alla media in carriera).
e la fenomenale BtRns?
Quelli sono pesi lineari. Non sono peripherals, sono semplicemente frutto della produzione. Se ottieni un singolo con un laser contro il muro o con una velenosa sbucciata non fa differenza: sempre un singolo è. Il discorso è che quella BABIP sia insostenibile ed assolutamente fortunosa.
career year per l'attacco dicevo perché il mio catcher preferito è recidivo giacché già nel 2006 aveva avuto una stagione strepitosa - difensiva appunto -
Non conosco la definizione che dai a "strepitosa", ma difensivamente solo 5 ricevitori in Major League sono stati peggiori di Posada nel bloccare le palle sporche dietro al piatto. Ha avuto una buona stagione nel cogliere i corridori che rubavano (per i suoi standard recenti, beninteso!). Basta questo? Posada è un cattivo ricevitore difensivo e lo è ormai da tanti anni.
sarebbe davvero curioso se quest'anno Posada fosse più infortunato del solito giacché ... presenterebbe in MLB un problema riscontrato nelle risorse umane: 2 dipendenti a tempo su tre appena passano fissi accusano lunghi periodi di malattia, sono state fatte delle ricerche e sono state imputate cause psicologiche - rilassamento seguente al raggiungimento dell'obiettivo - e di stress fisico - nel periodo a tempo pur di essere presenti si trascura di curarsi come si deve.
Sono stati anche fatti studi sui ricevitori ultratrentacinquenni con tutte quelle partite dietro al piatto dopo i 30 anni. Solo Carlton Fisk non ha avuto infortuni seri. Quando e se Posada si romperà tu potrai dire che sia una causa psicologica. Io dirò che sia quanto successo a qualsiasi ricevitore col suo tipo di utilizzo tranne che a Carlton Fisk. Insomma, se non si rompesse (a prescindere dalla situazione contrattuale) sarebbe il secondo della storia a farcela......... sarebbe un'eccezione, quindi c'è poco da aspettarsi cause psicologiche quanto un semplice declino fisico di uno di 36 anni le cui ginocchia sono state martoriate da un numero impressionante di partite dietro al piatto.
E poi René - se i team intelligenti badano alle medie in carriera come dici tu - perché non c'era la fila dietro Andruw Jones quest'inverno?
Perchè in carriera ha una OPS+ di 113, che non è offensivamente straordinaria. Perchè ha 31 anni ed è diventato un bombolone enorme. Perchè si deve pagare un giocatore per ciò che farà, e visto che al contrario per esempio di Miguel Cabrera non ha intenzione di perdere peso, può solo peggiorare difensivamente, dove era senza alcun dubbio il numero 1 in circolazione. Se togli il suo valore difensivo, la sua media in carriera non è niente di che in realtà. Nel 2005 ha battuto una valanga di HR, ma come BA ed OBP è sempre rimasto molto in basso. Dopo che lo "spike" è passato, non ha mai avuto più di 127 OPS+ in una singola stagione. Per intenderci, JD Drew ha 128 in carriera. Insomma, a parte quel singolo anno, la media di Drew è superiore al migliore anno di Andruw Jones. E' un buon giocatore, intendiamoci, ma proprio perchè le squadre intelligenti sanno quanto peso dare ai career years (pochissimo) e quanto alle medie in carriera (molto) e quanto ai trends degli anni recenti (moltissimo) nessuno gli è andato dietro.
Prima era uno da 115 OPS+ con difesa fenomenale. Ora è uno da 113 OPS+ con difesa in declino, ed è dal lato sbagliato dei 30 anni.

Poi chiaro che quando si parla di "medie" bisogna appunto dare un peso agli anni recenti. Se dobbiamo valutare Maddux è sciocco valutare le medie globali incluso ciò che faceva 15 anni fa... ma credo che tu abbia capito il punto che sto facendo.
randyjohnson wrote: Non sono un esperto di statistica, probabilmente ho fatto qualche errore...e possiamo discutere ovviamente su cosa intendete per CY, e cosa intendente per MY.   UNa volta però deciso cosa si intende per CY, e cosa per MY... questo procedimento dovrebbe avere un qualche significato.
Non ha alcun significato. Non puoi "stimare" la carriera in termini di career years teorici e contract years. Se fai uno studio del genere devi considerare ogni contract year e metterti lì con la santa pazienza a contarli uno per uno ed includerli tutti. Non si immagina o valuta astrattamente qualcosa del genere.

...poi io vorrei capire come si spieghino i career years dei giocatori pre-free agency (intendo prima di Marvin Miller).

Re: Statistiche sabermetriche

Posted: 22/04/2008, 9:49
by randyjohnson
Come si spiegano ?

beh, con la stessa dea bendata che qualche anno fa era interpretata da Nancy Brilli nella pubblicità del lotto (credo).
Una persona può fare il peggiore anno della sua carriera, il suo migliore, o anche un anno completamente normale durante un MY.

Esattamente come ortiz può fare un HR, battere un singolo, oppure essere messo K in un turno di battuta.


Però se andiamo a sommare un numero elevato di anni di carriera.
Andiamo a sommare un numero elevato di anni che consideriamo CY  (in cui possiamo anche a nostra descrizione considerare l'anno migliore, oppure i 3 migliori anni ecc ecc) e andiamo a sommare tutti gli anni che, una volta messi d'accordo consideriamo (MY e per money years basta trovarsi d'accordo  esattamente per definire cosa sia un MY, cosa includere e cosa escludere).

Poi il procedimento è semplice.

Tot anni carriera : totCY =  probabilità normale CY in un anno

Troviamo il totale di MY

e facciamo Tot MY x probalità normale CY di un anno.  Il numero che viene fuori dovrà essere più o meno simile alla somma di anni carriera in cui CY e MY siano presenti contemporaneamente.


Questo è un metodo che ha senso secondo me, basta mettersi d'accordo su cosa siano CY e cosa siano MY. E se esistono fattori non considerati che portano dei vantaggi, ad esempio miglioramente dei giocatori e per cui durante i MY che sono solitamente in la con la carriera il giocatore può fare prestazioni migliori.. però tutto sommato questo tipo di ricerca può dare una risposta sulla correlazione tra MY e CY.


Altrimenti non potremmo che continuare a mostrare esempi e controesempi...ed è evidente che la maggior parte delle volte CY e MY non sono presenti insieme.

Quello che non è evidente è se durante i MY ci sia una probabilità maggiore di avere CY.

E se fosse cosi, questo significherebbe che è possibile una "influenza" positiva.


Ma attenzione il risultato dell'indagine potrebbe anche portare a sorprese del tipo "influenza negativa" dei MY sui CY....  oppure arrivare a risultato grosso modo simili e confermare che non c'è nessun tipo di relazione.





Io ho cercato di trovare un modo per vedere se esiste questo fattore oppure no.
Però in fondo non lo so.

Re: Statistiche sabermetriche

Posted: 22/04/2008, 17:22
by rene144
Ho preso in considerazione i 164 free agents 2007-2008 con sufficiente sample size in carriera. Nei prossimi 2 giorni pubblicherò sul mio blog i risultati. Non è uno studio conclusivo, è chiaro, però almeno vedremo l'influenza dei contract years sulla free agent class del 2007.

Cosa vi aspettate? Che la maggior parte sia sopra media (la LORO media)? Che ci sia un numero anomalo di career years? Che la maggior parte sia sotto media? Che ci sia una distribuzione di Weibull?

Per ora sono arrivato alla lettera G, ho fatto in pratica un terzo dei free agents ed il trend è molto, molto chiaro, quindi io già lo so (a meno che quelli con le lettere successive non cambino tutto......) :hehe:

Re: Statistiche sabermetriche

Posted: 22/04/2008, 17:47
by randyjohnson
io mi aspetto un leggero miglioramento per quelli che diventeranno Free agent

Re: Statistiche sabermetriche

Posted: 22/04/2008, 17:56
by Gio
rene144 wrote: Ho preso in considerazione i 164 free agents 2007-2008 con sufficiente sample size in carriera. Nei prossimi 2 giorni pubblicherò sul mio blog i risultati. Non è uno studio conclusivo, è chiaro, però almeno vedremo l'influenza dei contract years sulla free agent class del 2007.

Cosa vi aspettate? Che la maggior parte sia sopra media (la LORO media)? Che ci sia un numero anomalo di career years? Che la maggior parte sia sotto media? Che ci sia una distribuzione di Weibull?

Per ora sono arrivato alla lettera G, ho fatto in pratica un terzo dei free agents ed il trend è molto, molto chiaro, quindi io già lo so (a meno che quelli con le lettere successive non cambino tutto......) :hehe:
Personalmente avrei scommesso su una distribuzione tipo Poisson, insomma il 90% nella media il 5 sotto e un altro 5 sopra...... Non l'hai menzionata, ma non credo che ci siano variazioni incredibili.


Comunque la vera domanda e`, ma quanto tempo "libero" hai Rene?


Gio

Re: Statistiche sabermetriche

Posted: 23/04/2008, 5:49
by rene144
Beh, allora andate a leggere.
Parte prima
Parte seconda

Nei prossimi giorni (a partire da domani) guarderò ai gruppi ed ai casi individuali scegliendoli qui e lì.

Re: Statistiche sabermetriche

Posted: 23/04/2008, 13:47
by randyjohnson
la motivazione monetaria sembra non influire, o se influisce in questa ricerca viene sommersa dall'eta media alta dei FA.

Re: Statistiche sabermetriche

Posted: 23/04/2008, 14:24
by rene144
Come detto nel pezzo, non è roba che debba sorprendere. D'altronde tutti in Major League lavorano con contratti a tempo determinato, quindi se anche ci fosse un effetto, ci sarebbe per tutti e dunque non si noterebbe in nessun caso.

Re: Statistiche sabermetriche

Posted: 23/04/2008, 17:57
by A-Rod
Complimenti innanzitutto per l'analisi, come sempre dettagliata e puntuale.

Appare dunque sfatato il mito che i giocatori all'ultimo anno di contratto giocano meglio perché più motivati. Solo il 20% ha avuto un anno significativamente sopra media.
Secondo me la percentuale è leggermente sottostimata perché si tiene conto (giustamente, perché non possono essere eliminati dal campione solo per far deviare la statistica a risultati di comodo) anche di giocatori ormai in declino, che per ragioni anagrafiche o di infortuni non possono avere annate paragonabili alle precedenti. Non si può pretendere che Glavine o Rogers abbiano il career year alla loro età. Peraltro tu stesso sottolinei questo aspetto.
Magari in tali casi si potrebbe considerare il confronto con l'anno precedente. Oppure si potrebbe considerare il confronto con la media degli anni interessati dal contratto (ad esempio vedere se un giocatore che riceve un contratto di tre anni gioca meglio nel terzo anno rispetto agli altri due). In ogni caso i risultati sono talmente evidenti da non poter essere smentiti.

Un altro tipo di analisi potrebbe andare a vedere come cambia il rendimento nell'anno successivo alla firma di un contratto pluriennale. Tuttavia non credo che si avrebbero sorprese particolari. E' certo in ogni caso che il tifoso si insospettisce sempre quando un giocatore ha prestazioni sensibilmente migliori della media proprio nell'ultimo anno di contratto, per poi magari non considerare gli esempi contrari.

Re: Statistiche sabermetriche

Posted: 23/04/2008, 18:13
by Robinson Cano
A-Rod wrote: Complimenti innanzitutto per l'analisi, come sempre dettagliata e puntuale.

Appare dunque sfatato il mito che i giocatori all'ultimo anno di contratto giocano meglio perché più motivati. Solo il 20% ha avuto un anno significativamente sopra media.
Secondo me la percentuale è leggermente sottostimata perché si tiene conto (giustamente, perché non possono essere eliminati dal campione solo per far deviare la statistica a risultati di comodo) anche di giocatori ormai in declino, che per ragioni anagrafiche o di infortuni non possono avere annate paragonabili alle precedenti. Non si può pretendere che Glavine o Rogers abbiano il career year alla loro età. Peraltro tu stesso sottolinei questo aspetto.
mi unisco ai complimenti a René - e al suo tempo libero  :forza: - ma preciso che escludere giocatori infortunati e quarantenni non falserebbe il risultato anzi - l'esatto contrario - qui non stiamo contando BA o ERA, qui bisogna creare un campione e perché il risultato sia significativo occorre porre dei paletti ed escludere dal campione i dati che - per svariate ragioni: età, infortuni ecc. - finiribbero per - loro sì - falsare l'analisi.

Re: Statistiche sabermetriche

Posted: 23/04/2008, 18:47
by Gio
Robinson Cano wrote: mi unisco ai complimenti a René - e al suo tempo libero  :forza: - ma preciso che escludere giocatori infortunati e quarantenni non falserebbe il risultato anzi - l'esatto contrario - qui non stiamo contando BA o ERA, qui bisogna creare un campione e perché il risultato sia significativo occorre porre dei paletti ed escludere dal campione i dati che - per svariate ragioni: età, infortuni ecc. - finiribbero per - loro sì - falsare l'analisi.
Non sono molto d'accordo. Infortuni e altro fanno parte dei possibili fattori che influenzano una stagione, nel bene o male, e vanno tenuti in considerazione, come del resto non si corregge i dati in base alla squadra dove si gioca (effetto "line up") o la divisione o i battitori affrontati.


E in fondo il motivo per cui GM che sanno quello che fanno non si basano solo sul contract Year o le analisi/tomi di Boras.

Re: Statistiche sabermetriche

Posted: 23/04/2008, 19:10
by Robinson Cano
Gio wrote: Non sono molto d'accordo. Infortuni e altro fanno parte dei possibili fattori che influenzano una stagione, nel bene o male, e vanno tenuti in considerazione, come del resto non si corregge i dati in base alla squadra dove si gioca (effetto "line up") o la divisione o i battitori affrontati.
puoi non essere d'accordo ma una statistica del genere si fa così, a doverlo spiegare mi sento monsieur de la palisse  :hehe:
se noi vogliamo capire in che misura essere a fine contratto influisca sul rendimento di un giocatore - quindi sulla sua volontà di fare bene creandogli una situazione psico-fisica ideale - mi spieghi che rilevanza avrà mai il rendimento di chi soffre cause che nulla hanno a che vedere con la sua - conscia o inconscia che sia - volontà come un infortunio o avere 40 anni?

Re: Statistiche sabermetriche

Posted: 23/04/2008, 19:29
by Robinson Cano
rene144 wrote: Come detto nel pezzo, non è roba che debba sorprendere. D'altronde tutti in Major League lavorano con contratti a tempo determinato, quindi se anche ci fosse un effetto, ci sarebbe per tutti e dunque non si noterebbe in nessun caso.
quindi è falso e vero allo stesso tempo?
ora che la MLB - in quanto sport quindi competizione - sia "luogo di lavoro" stressante a prescindere mi pare naturale e - al limite - questo può rendere più difficile identificare il trend di cui si parlava per cui a maggior ragione l'analisi andrebbe fatta su di un campione omogeneo e magari confrontando i 2 ultimi anni di contratto.
Non so poi fino a che punto si possa parlare di "tempo determinato" in un campo dove anche una mezza sega come Bronson Arroyo può arrivare a guadagnare 10 milioni l'anno, soldi che nel "lavoro vero" un buon professionista da 300mila dollari l'anno guadagnerà in 30 anni di lavoro lui sì a tempo determinato. Quando la posta in palio è così alta come credere che l'imminente rinnovo del contratto non sia uno stimolo formidabile?

Re: Statistiche sabermetriche

Posted: 23/04/2008, 20:30
by Gio
Robinson Cano wrote: puoi non essere d'accordo ma una statistica del genere si fa così, a doverlo spiegare mi sento monsieur de la palisse  :hehe:
se noi vogliamo capire in che misura essere a fine contratto influisca sul rendimento di un giocatore - quindi sulla sua volontà di fare bene creandogli una situazione psico-fisica ideale - mi spieghi che rilevanza avrà mai il rendimento di chi soffre cause che nulla hanno a che vedere con la sua - conscia o inconscia che sia - volontà come un infortunio o avere 40 anni?
In effetti e` stai ponendo un problema interessante ....
Tutto dipende da quello che vuoi dimostrare o capire. Se 'intenzione e` dimostrare che e` solo la volonta del giocatore (firmare un contratto migliore l'anno prossimo) a farlo giocare in modo migliore, allora si, si la statstisca si fa cosi e si levano infortuni con la giustificazione che l'infortnio e` un evendo indipendente dalla volonta del giocatore, ma allora si levano anche i giocatori che hanno giocato un numero minore di partite perche o sostistuiti o rilievi o panchinari (hanno giocato solo per volonta del manager non la loro - come un infortunio) o che hanno avuto altri tipi  di problemi (famigliari) che non gli hanno permesso di giocare nella condizione migliore. In pratica finisci con il limitare in maniera artificiale (e mirata ......) il tuo campione per cercare di arivare alla conclusione che vorresti venisse fuori.
Se l'intenzione e` di capire prima di tutto e c'e` una diffrenza statistica nelle prestazione nel ultimo anno di contratto in quel caso il campione (tutti i giocatori MLB nell ultimo anno di contratto) va preso in maniera completa, includendo gli infortunati, gli over 35 e i panchinari, altrimenti il risultato non avrebbe molto senso. Gli inforuni come del resto le sostituzioni o i turni di riposo ma anche gli SO le valide fanno parte di una stagione normale per ogni giocatore, anche se non sono la "volonta" del giocatore cosi come il clima, la famiglia e altro hanno.


Gio