Page 42 of 107

Re: Statistiche sabermetriche

Posted: 24/07/2008, 17:22
by Tasco
Sul qualche altro forum ho letto che per valutare la teorica BABIP di ogni giocatore serve solo un facile calcolo: LD%+12%.

Esempio: J.D. Drew ha una LD% di 17.6%. Quindi la sua BABIP dovrebbe essere 17.6%+12%= .296. In realtà ha .314, quindi è un pò fortunato, ma la differenza è cmq minima.

È possibile generalizzare in questo modo, oppure è solo una stupidata?

Re: Statistiche sabermetriche

Posted: 24/07/2008, 18:12
by louis
joesox wrote:

Se Moneyball vi ha sconvolto, questo vi trasporta direttamente su Marte. Chi lo ha già letto?

non è che per caso è on-line gratis da qualche parte?  :fischia:

Re: Statistiche sabermetriche

Posted: 24/07/2008, 18:48
by Tasco
louis wrote:
non è che per caso è on-line gratis da qualche parte?  :fischia:
costa appena 10$ qui come ebook: http://ebookstore.sony.com/product/400/ ... 53741.html

Re: Statistiche sabermetriche

Posted: 24/07/2008, 23:28
by rene144
Tasco wrote: Sul qualche altro forum ho letto che per valutare la teorica BABIP di ogni giocatore serve solo un facile calcolo: LD%+12%.

Esempio: J.D. Drew ha una LD% di 17.6%. Quindi la sua BABIP dovrebbe essere 17.6%+12%= .296. In realtà ha .314, quindi è un pò fortunato, ma la differenza è cmq minima.

È possibile generalizzare in questo modo, oppure è solo una stupidata?
E' molto generico, e per gli hitters è relativamente sciocco, perchè molto dipende anche dalla velocità per valutare che BABIP avranno sulle GB.

Per i pitchers invece (che affronteranno giocatori veloci, lenti e medi) va più che bene, se vogliamo (anche se poi potremmo iniziare un lungo discorso sulla LD% concessa dai pitchers). Ma per gli hitters no. I giocatori veloci (tipo Figgins o Ichiro per dirne 2) che magari battono anche tante groundballs si mangeranno quel calcolo matematico, ed è anche la ragione per la quale distruggano regolarmente la propria PrOPS.

Re: Statistiche sabermetriche

Posted: 25/07/2008, 1:09
by Tasco
quindi non esiste neanche la possibilità di determinare all'incirca la BABIP teorica che ogni giocatore dovrebbe avere? oppure esiste un fattore x (=velocità) che si potrebbe semplicemente sommare al LD%+12%?

Re: Statistiche sabermetriche

Posted: 25/07/2008, 1:48
by rene144
Tasco wrote: quindi non esiste neanche la possibilità di determinare all'incirca la BABIP teorica che ogni giocatore dovrebbe avere? oppure esiste un fattore x (=velocità) che si potrebbe semplicemente sommare al LD%+12%?
Beh, si, dipende dalla velocità, ma non è un calcolo matematico in pratica.
Per dire, LD%+12% equivale alla media in Major League ed è un calcolo validissimo da usare come media, ma naturalmente quando si valuta il giocatore singolo è meglio usare le sue caratteristiche personali.
Quindi per fare un esempio (totalmente casuale e campato per aria), per Figgins la BABIP sarà LD%+16%, mentre per Giambi sarà LD%+8%.

Ma anche questo è piuttosto relativo, perchè bisogna guardare al tipo di palle che viene battuto. Esempio: se Figgins (per motivi tutti suoi) non batterà groundballs, allora la xBABIP (expected BABIP) sarà addirittura inferiore alla LD%+12% media.

Per riassumere... ricordiamoci che, tra le palle che vengono battute e che rimangono in campo (non producendo HR dunque):
- Una flyball è valida il 17,7% di volte (il numero sale a circa 25% quando si includono gli HR, ma ovviamente non si parlerebbe più di BABIP)
- Una groundball lo è il 24,1% di volte
- Una linea il 72,8%
- Un popup il 2%

Su flyballs, linee e popups, la BABIP è praticamente uguale per tutti. Quando non lo è, trattasi di fortuna sfacciatissima. Sulle groundballs invece il giocatore può fare la differenza in termini di BABIP, perchè quelli più veloci riusciranno a battere più infield singles, alzandola notevolmente. E' l'unico tipo di palla su cui le caratteristiche del battitore possono concretamente influenzare la BABIP.

Si evince che per i giocatori lenti e potenti sarà più conveniente battere più flyballs. Abbasserà la BABIP, ma meno di quanto si possa pensare (perchè difficilmente batteranno infield singles) ma aumenterà la possibilità di battere HR.

La teoria della PrOPS (Predicted OPS) si basa sul tipo di palle battute. Calcola la BABIP in base alla media di ogni tipo di palla e tutto di seguito. Gli unici giocatori che battono più o meno consistentemente la propria PrOPS sono quelli veloci. Gli altri che ce la fanno sono quelli fortunati, ma quelli rientrano nei ranghi già l'anno dopo.

Non a caso nella graduatoria OPS-PrOPS (cioè quelli che "eccedono" la propria PrOPS) degli ultimi anni troviamo gente che ha avuto annate "straordinarie" (o fortunate sarebbe meglio dire) oppure gente velocissima.

Nel 2004 nei primi 10 troviamo Melvin Mora, Jack Wilson, Ivan Rodriguez e Javy Lopez.
Nel 2005 troviamo Marcus Giles, Hideki Matsui, Mike Sweeney, Jhonny Peralta.
Nel 2006 Cano, Reed Johnson, Freddy Sanchez, Gary Matthews
Nel 2007 Ordonez, Ortiz, Posada, Dmitri Young, Lowell

Sempre gente che non si ripete e che si allontana molto dai valori in carriera. Tra i leader troviamo regolarmente anche Ichiro o Crawford, ma per loro è normale. Per questi altri no, e tendono a produrre stagioni in cui hanno una media battuta alta, che gonfia anche OBP e SLG indebitamente e solo grazie alla BABIP. Si notano batting champions e gente che ha avuto un contratto pazzesco l'anno successivo.

Re: Statistiche sabermetriche

Posted: 25/07/2008, 11:18
by Tasco
Ok, grazie, tutto chiaro adesso. Quindi bisogna stimare + o - a caso la BABIP di ogni giocatore.

Re: Statistiche sabermetriche

Posted: 25/07/2008, 17:32
by rene144
Tasco wrote: Ok, grazie, tutto chiaro adesso. Quindi bisogna stimare + o - a caso la BABIP di ogni giocatore.
"a caso" direi proprio di no... è una "educated guess" in base al tipo di palle battute ed in base alla velocità del giocatore (che cambia la BABIP sulle groundballs). C'è una solida base dietro.

Tanto è vero che dopo diversi anni di carriera diventa più affidabile guardare alla BABIP in carriera. Se un veterano di 10 anni che è sempre stato tra .280 e .300 un anno improvvisamente ha .380 senza aver cambiato drasticamente la sua LD% si tratta ovviamente di fortuna clamorosa.

Re: Statistiche sabermetriche

Posted: 25/07/2008, 17:34
by Tasco
sì però coi prospetti in pratica non abbiamo dati affidabili abbastanza per poter determinare qualcosa.

Re: Statistiche sabermetriche

Posted: 25/07/2008, 17:47
by rene144
Tasco wrote: sì però coi prospetti in pratica non abbiamo dati affidabili abbastanza per poter determinare qualcosa.
Coi prospetti no. La BABIP delle minors è inaffidabile perchè si basa su difese molto peggiori. Nel loro caso dobbiamo rifarci esclusivamente al tipo di palle battute. Uno con 10% di LD% e .380 di BABIP è stato fortunato però, e questo possiamo dirlo a prescindere.

Come in tutte le cose, più dati abbiamo e più possiamo essere precisi, ma anche coi prospetti possiamo arrivare a capire certe cose. E' normale che uno come Crawford abbia una BABIP legittimamente superiore alla xBABIP ed è normale che uno come Giambi non ce l'abbia. Questo possiamo dirlo anche con pochi dati, semplicemente per il tipo di hitter al piatto.

Re: Statistiche sabermetriche

Posted: 29/07/2008, 22:19
by joesox
louis wrote:
non è che per caso è on-line gratis da qualche parte?  :fischia:
posterò dei riassunti dei vari capitoli appena ho un po' di tempo

Re: Statistiche sabermetriche

Posted: 18/08/2008, 15:22
by Ivers
joesox wrote: Visto che vedo bunt in continuazione e visto che Renè non è qui a lamentarsi…

In un qualsiasi inning di una partita MLB si segnano – mediamente 0.538 punti (Run Expectancy  o REX = quanti punti ci si aspetta di segnare).

Con un uomo in prima e zero out la REx sale a 0.926.
Con un bunt e l’uomo inseconda con un out la REx scende a 0.710!
A meno che il battitore non sia un lanciatore o uno che batte .150 il bunt non ha senso statistico. Perchè si perde la possibilità di segnare 0.216 runs!

Con uomini in prima e seconda e nessun out la REx è 1.467, facendo un bunt e mandandoli in seconda e terza la REx diviene 1.471, quindi appena appena meglio.
Ed ammettendo che il bunt riesca. Perchè per aumentare di pochissimo 0.004 la ns possibilità di segnare dobbiamo effettuare il bunt bene nel 99.9% delle volte – altrimenti non conviene farlo. Meglio far battere i tre successivi battitori – tra l’altro una flyball profonda o una ground balla destra potrebbero far avanzare lo stesso i corridori. Il doppio gioco è comunque conteggiato nel 1.467 e nel 1.471.

Ma anche in questo caso paragonando le due situazioni abbiamo…

Prima e seconda – nessun out – REX 1.467
Il battitore successivo fa un out ed i corridori non avanzano.
REX scende a 0.958 – ci troviamo con corridori in prima e seconda ed un out e possiamo aspettarci ancora il 96% di possibilità di segnare un punto.

Mentre prima e seconda e nessun out – facciamo il bunt e li mandiamo in seconda e terza con un out – appunto la REX sale a 1.471.
Il battitore successivo fa un out ed i corridori non avanzano e non segnano.
REX scende a 0.618 – crolla, in pratica, perchè abbiamo due out.
Con due out si perde la sac fly, si perdono tutte le RBI ground ball, etc.

Quindi in soldoni non fare un out vale il 25%-30% in più dell’avanzamento di una abse a scapito dell’out – ecco anche perchè chi ruba basi deva avere l’80% di successo, altrimenti danneggia la propria squadra. Magari di poco ma la danneggia.

Vediamo.

Uomo in prima e nessun out – REX a 0.926.
Uomo in seconda (ha rubato) e nessun out – REX a 1.160
Una base rubata vale 1.160-0.926 = 0.234 runs

Uomo in prima e nessun out – REX a 0.926.
Caught stealing.
Basi vuote – un out – REX a 0.287
Farsi prendere costa 0.639 runs!

Ad esempio usando la matrice del 1982, Rickey Henderson, 1982 Oakland A’s, ebbe 130 SB cioè creò 22.2 runs
Rickey Henderson fu colto 42 volte nel 1982 cioè costò agli A's 20.6 runs

Nella più famosa stagione della storia per le basi rubate Rickey Henderson portò – con tutto quel correre 1.6 runs in più alla sua squadra!
Usando la matrice sabermetrica del 1982.

Poi la velocità è importante – andare dalla prima alla terza su un singolo è più facile se si è veloci, però quante volte è, di fatto, inutile essere veloci perchè la battuta è chiaro dall’inizio che non sarà sufficientemente profonda da far avanzare il corridore di due basi. Non che essere veloci sia un male, ma spesso la cosa non è sfruttabile. Nessuno è tanto più veloce da risucire a coprire 180 piedi nel tempo in cui un altro ne copre solo 90.
Vi sono occasioni in cui una battuta cade “a metà” e il corridore lento si ferma in seconda mentre quello veloce va in terza…ma anche in questo caso rischiare non paga.

Prima e seconda nessun out – 1.467 come abbiamo visto
Prima e terza nessun out – 1.854, ovviamente meglio
Ma se il corridore si fa prendere in terza e restiamo con uomo in prima ed un out – REX a 0.550…quindi andare in terza solo se si è sicurissimi di arrivarci. Perchè facendosi cogliere si perde 1.467-0.550 = 0.917, mentre arrivandoci si guadagna “solo” 1.854-1.467 = 0.387.

Ho usato medie e valori della matrice sabermetrica per gli ultimi 30 anni, ma i risultati non cambiano sostanzialmente usando medie per altri periodi moderni.
Mi sposto qui perchè mi sembra più appropriato;
questo post è molto interessante, e qualcosa non mi è chiaro, percui chiedo lumi e correggimi (o correggetemi) dove sbaglio:

Dunque: la REX è un calcolo statistico di ciò che è successo in un determinato campione (molto ampio) di partite, e viene calcolata caso per caso; cioè se la REX con 1 uomo in prima e 0 out vale x.xxx, questo è il frutto del calcolo statistico di quello che è successo tutte le volte che un uomo è arrivato salvo in 1° con 0 out, e il conto si ferma là, giusto? Ma ciò implicherebbe che questo calcolo non tenesse conto di cosa è successo dopo che l'uomo è giunto salvo in 1° base, ossia in altre parole, quel calcolo conterrà le statistiche di tutto ciò che è successo dopo che l'uomo è giunto salvo in 1° base nelle partite di cui il campione è costituito, quindi terrà conto di tutte le volte in cui il secondo battitore ha battuto valido, di tutte le volte in cui il secondo battitore è andato out, o ha battuto in doppio gioco, e anche di tutte le volte in cui ha buntato, indipendentemente dall'esito del bunt, giusto?

Se le cose stanno così non si possono confrontare due statistiche osservate in due momenti successivi di una partita, nel nostro caso non si possono confrontare i casi: uomo in prima 0 out, e uomo in seconda 1 out. Avrebbe senso confrontare i casi: uomo in prima 0 out secondo battitore che batte valido; uomo in prima 0 out e secondo battitore che va out; uomo in prima e secondo battitore che bunta; con successo; senza successo; che batte in DP e via dicendo. Allora il confronto dei dati statistici avrebbe un senso diverso.

Faccio un esempio per spiegare questo concetto;
traendo i dati da una tabella che misura la REX, riferita al periodo 1999-2002, e che contiene dati molto simili a quelli citati da te, che ha invece si basa su campione più ampio, assolutamente la prima che ho trovato e non so cosa valga ma è giusto per avere dei numeri;
Prendiamo il caso uomo in terza e 0 out: la REX vale 1.482, quindi su 1000 situazioni di quel tipo ci si aspetta di vedere segnare 1482 punti, e ciò non sarebbe possibile con 1000 situazioni statiche di quel tipo, perchè è impossibile che 1000 corridori segnino più di 1000 punti; la spiegazione è appunto nel fatto che partendo da quella situazione si apre ogni volta un ventaglio di possibilità per cosa possa succedere dopo, tra cui ad esempio una sac-fly, o una grounball che registra l'out ma che fa entrare il punto o anche tutti gli altri possibili casi in cui altri corridori partendo da quella specifica situazione, arrivino salvi in base e segnino poi altri punti, ma quel dato statistico (REX = 1.482) non li distingue più.

Ricapitolando, sembrerebbe che non si possano confrontare due REX relative a due momenti non indipendenti di un incontro, perchè se uno dei due momenti è successivo all'altro e quindi ne è la conseguenza, il dato relativo al primo contiene anche il dato relativo al secondo.

Giuro che non ho fumato niente. :rastapimp:

Re: Statistiche sabermetriche

Posted: 18/08/2008, 18:57
by rene144
Ivers wrote: Prendiamo il caso uomo in terza e 0 out: la REX vale 1.482, quindi su 1000 situazioni di quel tipo ci si aspetta di vedere segnare 1482 punti, e ciò non sarebbe possibile con 1000 situazioni statiche di quel tipo, perchè è impossibile che 1000 corridori segnino più di 1000 punti
Guarda, la stai facendo più complicata di quello che è.
La Run Expectancy indica l'aspettativa di realizzazione dei punti da quella situazione in poi.
In poche parole: se crei 1000 volte la situazione con uomo in terza e 0 out e fai giocare l'inning intero, uscirai con 1482 punti in proiezione. Questo perchè anche gli uomini successivi segnano, tutto qui, come hai notato subito dopo.
Il punto è che chiaramente a volte ci sarà un groundout, a volte ci sarà un doppio, a volte ci sarà altro ancora, ma in media segnerai sempre 1482 punti. Questo implica che a volte l'uomo rimarrà in terza e si segnerà 0, altre volte magari si segnerà 5. Non a caso è una media. Ma il caso relativo al primo non contiene mai il caso relativo ad un secondo. Ogni situazione, una volta che la palla è morta, è indipendente della precedente. Come siamo arrivati a quella situazione è irrilevante. Se uno batte un singolo e porta l'uomo a casa, poi dobbiamo guardare la Run Expectancy dell'uomo in prima con 0 out. I punti GIA' segnati sono a parte e già incassati.

Aggiungo:
REX scende a 0.958 – ci troviamo con corridori in prima e seconda ed un out e possiamo aspettarci ancora il 96% di possibilità di segnare un punto.
No, la REX a 0.958 significa che dall'inning ci possiamo aspettare 0.958 punti in media da un inning in quella situazione. Non vuol dire che abbiamo il 96% di possibilità di segnare un punto, è molto diverso.

Re: Statistiche sabermetriche

Posted: 18/08/2008, 19:42
by Ivers
rene144 wrote: Guarda, la stai facendo più complicata di quello che è.
La Run Expectancy indica l'aspettativa di realizzazione dei punti da quella situazione in poi.
In poche parole: se crei 1000 volte la situazione con uomo in terza e 0 out e fai giocare l'inning intero, uscirai con 1482 punti in proiezione. Questo perchè anche gli uomini successivi segnano, tutto qui, come hai notato subito dopo.
Il punto è che chiaramente a volte ci sarà un groundout, a volte ci sarà un doppio, a volte ci sarà altro ancora, ma in media segnerai sempre 1482 punti. Questo implica che a volte l'uomo rimarrà in terza e si segnerà 0, altre volte magari si segnerà 5. Non a caso è una media. Ma il caso relativo al primo non contiene mai il caso relativo ad un secondo. Ogni situazione, una volta che la palla è morta, è indipendente della precedente. Come siamo arrivati a quella situazione è irrilevante. Se uno batte un singolo e porta l'uomo a casa, poi dobbiamo guardare la Run Expectancy dell'uomo in prima con 0 out. I punti GIA' segnati sono a parte e già incassati.
Appunto, dunque se ho un uomo in prima e 0 out, la REX in quella situazione è indipendente da quello che succede dopo, cioè è stata calcolata indipendentemente da ciò che è successo nelle fasi successive, e quindi contiene anche i casi in cui successivamente il battitore ha battuto e quelli in cui ha effettuato un bunt... Perchè per me questo è il punto oscuro..

Re: Statistiche sabermetriche

Posted: 18/08/2008, 23:11
by rene144
Ivers wrote: Appunto, dunque se ho un uomo in prima e 0 out, la REX in quella situazione è indipendente da quello che succede dopo, cioè è stata calcolata indipendentemente da ciò che è successo nelle fasi successive, e quindi contiene anche i casi in cui successivamente il battitore ha battuto e quelli in cui ha effettuato un bunt... Perchè per me questo è il punto oscuro..
Allora non ci siamo proprio sul problema. Non capisco cosa tu stia cercando di dire.
Ovvio che contenga tutti i casi successivi, quindi?
Guardando la transizione da stato indipendente a stato indipendente scopriamo il valore della transizione (teoria dei grafi). Se da stato a stato la Run Expectancy diminuisce, l'azione effettuata, qualunque sia stata, sarà stata negativa. E questo a prescindere dal fatto che nei singoli eventi le cose possano andare diversamente.