Archivi autore: Davide Murari

Medaglia fields

Medaglia Fields: Storia e curiosità

Cos’è la Medaglia Fields?

La medaglia Fields è un premio conferito dal Congresso Internazionale dei Matematici ogni 4 anni per chi ha ottenuto “eccezionali risultati in matematica”.  Essa è chiaramente anche pensata come uno stimolo per altri matematici per ottenere risultati altrettanto di livello.

La commissione che ha il compito di assegnare questa Medaglia è stabilita dall’IMU ovvero l’unione internazionale dei matematici. L’incarico che viene loro assegnato è quello di nominare dai due ai quattro vincitori, con l’attenzione di coinvolgere diversi settori della matematica.

C’è un altro requisito che questi vincitori devono soddisfare per essere tali, devono avere meno di 40 anni. Come mai questo limite di età? Fondamentalmente per premiare i risultati raggiunti nei primi anni di lavoro di un matematico, che spesso sono anche i più produttivi.

Chiaramente, come puoi leggere nell’articolo in cui spiego il perchè non esiste il premio Nobel per la matematica, la Medaglia Fields non è il solo premio a cui un matematico può ambire, quindi anche chi supera quest’eta può puntare a vari riconoscimenti. 

Ti citerò alcuni di questi premi esistenti nell’ultimo paragrafo di questo articolo. Ci tengo però a specificare che la Medaglia Fields è definita il Premio Nobel per la Matematica, perchè è il più ambizioso riconoscimento a cui un matematico può ambire.

In realtà è anche più complicato da vincere di un premio Nobel, dato che quest’ultimo viene assegnato ogni anno ed è privo di limiti di età 😉

Ah…dimenticavo! Come ogni premio che si rispetti oltre alla medaglia i vincitori ricevono anche un riconoscimento monetario che, tuttavia, in questo caso non è minimamente comparabile a quello per i vincitori del premio Nobel. Infatti le medaglie Fields ricevono 15000 dollari canadesi, invece i vincitori del Nobel ricevono 8 milioni di corone svedesi, circa 100 volte tanto. E’ forse questo uno scarso riconoscimento? Beh, se non sei un matematico forse ti sembrerà di sì, ma per chi è del settore il solo vincere sarà riconosciuto come un grande merito.

Il nome “Medaglia Fields” deve il suo nome a John Charles Fields e vedremo nel prossimo paragrafo il perchè di questa scelta 🙂

Chi è John Charles Fields?

J.C. Fields è nato e morto in Canada (1863-1932)  ed è meglio conosciuto come il fondatore della Medaglia Fields. E’ figlio di un lavoratore in un negozio di pelletteria e un’insegnante. Iniziò i suoi studi nella sua città natale e ricevette una medaglia d’oro per i suoi risultati in matematica.

John Charles Fields

Si è laureato in Matematica nel 1884 all’università di Toronto ottenendo poi il suo dottorato nel 1887 all’università Johns Hokins negli Stati Uniti. 

Scontento della ricerca matematica in Nord America, nel 1891 si spostò in Europa, muovendosi in varie città ed università, collaborando con i più illustri matematci del tempo. 

Nel 1901 tornò poi in Canada con l’obiettivo di innalzare il livello della matematica nella sua nazione. Qui fu poi nominato presidente del Royal Canadian Institute. Dedicò anima e corpo a questo incarico (e ad organizzare congressi internazionali in Canada), a tal punto da sviluppare problemi cardiaci.

Il nome di Fields è passato alla storia della matematica soprattutto perchè nel letto di morte si assicurò che nel suo testamento fosse aggiunta una sovvenzione di 47.000$ per avviare la Medaglia Fields.

Lui morì a causa di un ictus nel 1932 e la medaglia fu assegnata per la prima volta nel 1936, per poi essere introdotta nella prima ICM (International Congress of Mathematics) dopo la seconda guerra mondiale nel 1950 (fino ad oggi).

Storia della Medaglia Fields

Al Congresso Internazionale dei Matematici del 1924 a Toronto, si decise che ad ogni ICM, due medaglie d’oro dovevano essere assegnate per riconoscere risultati matematici eccezionali. 

Il professor J. C. Fields in seguito donò fondi per far affermare le medaglie, che furono poi nominate in suo onore. Nel 1966 fu convenuto che, alla luce della grande espansione della ricerca matematica, si potevano assegnare fino a quattro medaglie ad ogni Congresso.

Ci sarebbero molti eventi interessanti da raccontare in questi quasi 100 anni di Medaglie, come per esempio quando Perelman rifiutò di ricevere la medaglia, ma preferisco rimandarti al sito di Wikipedia in cui c’è una lista davvero fatta bene: https://it.wikipedia.org/wiki/Medaglia_Fields#Storia

Chi può vincere la Medaglia Fields e cosa deve aver fatto?

Cédric Villani

Quando morì Fields non voleva che la medaglia portasse il suo nome, o il nome di qualcun altro. Non fornì linee guida su quali aree di studio dovessero essere assegnate le medaglie. Voleva che questo riconoscimento fosse il più aperto possibile e anche che fosse il più non politico possibile.

Fields intuì che se la Medaglia fosse stata assegnata in merito a contributi nel passato, ci sarebbero sempre stati problemi dovuti a rivalità nazionali passate all’interno della commissione assegnatrice. Lui infatti lasciò scritto che questo premio non dovesse essere conferito priconoscere di risultati ottenuti nel passato ma per meritevoli future promesse.

Maryam Mirzakhani

Questa è la differenza principale che, almeno in teoria o in via idealistica, questa medaglia ha rispetto al premio Nobel. Poi in realtà ci siamo sempre più allontanati da questa visione ideale e la medaglia viene solitamente conferita in merito ad effettivi risultati ottenuti.

Un’altra cosa importante è che la medaglia Fields non ha sempre avuto l’importanza che le è assegnata oggi, veniva considerata al pari di molti altri premi. 

Il prestigio che le è attribuito oggi segue dal limite d’età che è stato fissato e soprattutto dal titolo che le è stato accoppiato di “Nobel della Matematica”. 

L’origine storica dietro a questi due importanti cambiamenti nella storia della medaglia Fields risalgono all’anno 1966. Nelle edizioni precedenti al 1958 emergono interessanti comunicazioni tra i responsabili dell’assegnazione, in cui si dissero più volte che “ci sono così tanti matematici meritevoli da non riuscire a decidere a chi dare la medaglia”.

Nel 1950 la commissione si focalizzò su molti diversi criteri, per esempio se dovessero solo concentrarsi sugli algebristi, oppure sui matematici con meno di 32 anni o matematici diventati famosi grazie al precedente congresso.

Da quel congresso in poi, per alcune assegnazioni successive, presero come criterio di riferimento che il riconoscimento della medaglia dovrebbe essere un modo per far crescere di popolarità i vincitori. Per cui se un candidato avesse già rivestito il ruolo di professore in un’ottima istituzione oppure avessero già ricevuto altri importanti premi, allora questo sarebbe stato per loro un “motivo in meno” per ricevere la medaglia.

Nel 1966 la commissione si accorse però che questi criteri erano troppo complessi, interpretabili e ambigui e che quindi l’assegnazione stesse diventando troppo difficile. Per cui decisero di imporre un limite d’età. 

Quindi tutto ad un tratto anche matematici già riconosciuti a livello internazionale, ma comunque giovani, potevano essere validi candidati per la medaglia. Ecco quindi da dove arriva la crescita di prestigio di questa medaglia e quindi anche il nome “Premio Nobel per la Matematica”.

Ecco quindi il paradosso dietro la medaglia 🙂 Per cercare un criterio per valutare a chi assegnare la medaglia in base ai meriti, decisero di imporre un limite d’età che è completamente diverso come obiettivo, si quasi l’opposto! Infatti l’età dei 40 anni non ha alcuna relazione magica con l’attività di un matematico, è abbastanza casuale.

O meglio, non è casuale, è il più piccolo numero “tondo” che li tutelava dall’assegnazione delle medaglie Fields nelle precedenti edizioni. Infatti prima del 1966 tutti i vincitori avevano meno di 40 anni 😉

Se avessero limitato il premio ai 30 o 35 anni sarebbe stato diverso? Beh, forse ma lascio a te le valutazioni…chiaramente non i tutti  i campi di ricerca è possibile ottenere risultati degni di nota in giovane età.

Matematici famosi che hanno vinto la Medaglia Fields e risultati più memorabili

Nelle due immagini precedenti puoi vedere la distribuzione delle medaglie delle scorse edizioni rispetto a nazionalità e università. Due immagini parecchio interessanti direi.

Ma vediamo ora la lista dei matematici che hanno avuto modo di accedere a questo gran riconoscimento. Siccome sono molti non la riporto qui nell’articolo, preferisco concentrarmi sul successivo paragrafo in cui parleremo dei vincitori italiani (che sono solo 2 fino ad ora). Però puoi trovare qui una tabella davvero ben fatta con tutta la lista e alcune informazioni su questi vincitori: https://stats.areppim.com/listes/list_fieldsxmedal.htm

Italiani che hanno vinto la medaglia Fields

Gli unici due matematici italiani ad aver vinto la medaglia Fields sono Enrico Bombieri ed Alessio Figalli. Loro l’hanno vinta rispettivamente nell’edizione del 1974 e del 2018.

Bombieri fu vincitore della Medaglia Fields e del Premio Balzan grazie alla sua ricerca nella teoria dei numeri, geometria algebrica e analisi matematica.

Enrico Bombieri

Alessio Figalli

Figalli invece vinse l’anno scorso grazie alla sua ricerca nel campo del trasporto ottimale. Ha già vinto anche molti altri riconoscimenti tra cui la Medaglia Stampacchia nel 2015 e il Premio Feltrinelli Giovani nel 2017. I suoi settori di ricerca privilegiati sono il calcolo delle variazioni e le equazioni differenziali alle derivate parziali.

Lui ha conseguito la laurea alla Normale di Pisa ed ha completato poi il suo dottorato sotto la supervisione di Luigi Ambrosio e Cédric Villani (altra medaglia Fields, nel 2010). Dal 2016 è docente al Politecnico federale di Zurigo.

Puoi trovare le pagine Wikipedia di questi due matematici italiani qui di seguito:

Alessio Figalli

Enrico Bombieri

A che altri importanti riconoscimenti può ambire un matematico?

Per i matematici sono stati pensati molti premi oltre alla Medaglia Fields. Alcuni riconoscimenti parecchio famosi sono:

  1. Premio Caccioppoli
  2. Clay Research Award
  3. Premio Henri Poincaré
  4. Premio Abel
  5. Medaglia Stampacchia
  6. Medaglia Guy
  7. Pregio Carl Friedrich Gauss

E molti altri che puoi trovare qui: Premi matematici

Per concludere ci tengo a lasciarti qui di seguito alcune risorse da cui ho preso il materiale per scrivere questo articolo e altre per tuoi eventuali approfondimenti personali:

E qui qualche video che potresti trovare interessante:

Il pendolo semplice: equazione, ritratto di fase e analisi della dinamica

Pendolo semplice, di sicuro ti sarà capitato di vederne uno, giocarci e magari guardare qualche video in cui se ne analizza il comportamento. In questo articolo mi pongo quindi l’obiettivo di provare a formalizzare questa dinamica, analizzando l’equazione differenziale che ne regola il comportamento, disegnando il ritratto di fase e studiandone gli equilibri.

Cercherò di aiutarmi il più possibile con immagini e video perché so che possono aiutare a chiarire le idee, però allo stesso tempo proverò ad usare una procedura rigorosa nell’analisi della dinamica e del ritratto di fase di questo sistema conservativo. Probabilmente in futuro ci sarà tempo per studiare il pendolo smorzato, il pendolo doppio o altre variabili di questo sistema dinamico, ma ora direi che è fondamentale partire dal sistema più semplice, che in realtà richiede comunque un bello studio, ricco di possibili approfondimenti.

L’equazione del pendolo semplice può essere ricavata a partire dal secondo principio della dinamica (il classico $\boldsymbol{F}=m\cdot \boldsymbol{a}$), ma per semplicità in questo articolo partiremo dando per buona l’equazione e ci concentreremo sull’analisi della dinamica di questo sistema. Per farlo seguiremo 2 strade:

  • Vedremo il sistema come sistema conservativo analizzando quindi il potenziale (energia potenziale) del sistema e di conseguenza tracciando il ritratto di fase
  • Come “verifica” di quanto fatto risolveremo esattamente l’equazione differenziale e analizzeremo quindi le orbite

Ecco quindi l’equazione che ci interessa:

$m\ddot{x}=k\sin{x}$

dove $x$ è l’angolo formato dal pendolo con l’asse verticale e con $\ddot{x}$ intendiamo la derivata seconda di $x$ rispetto al tempo, ovvero l’accelerazione angolare. Può essere che ti sia capitato di vedere l’equazione del pendolo sotto altra forma, ma ho deciso di scriverla con una generica costante $k$ e non coinvolgendo la lunghezza del pendolo, l’accelerazione di gravità e quant’altro per astrarre il più possibile e concentrarci sull’analisi matematica del sistema. Detto ciò, anche nelle forme più “fisiche” di questa equazione, non cambia nulla rispetto a quello che vedremo.

Ah…dimenticavo! Per risolvere un’equazione differenziale chiaramente ci serve una condizione iniziale e, essendo l’equazione di nostro interesse del secondo ordine, ci serve una velocità angolare iniziale ed un angolo iniziale, che chiameremo $(x_0,\omega_0)$. Per tracciare il ritratto di fase lasceremo questi valori liberi, mentre per vedere qualche dinamica particolare, che simulerò con un semplice codice Matlab (che troverai più in basso nell’articolo), ci concentreremo su qualche valore specifico.

Prima di passare all’analisi matematica, penso possa esserti utile una breve introduzione al problema davvero ben fatta da questo video:

Grafico qualitativo del potenziale

Partiamo dal definire cosa intendiamo per sistema conservativo, senza però addentrarci troppo nei dettagli e limitandoci quindi a quello che ci servirà per proseguire nello studio.

Diciamo il sistema definito dalla precedente equazione differenziale essere CONSERVATIVO perché esiste una funzione, $V(x) = k\cos{x}$ nel nostro caso, tale che $\ddot{x}=-V'(x)$, dove $V(x)$ è detto potenziale del sistema.

La nostra equazione differenziale del secondo ordine, è quindi in grado di definire un cosiddetto campo vettoriale del secondo ordine come segue:

$X=X(x,v) = \begin{bmatrix} mv \\ -V'(x) \end{bmatrix}$

A questo punto, per poter tracciare il ritratto di fase, sfruttiamo ulteriormente il fatto che il nostro sistema sia conservativo introducendo un importante integrale primo del nostro campo vettoriale (se non sai cosa sia un integrale primo leggi il mio precedente articolo qui: https://www.mathone.it/integrale-primo/) che è l’energia meccanica, l’energia totale ovvero energia cinetica sommata ad energia potenziale.

Come infatti avrai studiato probabilmente al corso di Fisica 1, ma che comunque mostreremo brevemente qui di seguito, in un sistema conservativo l’energia totale si conserva.

Facciamo un richiamino semplice e definiamo l’energia totale del sistema, verificando poi che esso si conservi effettivamente lungo le curve integrali del campo $X$, ovvero che sia davvero un integrale primo del sistema:

$E=E(x,v) = K(x.v) + V(x) = 1/2mv^2 + V(x)$, di conseguenza possiamo calcolare la derivata di Lie di $E$ lungo il campo $X$ (se non sai cosa sia ti rimando all’articolo citato in precedenza) come segue:

$\mathcal{L}_X(E) = \nabla E \cdot X = \begin{bmatrix} V'(x) \\ mv \end{bmatrix} \cdot \begin{bmatrix} mv \\ -V'(x) \end{bmatrix} = 0 $

Ragioniamo quindi un attimo…cosa sono le orbite di un sistema? Detta semplicemente, per quanto ci riguarda sono curve del piano $x-v$ invarianti rispetto al flusso del campo vettoriale $X$. Sono quindi insiemi 1-dimensionali. Ma siccome la dinamica del sistema definito da $X$ evolve in uno spazio 2-dimensionale (piano $x-v$) e gli insiemi di livello di $E$ sono invarianti, ho una riduzione di un grado di libertà del sistema e gli insiemi di livello di $E$ sono esattamente le orbite del sistema.

Se fossimo quindi in grado, al variare di $c\in\mathbb{R}$, di disegnare gli insiemi

$\Sigma_c = \{ (x,v) : E(x,v) = c\}$ saremmo a posto, perché avremmo disegnato correttamente il ritratto di fase del sistema. Ma perché complicarci la vita?

Infatti è possibile risalire alle stesse orbite solamente disegnando il grafico qualitativo del potenziale $V$, per capire il motivo pensiamoci un po’.

La coppia $(\bar{x},\bar{v})$ appartiene all’insieme $\Sigma_c$ se e solo se $E(\bar{x},\bar{v})=c$. Benissimo, ma è anche sempre vero che $K(x,v) = 1/2 mv^2\geq 0$ per ogni $v$, quindi necessariamente la coppia $(\bar{x},\bar{v})$ per poter stare in $\Sigma_c$ deve essere tale che $\bar{x}\in \sigma_c = \{ x : V(x)\leq c\}$, altrimenti è impossibile ottenere $c$ come somma del potenziale con l’energia cinetica. Ecco quindi che ottieniamo quanto anticipato prima, infatti da ciò segue che per disegnare $\Sigma_c$ basta capire com’è fatto $\sigma_c$ che è molto più semplice da studiare visto che è il sottolivello $c$ di una funzione di una sola variabile.

Ecco quindi il grafico qualitativo del potenziale del nostro sistema qui di seguito:

Ho omesso la scala sull’asse $y$ perchè il valore assunto su essa dipende unicamente dal paramentro $k$ che ho appositamente lasciato imprecisato.

Per tracciare quindi le varie orbite, corrispondenti ai diversi livelli energetici, nel prossimo paragrafo analizzeremo le intersezioni delle rette di forma $y=c$ con questo grafico.

Da grafico qualitativo a ritratto di fase

Come abbiamo già introdotto in precedenza, per ottenere il ritratto di fase del sistema in analisi, è sufficiente studiare i sottoinsiemi di livello della funzione potenziale. Ho quindi evidenziato qui di seguito i vari livelli energetici interessanti, rappresentandoli con 5 colori diversi.

Per proseguire, dobbiamo utilizzare alcune regole utili per passare dal grafico qualitativo del potenziale ad una specifica orbita o insieme di orbite. Volendo si potrebbero ricavare anche con un’interpretazione fisica queste “regole” ma per il momento mi limito ad elencare quelle che ci interessano, per poi applicarle al nostro esempio.

Intanto definiamo sottoinsieme di livello, in corrispondenza del livello energetico $E=c$ il seguente insieme $\sigma_c = \{x\in\mathbb{R}: V(x)\leq c\}$. In base alle proprietà di questo insieme, prevalentemente proprietà topologiche, si distinguono le varie tipologie di orbite. Inoltre, nel caso tale insieme non sia connesso (se non sai cosa significhi essere connesso vai a leggerti una spiegazione qui), si può procedere all’analisi sulle sue componesse, ovvero sui suoi sottoinsiemi connessi e disgiunti, la cui unione restituisce l’insieme disconnesso di partenza.

Ecco quindi le “regole” che andremo a seguire:

  • Se $\sigma_c = [a,b]$ è limitato, allora ad esso è associata un orbita periodica, simmetrica rispetto all’asse x, che la interseca con una tangente verticale. Vediamo un esempio:

Dove i punti di intersezione con l’asse $x$ corrispondono alla $a$ e $b$ del grafico di sinistra.

  • Se $\sigma_c=[-\infty,+\infty]$ allora l’orbita associata è illimitata, per tempi infinitamente grandi e piccoli questa andrà rispettivamente come $x\rightarrow \pm\infty$ ed è simmetrica rispetto all’asse $x$, senza intersecarla, come puoi vedere di seguito:
  • Nel caso della retta verde chiaro, abbiamo ancora che $\sigma_c=\mathbb{R}$ ma, inoltre, abbiamo un unico punto in cui $V(x) = c$, che è un equilibrio instabile. In questo caso la situazione è un po’ più complicata e avremo un punto chiamato di equilibrio instabile, è un punto iperbolico e in sua corrispondenza abbiamo 5 orbite, ottenendo quanto segue:
  • Nel caso in cui il sottoinsieme di livello abbia un solo punto, come con la retta viola che puoi vedere di seguito, avremo un equilibrio stabile e l’unica orbita ad esso associata è il punto stesso.
  • Per concludere, nel caso in cui il sottoinsieme di livello sia vuoto, come presentato qui sotto, avremo che non c’è nessun’orbita associata.

Benissimo, ora abbiamo tutti gli strumenti per “unire i puntini” e passare dal grafico della funzione potenziale al ritratto di fase. Per farlo basta semplicemente assemblare i 5 pezzi visti qui sopra e accorgersi della periodicità del nostro potenziale. Infatti è sufficiente analizzare il ritratto di fase tra due equilibri instabili e poi ripetere per periodicità.

Vediamo quindi cosa si ottiene assemblando il tutto! Il risultato che trovi qui sotto l’ho ottenuto con un servizio gratuito online che permette di rappresentare ritratti di fase di campi vettoriali, lo trovi qui: https://aeb019.hosted.uark.edu/pplane.html . Più in basso troverai invece una video simulazione del codice che ho scritto in Matlab per ottenere lo stesso risultato.

Caratteristica immagine ad “occhio” che rappresenta il ritratto di fase del pendolo semplice

Risoluzione esatta equazione del pendolo

Una volta letto il precedente paragrafo, sono certo che ti sarai convinto che possiamo tranquillamente scegliere una condizione iniziale a caso e sapremo quale sarà l’orbita ad essa associata e quindi la dinamica del sistema.

Un altro modo per ottenere lo stesso risultato è risolvere direttamente il problema di Cauchy seguente:

$m\ddot{x}=k\sin{x}$ con $x(0)=x_0$ e $\dot{x}(0)=\omega_0$

L’equazione differenziale del secondo ordine in analisi la si può risolvere in vari modi, probabilmente il più classico è il metodo di somiglianza, anche noto come metodo degli annichilatori, che trovi spiegato nei video qui di seguito (nel primo è introdotto il metodo, mentre nel secondo si tratta l’esempio che ci interessa):

Altro modo per risolverla potrebbe essere ricondursi ad un sistema del primo ordine e lavorare di conseguenza. Per evitare di dilungarmi eccessivamente, se ti interessa scrivi pure un commento a questo articolo che ti mostrerò anche questa procedura.

Otteniamo quindi $x(t) = -k/m (\sin{t}-t(v_0 m/k+1))+x_0$ e quindi il suo grafico potrà descrivere tranquillamente la dinamica del sistema, in alternativa a quanto fornito dal ritratto di fase.

Qui ho semplicemente riportato il grafico della soluzione per una particolare scelta della condizione iniziale $(x_0,v_0)=(0,1)$, come puoi vedere nel grafico. Infatti questa curva passa per l’origine e la tangente in essa è a pendenza 1, proprio come $v_0$. Ci tenevo a riportare questo grafico per chiarire che nonostante il comportamento del sistema dinamico che ci interessa sia periodico, la fase o comunque la variabile $x=x(t)$ continua a crescere nel tempo.

Implementazione numerica dell’equazione del pendolo

<?matlab
clear all
close all

k = 1;
m = 1;





f = @(t,y) [y(2); 
          k/m * sin(y(1))];


t0 = 0; T = 8; %tempi iniziale e finale
n = 10001; %numero di nodi di discretizzazione temporale
timespan = linspace(t0,T,n);
dt = timespan(2)-timespan(1); %timestep di discretizzazione

initial = [pi .2 pi/2 pi-.1 1 0.1;
           0   1  .5   1    3 0.1 ];    

for j = 1:length(initial(1,:))
    x0 = initial(1,j);
    v0 = initial(2,j); %v0 = x'(0)    
    y0 = [x0;v0];
    plot(x0,v0,'ko','MarkerSize',5)
    t = t0;
    y = zeros(2,length(timespan));
    y(:,1) = y0;

    for i = 1:length(timespan)-1
        y(:,i+1) = y(:,i) + dt * f(t,y(:,i));
        t = t + dt;
    end
    if j>1
        plot(y(1,:),y(2,:),'r*','MarkerSize',1);
    else 
        plot(y(1,:),y(2,:),'ro','MarkerSize',6);
    end
    hold on;
end
?>
[/matlab]

E qui ho riportato l’esito di questo codice, in cui vengono simulate 6 orbite, partendo da differenti condizioni iniziali. Chiaramente non essendo curato e ottimizzato gli output sono molto meno chiari rispetto a quelli riportati nelle sezioni precedenti. Tuttavia ho preferito aggiungere questo paragrafo per mostrare, anche a chi non ha mai scritto nessuna implementazione numerica, come sia possibile “simulare” l’andamento di un particolare sistema dinamico.

Giusto perché si sappia, per integrare nel tempo ho usato Eulero Esplicito, non è senz’altro la miglior strada percorribile ma è la più semplice, da cui iniziare per ottenere qualche risultato tangibile.

L’ESCLUSIVA COLLANA “GRANDI IDEE DELLA MATEMATICA” ARRIVA IN EDICOLA!

Dal 24 AGOSTO Hachette Fascicoli lancia la collana di libri “GRANDI IDEE DELLA MATEMATICA” disponibile in edicola e sul sito www.grandiideedellamatematica.it

Qui di seguito vi lascio il comunicato stampa che mi è stato inviato come presentazione della collana.

La collana Grandi idee della matematica raccoglie i concetti e le teorie fondamentali della matematica, per la prima volta presentati nella successione storica nella quale comparvero. Dalla comparsa dei numeri fino alle teorie del caos e della complessità, ogni nuovo concetto e teoria matematica ci ha permesso di estendere gli orizzonti delle nostre conoscenze e di trovare applicazioni per risolvere problemi pratici.

Perché, come disse Galileo Galilei, l’universo è scritto in lingua matematica.

o sviluppo di questa disciplina non è stato né casuale né aleatorio e ogni nuova conquista è stata costruita sopra le precedenti. Per questo, per capire e apprezzare le grandi creazioni della matematica è fondamentale seguire il filo della sua storia.

Collana presentata da Roberto Natalini, matematico e Dirigente di Ricerca del CNR presso l’Istituto per le Applicazioni del Calcolo “Mauro Picone”.

Volumi realizzati da importanti matematici e ricercatori appartenenti a centri di riconosciuto prestigio, come le Università Complutense e Autónoma di Madrid, il Massachusetts Institute of Technology (MIT), la Queen Mary University of London, le Università Politecniche di Madrid e della Catalogna, l’Università Johannes Gutenberg di Magonza e tante altre. Un’opportunità unica di scoprire tutto sui grandi temi della matematica, spiegati in forma monografica e divulgativa a partire dal contesto nel quale furono elaborati.

News e aggiornamenti per il lancio “GRANDI IDEE DELLA MATEMATICA” sono disponibili sul sito www.grandiideedellamatematica.it

GRANDI IDEE DELLA MATEMATICA è in edicola dal 24 agosto con la prima uscita al prezzo di lancio di 1,99€ oppure è disponibile on-line sul sito www.grandiideedellamatematica.it con l’offerta speciale di 3 libri a soli 4,99€!

IL SITO INTERNET Hachette ha realizzato uno specifico minisito responsive adatto alla navigazione sui diversi devices con tutte le informazioni sulla collana, con un’ampia galleria fotografica e nella sezione video lo spot televisivo. PIANO OPERA GRANDI IDEE DELLA MATEMATICA è in edicola dal 24 agosto con la prima uscita al prezzo di lancio di 1,99€ oppure è disponibile on-line sul sito www.grandiideedellamatematica.it con l’offerta speciale di 3 libri a soli 4,99€!

Data di lancio: 24 agosto 2019

Numero uscite: 40

Periodicità: settimanale

I primi titoli della collana:

1. In principio era il numero. L’umanità impara a contare

2. Infinito. Viaggio o destino?

3. Irrazionali. Uno scandalo nel cuore della matematica

4. Tutto è numero. La realtà è matematica?

5. Paradossi e assiomi. La matematica e i suoi fondamenti

6. Misurare il cielo e la Terra. La misura del cosmo, da Eratostene alla parallasse stellare

7. Viaggio negli spazi n-dimensionali. Alla scoperta dell’algebra lineare

8. Serie e successioni. I limiti dell’infinito

9. La sezione aurea e non solo. Le costanti matematiche

10. La matematica nell’arte. Geometria, armonia e proporzione nello studio dell’artista

Triangolazioni: cosa sono, alcuni utilizzi e molti esempi

Ogni superficie può essere triangolata. A priori questa triangolazione non è unica

Se ti è capitato di affrontare in precedenza qualche corso di matematica discreta o analisi numerica, certamente hai letto il termine triangolazione prima d’ora. In questo articolo voglio quindi pormi l’obiettivo di introdurre il concetto di triangolazione nella maniera più completa possibile, mostrando le principali regole che queste partizioni devono rispettare, aiutandomi con molti esempi.

Di sicuro, anche se non hai mai sentito nominare il termine triangolazione, già alle elementari/medie quando imparavi le somme degli angoli interni ad un poligono qualsiasi, ti avranno spiegato che per ottenere questi valori è conveniente dividere il poligono in triangoli.

Vediamo perché nel seguente semplice esempio:

In questo poligono irregolare a 5 lati, la cui somma degli angoli interni è 540°, ho scelto un punto a caso $O$ ad esso interno e poi ho partizionato la figura in 5 triangoli. Bene, il fatto che si possa triangolare in questo modo permette di notare facilmente che effettivamente la somma degli angoli interni è pari a 540°, infatti basta sommare gli angoli interni di 5 triangoli ($180\cdot 5$) e poi togliere l’angolo giro in $O$, ottenendo quindi $180\cdot 5 – 360 = 540$, come ci aspettavamo.

Dopo aver visto questa elementare applicazione del concetto di triangolazione, senza però averla ancora definita “formalmente”, direi che siamo pronti a proseguire introducendo qualcosa di più rigoroso.

Cos’è una triangolazione?

Una triangolazione di una superficie compatta $S\subset \mathbb{R}^3$ è data da una famiglia finita di suoi sottospazio chiusi $\{T_1,\cdots, T_n\}$ che ricoprano $S$ e da una famiglia, anch’essa finita, di omeomorfismi (intuitivamente sono funzioni che stanno a descrivere “deformazioni senza strappi”, quindi semplicemente funzioni che stirano o deformano superfici senza introdurre buchi o agire come se si tagliasse con una forbice) $\{\Phi_i\}_{i\in\{1,\cdots,n\}}$ dove $\Phi_i : T’_i\rightarrow T_i$ e $T’_i$ è un triangolo di $\mathbb{R}^2$, come siamo soliti intenderlo. A loro volta anche i sottoinsiemi $T_i$ sono detti triangoli, anche se in realtà possono essere qualcosa che non siamo soliti definire in questo modo, come vedremo in seguito.

Le immagini tramite tali omeomorfismi di vertici e lati dei triangoli $T’_i$ si dicono vertici e lati della triangolazione. Inoltre, per far sì che questa partizione sia definibile triangolazione, si richiede che per $i.j=1,\cdots,n,\;i\neq j$ sia soddisfatta una e una sola delle seguenti situazioni:

  • $T_i$ e $T_j$ sono disgiunti
  • $T_i$ e $T_j$ hanno in comune un solo vertice
  • $T_i$ e $T_j$ hanno in comune due vertici e il lato che li connette

Per completezza, ti inserisco qui sotto anche la definizione di triangolo nel piano $\mathbb{R}^2$:

TRIANGOLO: Figura piana limitata da 3 segmenti (lati del triangolo) che congiungono a due a due 3 punti non allineati (vertici del triangolo); è dunque un poligono di 3 lati.

Magari non ti è tutto chiaro della definizione o magari sì, comunque ora approfondiremo tutto con degli esempi.

Ah, dimenticavo…ogni superficie $S\subset\mathbb{R}^3$ ammette almeno una triangolazione, per una dimostrazione rigorosa di questo risultato puoi consultare il libro Curve e Superfici – Abate Tovena alla sezione 6.2

Partiamo dal semplice caso di un poligono, ovvero nel caso di una superficie contenuta in $\mathbb{R}^2\subset\mathbb{R}^3$. Qui per triangolare puoi procedere in infiniti modi, uno dei più semplici è quello che ti mostro nell’immagine precedente, che ti riporto ancora qui sotto:

Vediamo quindi in questo esempio cosa sono gli oggetti nominati nella definizione. In questo caso i triangoli sono 5, abbiamo quindi $T_1,T_2,T_3,T_4,T_5$. E gli omeomorfismi quali sono? Beh, in questo caso è molto semplice…basta prenderli tutti come la funzione identità. Infatti, essendo che partiamo già da triangoli come siamo abituati intenderli, non serve deformarli in alcun modo tramite gli omeomorfismi.

Ma, per concludere con l’esempio, questi triangoli rispettano le 3 condizioni riportate in precedenza? Si, certo…in questo semplice caso soddisfano tutti la stessa condizione:

  • I triangoli hanno tutti in comune il solo vertice $O$.

Si, ok..questo è un esempio forse troppo semplice, ma si deve partire da qualcosa, no?!

Ora vediamo un qualcosa di più “avanzato”: triangoliamo una sfera!

Chiaramente anche in questo caso le triangolazioni possibili sono infinite, questa è la più intuitiva comunque. Non sembra complicata, ma ci permette di non limitarci al semplice caso 2-dimensionale e comunque intuire gli elementi coinvolti nella definizione di triangolazione.

I triangoli in questo caso sono 8. Tuttavia non possiamo dire che gli omeomorfismi siano delle identità, in quanto ogni elemento di questa triangolazione, deve venire “appiattito” per ottenere un classico triangolo nel piano.

Non vedremo una espressione di uno specifico omeomorfismo perché questa dipende da che triangolo si sceglie, da come la sfera è posizionata nello spazio euclideo e altre cose…ma vediamo qui sotto l’idea visuale dietro la costruzione di queste funzioni:

Ecco, come riportato qui sopra, ognuno di questi 8 omeomorfismi deve semplicemente mappare una rotazione dell’immagine di sinistra in una deformazione dell’immagine di destra, nulla di complicato insomma…

Concludiamo invece analizzando se questa triangolazione rispetta le 3 proprietà tra coppie di triangoli previste nella definizione:

  • Come vedi i triangoli opposti nella sfera sono disgiunti
  • Mentre i triangoli uno a fianco all’altro, condividono 2 vertici e il lato che li connette
  • E per concludere i triangoli nello stesso emisfero che non condividono alcun lato condividono solo uno dei “poli”

Quindi tutto va per il verso giusto…

Ora come esercizio ti lascio la triangolazione di un toro. Una possibile scelta è riportata nell’immagine qui sotto ma c’è un po’ di analisi che ti consiglio di provare a fare da solo per vedere se hai capito il concetto:

Genere di una superficie

Per completezza, prima di passare all’analisi delle proprietà che una triangolazione deve soddisfare, ho deciso di riportarti anche la formula di Eulero per capire quanti triangoli, vertici e lati sono presenti in una triangolazione. Inoltre siccome questa formula, data una triangolazione di essa, ci permette di capire quanti “buchi” ha una superficie (es. 0 per la sfera, 1 per il toro), riporto qui di seguito anche la definizione del termine “genere di una superficie”:

Il genere di una superficie $S\subset\mathbb{R}^3$ è un numero intero non negativo che denota il massimo numero di curve semplici chiuse disgiunte che si possono disegnare su di essa senza sconnetterla.

In pratica il genere di una superficie (in realtà solo nel caso essa sia orientabile) corrisponde al numero dei buchi che essa ha.

Su una sfera, per esempio, qualsiasi curva semplice chiusa genera due componenti connesse distinte (in qualunque caso infatti si originano una calotta superiore ed una inferiore). Quindi la sfera ha genere 0 (infatti ha zero buchi). Il toro, invece, avendo un buco, ha genere 1, infatti è possibile tracciare una curva chiusa lungo una delle due circonferenze generatrici senza sconnetterlo, come mostrato nella seguente figura. Non è possibile tracciarvi qualsiasi altra curva semplice chiusa disgiunta senza sconnetterlo.

Questa caratterizzazione del genere è intuitiva ma non troppo operativa. D’altro canto il genere si può calcolare utilizzando anche la caratteristica di Eulero, che è un altro invariante combinatorio per le superfici, per determinare il quale faremo ricorso al concetto di triangolazione.

Per una superficie $S$ dotata di una triangolazione $T$, vale la seguente formula, detta Formula di Eulero:
Sia $S$ una superficie connessa e dotata di una triangolazione $T$, allora
$ \chi(S)=f-e+v=2-2g$ dove $\textbf{f}$ è il numero delle facce, $\textbf{e}$ il numero dei lati, $\textbf{v}$ il numero dei vertici di $T$, $\textbf{g}$ il genere della superficie $S$ e $\chi(S)$ la caratteristica di Eulero della superficie.

Prima di passare oltre mostriamo con un esempio il calcolo del genere tramite la Formula di Eulero.

Nella sfera, possiamo fornire una triangolazione composta da 8 facce analizzata poco sopra. In questo caso si ha $f=8$, $e=12$, $v=6$ e quindi $f-e+v=8-12+6=2=2-2g$, ritroviamo $g=0$, infatti la sfera ha 0 buchi.

IMPORTANTE: Come si può intuire, la caratteristica di Eulero e quindi il genere di una superficie non dipende dalla triangolazione della superficie analizzata.

Che proprietà deve soddisfare una triangolazione?

Nella figura qui di seguito sono rappresentati tre triangoli che coprono parte di un quadrato. A sinistra abbiamo tutti elementi consentiti dalla definizione di triangolazione, mentre a destra si infrangono tali proprietà.

A sinistra ci sono tre triangoli che possono essere parte della stessa triangolazione in quanto presi a due a due soddisfano tutti una delle tre proprietà della precedente definizione. A destra ci sono invece tre triangoli che non possono essere tutti parte della stessa triangolazione, perché non le rispettano.

Lascio a te capire quali coppie di triangoli non vanno bene e perché 😉 E’ un semplice esercizietto.

A cosa vengono utilizzate le triangolazioni?

Uno degli utilizzi di queste triangolazioni te l’ho già riportato qui sopra, ovvero per calcolare il genere di una superficie. Forse può non sembrarti rilevante come applicazione ma in realtà lo è…

Ora però vediamo un importante utilizzo che è FONDAMENTALE per risolvere equazioni alle derivate parziali numericamente , tramite il METODO DEGLI ELEMENTI FINITI (FEM).

Non so se tu abbia dimestichezza con tecniche numeriche per risolvere equazioni differenziali ordinarie o alle derivate parziali e non pretendo certo di spiegartene alcune in poche righe nel post, però ti suggerisco 2-3 libri qui sotto per studiarti queste tematiche in autonomia:

In questi metodi, volendo discretizzare i domini in cui andiamo a risolvere le nostre PDE, le triangolazioni ci vengono in aiuto. Infatti si usano per poter definire una partizione del dominio e quindi definire un sottospazio finito dimensionale in cui andare ad approssimare la soluzione debole del problema differenziale.

Ti lascio qui di seguito un’immagine abbastanza esplicativa, ma ti suggerisco vivamente di dare un’occhiata ai libri qui sopra.

Se può interessarti qualche piccolo approfondimento su queste tematiche, fammelo sapere mandando un messaggio su Instagram a @mathoneig oppure una mail a list@mathone.it che vediamo cosa fare 🙂

Le triangolazioni sono utilizzate anche per altri scopi, ma non li cito per due ragioni:

  • Non ho troppa dimestichezza con la matematica discreta e questi sono quelli che conosco
  • Preferisco evitare di citarli senza darti riferimenti per approfondire che ho prima consultato

Se tuttavia ti va di condividere altre applicazioni che conosci e spiegarle in maniera esaustiva, lascia pure un commento qui sotto e dopo penserò io a metterlo in evidenza a tutti i lettori!

Prima di passare all’ultima sezione di questo articolo, colgo l’occasione per suggerirti un paio di dispense per approfondire queste tematiche:

Una triangolazione particolare: la triangolazione di Delaunay

Intanto prima di iniziare ti condivido una tesi particolarmente interessante che ho trovato su questo tema, la puoi leggere qui, e ora possiamo vedere cos’è questa particolare triangolazione e perché è importante.

Una triangolazione di un insieme finito di punti $P\subset\mathbb{R}^2$ viene detta di Delaunay se il cerchio circoscritto ad ogni triangolo è vuoto, ovvero nessun punto di P vi giace all’interno.

Ogni insieme di punti (non tutti collineari tra di loro) ha una sola triangolazione di Delaunay. Ogni triangolazione di Delaunay massimizza il più piccolo angolo interno tra tutte le triangolazioni possibili. La triangolazione di Delaunay è il “duale” di un’altra costruzione geometrica nota come Diagramma di Voronoi.

A meno di trasformazioni rigide, la triangolazione di Delaunay di un insieme fissato di punti è unica. Per costruirla esistono degli algoritmi più o meno ottimizzati che puoi trovare abbastanza facilmente con una ricerca su Google (se vuoi scoprire cos’è un algoritmo leggi qui: Cos’è un algoritmo)

La descrizione qui sopra riportata di triangolazione di Delaunay l’ho presa da una dispensina che trovi qui in cui c’è anche qualcosa in più di quanto ho scritto.

Questa triangolazione è parecchio importante nel campo della matematica discreta e dell’analisi numerica perché consente di massimizzare l’angolo interno minimo e questa proprietà è fondamentale per quanto riguarda l’interpolazione, il condizionamento delle matrici di rigidezza e molte altre applicazioni.

Con ciò direi che l’articolo può finire qui, abbiamo fatto un bel giretto nel campo della matematica discreta senza ovviamente approfondire troppo i dettagli. Per questo infatti ci sono i libri di testo, mentre chiaramente il mio obiettivo è solo farti conoscere temi nuovi, altri concetti e farti venire la voglia di leggere e studiare di più a riguardo 🙂

Spero di esserci riuscito, se ti è piaciuto l’articolo o hai suggerimenti di ogni genere lascia pure un commento qui sotto, ti risponderò sicuramente!

Integrali primi: non tutto varia in un sistema dinamico

I sistemi dinamici sono uno degli argomenti e tematiche che preferisco, quindi ti parlo con molto piacere di questi “integrali primi”. Ho pensato di iniziare con un breve paragrafo introduttivo in cui definire cosa sono i sistemi dinamici, proseguire con un semplice esempio, definire il concetto di integrale primo e concludere portando un esempio di integrale primo.

Nulla di troppo avanzato, con questo articolo mi pongo l’obiettivo di introdurti il concetto di integrale primo accompagnandoti magari dal non sapere cosa sia un sistema dinamico ad avere un’idea più o meno chiara di cosa siano questi “oggetti”.

Cosa sono i sistemi dinamici?

Partiamo con una definizione formale del concetto di sistema dinamico. Poi la semplificheremo notevolmente, tanto alla fine a noi non serve essere troppo rigorosi (per quello ci sono i libri di testo e a conclusione dell’articolo te ne suggerirò alcuni per studiare queste tematiche), ma ci interessa comprendere le idee, le intuizioni 🙂

Sia $M$ una varietà differenziabile compatta sulla quale è definita una misura regolare normalizzata $\mu$, e sia $\phi := \{\phi^t\}$, $t\in\mathbb{R}$ oppure $t\in\mathbb{Z}$, un gruppo di diffeomorfismi su $M$, parametrizzato da $t$, che preservano la misura. Più formalmente si ha che
\[
\phi^{t}\circ\phi^{s}=\phi^{t+s}, \phi^{0}=Id ,
\]
\[
\mu(\phi^{-t}(A))=\mu(A)
\]
per ogni $ t,s$ in $\mathbb{R}$ o $\mathbb{Z}$, e ogni $A \subset M$ $\mu$-misurabile. Dove con la notazione $\phi^{-t}(A)$ si intende l’insieme
$\phi^{-t}(A):=\{ x \in M : \phi^t(x)\in A\} $.
La terna $(M,\mu,\phi)$ così costruita viene definita sistema dinamico classico.

Questa definizione non l’ho scritta per spaventare, semplicemente per mostrare l’insieme di nozioni che sarebbero necessarie per iniziare a studiare rigorosamente i sistemi dinamici. Ma nessun problema, intanto ti suggerisco alcuni riferimenti dove, se sei interessato, puoi approfondire i termini che ho citato nella definizione, poi spoglieremo le precedenti righe di tutte queste cose complicate ed andremo al succo del concetto con un esempio.

Varietà differenziabile: https://it.wikipedia.org/wiki/Variet%C3%A0_differenziabile

Misura regolare: https://it.wikipedia.org/wiki/Misura_regolare

Diffeomorfismo: https://it.wikipedia.org/wiki/Diffeomorfismo

Spazio misurabile: https://it.wikipedia.org/wiki/Spazio_misurabile

Bene, ci siamo. I sistemi dinamici di cui ci interesseremo sono associati ad equazioni differenziali definite AUTONOME, nel senso che la funzione che li definisce non dipende esplicitamente dal tempo. Giusto per completezza, ci tengo a dirti che ogni sistema è riconducibile ad un sistema autonomo, per cui non stiamo perdendo di generalità facendo questa assunzione.

Per parlare di sistema dinamico dobbiamo avere uno spazio su cui lavorare (noi lavoreremo in $\mathbb{R}^2$, nel piano euclideo), una funzione che regola la dinamica (con sufficiente regolarità) e più o meno siamo a posto.

In parole povere infatti un sistema dinamico è un modello matematico che rappresenta un oggetto, un sistema, che evolve nel tempo secondo una legge deterministica.

I sistemi dinamici, come penso tu possa aver intuito, sono descritti/definiti da delle equazioni differenziali, che possiamo scrivere nella seguente forma nel caso del piano euclideo $\mathbb{R}^2$:

$\dot{x}=f_1(x,y)$

$\dot{y}=f_2(x,y)$

dove ho omesso nella scrittura che $x=x(t)$ è una funzione del tempo, e lo stesso per $y$. Inoltre con $\dot{x}$ voglio indicare $\frac{dx(t)}{dt}$.

Si può generalizzare quanto riportato nella precedente coppia di equazioni, definendo un campo vettoriale $X:\mathbb{R}^2\rightarrow\mathbb{R}^2$ e introducendo quindi il seguente sistema di 2 equazioni differenziali del primo ordine:

$(\dot{x},\dot{y}) = X(x,y)$.

Ecco l’esempio di un campo vettoriale, la cui immagine è tratta da Wikipedia, dove la superficie/varietà di definizione è una sfera e geometricamente il campo vettoriale si rappresenta come dei vettori applicati ai punti della superficie sferica.

Dato il campo vettoriale $X$ definito come in precedenza, diciamo curva integrale passante per il punto $P_0\in\mathbb{R}^2$ una curva del piano che passa per quel punto e che è puntualmente tangente al campo vettoriale $X$ a cui è associata. In formule si ha che:

$t\rightarrow x(t)$ è curva integrale passante per $x_0$ se $x(0)=x_0$ e $\frac{dx(t)}{dt}=X(x(t))$.

Se il campo vettoriale è sufficentemente regolare, vale il teorema di esitenza e unicità di Cauchy-Lipschitz, che garantisce che per ogni condizione iniziale $P_0$ esiste una ed una sola curva integrale del campo passante per quel punto.

Prima di passare oltre, ci serve definire anche il concetto di flusso di un campo vettoriale o, alternativamente, del sistema dinamico ad esso associato. Lo facciamo qui di seguito:

Dato il campo vettoriale $X:\Omega\subset\mathbb{R}^2\rightarrow\mathbb{R}^2$, si dice flusso di $X$ la funzione $\Phi_{X} : \Omega\times\mathbb{R}\rightarrow \mathbb{R}^2$ che soddisfa le seguenti proprietà:

1. Per ogni tempo $t\in\mathbb{R}$, la funzione $\Phi_{X}^t: \Omega\rightarrow\mathbb{R}^2$ definita come $\Phi_{X}^t(c) := \Phi_{X}(c,t)$ è un diffeomorfismo rispetto alla sua immagine.

2. La mappa $c_y:\mathbb{R}\rightarrow\mathbb{R}^2$ tale che $c_y(t) := \Phi_{X}(y,t)$ definisce la curva integrale che al tempo $t=0$ passa per il punto $y$.

Più correttamente si è soliti parlare di flusso locale e, in tal caso, le due precedenti proprietà vanno indebolite parlando semplicemente di intorni aperti del punto attorno al quale si vuole calcolare/definire il flusso.

P.S. Sui sistemi dinamici ci sarebbero una marea di cose da dire, e pian piano ti parlerò di alcune in futuro, per esempio riguardo alla teoria del caos trovi qualcosina qui https://www.mathone.it/teoria-del-caos/

Andiamo ora ad approfondire quanto visto fino ad ora con un esempio.

Dinamica preda-predatore

Per descrivere la dinamica evolutiva di una coppia di specie di animali, si può definire un semplice modello/sistema dinamico detto di Lotka-Volterra che rapporta gli incrementi/diminuzioni degli individui delle due differenti specie di animali nel tempo. Nel video qui sopra ti presento il modello in maniera spero sia semplice che chiara.

Preferisco non ripetere a parole scritte quanto detto nel video perchè, durando mezz’ora, sarebbe senz’altro un casino provare a riassumerla in un paio di paragrafi. Guardatelo con calma che sono certo ti chiarirà le idee prima di procedere con il concetto di integrale primo.

Se vuoi qualcosa di scritto riguardo a questo tema avevo scritto un articoletto in passato che trovi qui: https://www.mathone.it/preda-predatore/

P.S. Se ti piace il progetto Mathone ti consiglio di iscriverti al canale Youtube in cui trovi il video qui sopra 🙂

Insiemi invarianti ed integrali primi

Nel momento in cui abbiamo capito che per definire un sistema dinamico è sufficiente un certo dominio ed un campo vettoriale su esso definito, abbiamo la possibilità di dare spazio all’immaginazione e costruire i sistemi più disparati.

Non risulta difficile pensare di poter costruire sistemi in cui la dinamica evolve in modo tale che, se l’evoluzione inizia in un certo insieme, in esso rimarra per sempre. Vediamo un semplice esempio, dove invece che parlare di equazioni differenziali e quindi di sistemi dinamici continui, parliamo di “regole iterative” che definiscono un sistema dinamico discreto. Questo semplicemente perchè è più facile comprendere cosa sta succedendo.

Definiamo un sistema dinamico sulla retta reale $\mathbb{R}$ che manda il punto $x_k$ nel punto $x_{k+1}=2x_k$. Semplice, no?! Ogni volta che aumenta di un’unità il tempo, la posizione raddoppia.

Ottimo, ora che hai capito cosa succede in questo sistema, prova a pensare se sia possibile, partendo da un numero $x_0>0$, ottenere un numero negativo nel corso della nostra dinamica evolutiva… Impossibile, vero?!

Esatto, infatti in questo sistema dinamico abbiamo 3 cosiddetti sottoinsiemi invarianti di $\mathbb{R}$, che sono $\Omega_{-}=\{x\in\mathbb{R}:x<0\}$, $\Omega_0 = \{0\}$ e, per finire $\Omega_{+}=\{x\in\mathbb{R}:x>0\}$.

Ma definiamo più rigorosamente cosa si intende per insieme invariante:

Dato un sistema dinamico definito sul sottoinsieme $\Omega\subset\mathbb{R}^2$ dal campo vettoriale $X:\Omega\rightarrow\mathbb{R}^2$, si dice $D\subset\Omega$ sottoinsieme invariante se $\Phi_{X}^t(D)\subset D$ per ogni $t\in\mathbb{R}$, dove con $\Phi_{X}^t(D)$ definiamo l’immagine, al tempo $t$, dell’insieme $D$ tramite la funzione di flusso prima definita.

Ecco, ora finalmente ci siamo. Possiamo definire il concetto di integrale primo. Ricordando che per insieme di livello di una funzione regolare $f:\Omega\rightarrow\mathbb{R}$ intendiamo l’insieme $\Sigma_c=\{x\in\Omega: f(x)=c\}$, si dice $f$ integrale prima del campo vettoriale $X$ se e solo se, per definizione, per ogni $c\in Immagine(f)$, l’insieme $\Sigma_c$ è invariante rispetto al campo. Ciò può essere trascritto come:

$\Phi_X^t(f^{-1}(\{c\}))\subset f^{-1}(\{c\})\;\;\forall t\in\mathbb{R}.$

Un modo più operativo per caratterizzare un integrale primo, è mediante la cosiddetta derivata di Lie , la cui definizione può essere trovata per esempio qui: https://it.wikipedia.org/wiki/Derivata_di_Lie . Magari ci dedicherò un articolo in futuro.

In parole povere, possiamo definire la derivata di Lie di una funzione $f$ rispetto ad un campo $X$ come la variazione che $f$ ha lungo le curve integrali di $X$, ovvero parallelamente al campo $X$. Per questa ragione infatti questa derivata può essere calcolata come segue:

$\mathcal{L}_{X} f = \nabla f \cdot X$.

Siccome intuitivamente gli integrali primi sono funzioni che “non variano lungo il campo vettoriale”, la derivata di Lie permette di caratterizzare gli integrali primi come quelle funzioni la cui derivata è 0:

$f$ è integrale primo di $X$ se e solo se $\mathcal{L}_X f = 0$.

Spero che tu sia arrivato fin qui nella lettura, nonostante sia consapevole che l’articolo è piuttosto tecnico e se non hai dimestichezza con questi concetti probabilmente è anche pesante. Direi quindi che è arrivato il momento di concludere con un esempio di integrale primo e poi salutarci al prossimo articolo! 🙂

Esempio di integrale primo

Supponiamo di analizzare un sistema molto semplice, associato ad un cosiddetto “campo vettoriale del secondo ordine”. Probabilmente hai già studiato qualcosa di fisica e sicuramente ricorderai che nei sistemi conservativi l’energia totale si conserva. Tralasciando altri contributi e supponendo solo energia cinetica ed energia potenziale, possiamo dire che l’energia totale è della seguente forma:

$E(x,v)=\frac{1}{2}mv^2 + V(x)$, dove V è chiamata energia potenziale.

Ora possiamo mostrare, abbastanza facilmente, che il concetto di conservazione dell’energia totale può essere anche spiegato dal punto di vista della teoria dei sistemi dinamici, dicendo che $E$ è un integrale primo del campo vettoriale del secondo ordine associato alla seconda legge di Newton applicata al sistema.

Ricordiamo infatti che $\boldsymbol{F}=m\boldsymbol{a}$, dove $F$ è la forza agente sulla particella e $a$ la sua accellerazione. Quindi, supponendo un semplice sistema che evolve in una dimensione spaziale, quindi diciamo nel dominio $\mathbb{R}$, abbiamo che $\boldsymbol{a}=\ddot{x}$. e quindi la precedente equazione prende la seguente forma:

$F = m\ddot{x}$.

Supponendo il sistema conservativo inoltre, esiste una funzione detta potenziale $V(x)$ tale che $F(x)=-V'(x)$, di conseguenza il sistema si può scrivere come $m\ddot{x}=-V'(x)$, ovvero come un’equazione del secondo ordine.

Se hai un minimo di dimestichezza con le equazioni differenziali ordinarie, di certo saprai che questa equazione può essere trasformata in un sistema di due equazioni del primo ordine e che quindi ad essa può essere associato un campo vettoriale $X=X(x,v)$ come segue:

$(\dot{x},\dot{v}) = (v,-V'(x)/m) = X(x,v)$.

Eccoci quindi pronti a fare un semplice conto, ovvero a verificare che $\mathcal{L}_X E = 0$ come segue:

$\mathcal{L}_X E = \nabla E \cdot X = (V'(x),mv)\cdot(v,-V'(x)/m) = V'(x)v-mv(V'(x)/m) = V'(x)v-V'(x)v=0$

che quindi signfica che $E$ non varia lungo le curve integrali di $X$ e che quindi $E$ è integrale primo del sistema.

La presenza di integrali primi rispetto ad un dato sistema dinamico permettono di semplificarne notevolmente la complessità, però preferisco non allungare ulteriormente l’articolo e, per il momento, darti solo l’idea dell’utilità di questi. Prova a unire i puntini…abbiamo detto che per campi vettoriali sufficientemente regolari esiste una ed una sola curva integrale passante per un punto $P_0$. Inoltre gli insiemi di livello di un integrale primo sono invarianti rispetto al flusso $\Phi_X^t$ del campo $X$. Quindi se la dinamica inizia in un insieme di livello ci rimarrà! Ecco l’idea dietro la procedura di riduzione d’ordine del campo vettoriale, tramite la presenza di integrali primi.

Solo per completezza, ci tengo a dirti che se fossi interessato a rappresentare graficamente con il cosiddetto ritratto di fase la dinamica di questa tipologia di sistemi meccanici conservativi, la presenza di questo integrale primo dell’energia è davvero utile e magari ne parleremo meglio in un articolo in futuro.

Riferimenti per studiare questi argomenti

Sono consapevole di aver buttato lì molti, forse troppi, concetti in questo articolo. Ma ho voluto gettare le basi di alcuni importanti elementi della teoria dei sistemi dinamici per invogliarti magari ad approfondirli in autonomia. Per aiutarti nell’approfondimento, quindi ti allego qui sotto alcuni riferimenti davvero interessanti e ben fatti. Un misto tra dispense universitarie e libri di testo.

Mi sento di dirti che questi 3 approfondimenti sono in ordine crescente di difficoltà, vedi un po’ tu cosa si presta meglio al tuo attuale livello di conoscenza in questo settore e se hai riferimenti di qualità da suggerirmi, fammeli sapere nei commenti che li aggiungerò senz’altro 😉

Trasformata di Fourier : cos’è e come viene utilizzata

Un suono è un’unione di note esatte, di suoni perfetti e semplici. Ma è possibile sapere da che note elementari è composto un generico suono? E’ possibile scomporre un rumore, un segnale nelle onde elementari che lo compongono? Sì, e uno strumento che ci permette di procedere verso quest’obiettivo è la trasformata di Fourier.

Prima di passare a delle formalizzazioni matematiche, voglio provare a farti intuire direttamente le caratteristiche principali di questo potente strumento con un analogia molto semplice 😉

La trasformata di Fourier e il minestrone

Di sicuro hai già mangiato, almeno una volta e magari controvoglia, il minestrone. Questo piatto non è che un miscuglio di varia verdura ed eventualmente cereali, che si amalgamano in un gusto più o meno omogeneo e nel quale è difficile distinguere esattamente tutti i sapori. Ma cosa c’entra il minestrone con la trasformata di Fourier? Non c’è fretta, ci arriviamo subito con queste semplici domande.

Cosa fa la trasformata di Fourier?

Dato un minestrone ne trova gli ingredienti.

Come fa?

Fa passare il minestrone da dei filtri di “dimensioni” diverse, così da separare tutti i suoi ingredienti.

Perchè?

Le ricette sono più semplici da analizzare, comparare e modificare rispetto a dei minestroni già pronti.

Come possiamo ottenere di nuovo il minestrone?

Frullando insieme tutti gli ingredienti appena separati.

Le domande qui sopra possono sembrarti assurde e completamente sganciate da ogni concetto matematico, ma ti assicuro che quanto descritto fino ad ora ci aiuterà (parecchio) nel proseguire l’analisi della trasformata di Fourier.

Prima di avanzare nella spiegazione, ci tengo a precisare alcuni dettagli sul minestrone che saremo in grado di analizzare con questo nuovo strumento matematico.

Innanzitutto è abbastanza evidente che per procedere alla sua filtrazione e separazione completa, è necessaria una serie di tutti i possibili “passini” (o filtri). Dobbiamo essere in grado potenzialmente di individuare qualsiasi ingrediente, infatti è chiaro che non saremo mai in grado di separare i fagioli dal resto se non abbiamo il filtro per i fagioli.

Inoltre i filtri devono poter agire in maniera indipendente, infatti le carote NON devono influenzare il buon funzionamento del filtro delle patate. Per concludere, con questi filtri siamo in grado di analizzare dei minestroni particolari, in cui l’ordine con cui componiamo gli ingredienti non porta a risultati differenti. Ovvero la ricetta non dipende dall’ordine con cui aggiungiamo i vari componenti.

Bene, fatta questa premessa (riassunta nell’immagine qui sotto), passiamo ad una descrizione matematica della trasformata di Fourier 😉

Introduzione matematica alla trasformata di Fourier

Ora smettiamo di parlare di cucina e iniziamo a parlare di funzioni 😉 Il nostro minestrone è infatti una funzione, una composizione di molteplici onde elementari.

Le due immagini qui sopra sono la rappresentazione di quanto detto fino ad ora. In particolare la funzione/segnale (il minestrone) in analisi è rappresentata nella prima figura ed è $f(x)=\sin(x)+\sin(2x)+\sin(3x)$, mentre la sua scomposizione negli “ingredienti” elementari è rappresentata nella seconda figura. In particolare i suoi elementi fondanti sono $\sin(x),\sin(2x),\sin(3x)$, che sono tre onde elementari a frequenze differenti.

La trasformata di Fourier, più o meno direttamente, è in grado di fornire questa scomposizione in “ingredienti” elementari di un generico segnale in input.

Ma vediamo in concreto come possiamo definirla matematicamente, direi che le premesse sono ormai sufficienti 😉 La definiamo solo per funzioni appartenenti ad un particolare spazio metrico, la teoria da sviluppare altrimenti sarebbe ben più ampia.

Definizione 1 (Funzione a quadrato sommabile)

Si dice che una funzione $f(x)$ di una sola variabile reale, a valori reali, è a quadrato sommabile su un preciso intervallo $I=[a,b]$ se vale la seguente:

\[ \int_a^b |f(x)|^2\,dx\;<+\infty\,,\]

in tal caso si può scrivere $f\in\,L^2(I)$.

La trasformata di Fourier, per una funzione a quadrato sommabile, è una funzione $\mathcal{F} : L^2(\mathbb{R})\rightarrow L^2(\mathbb{R})$, ecco una definizione operativa:

Definizione 2 (Trasformata di Fourier)

Data una funzione $f\in\,L^2(\mathbb{R})$, si dice trasformata di Fourier di $f$ la seguente:

\[ \mathcal{F}\{f\}(t) = \hat{f}(t) = \,\int_\mathbb{R} f(x)\,e^{-2\pi i x}dx,\;\forall\,t\in\mathbb{R}.\]

Nel caso tu sia già a conoscenza dello sviluppo in serie di Fourier, qui di seguito riporto il procedimento che evidenzia l’origine della trasformata a partire da questo sviluppo 😉

Data una funzione $f\in \,L^2([-T,T])$, ne posso definire i coefficienti dello sviluppo in serie di Fourier come segue: \[a_n=\frac{2}{T}\int_{-T}^{T} \cos\left(\frac{2\pi n}{2T}x\right)f(x)dx,\qquad b_n=\frac{2}{T}\int_{-T}^{T} \sin\left(\frac{2\pi n}{2T}x\right)f(x)dx.\]

Definiamo ora

\[ c_n = a_n – ib_n = \frac{1}{2T}\int_{-T}^{T} \left(cos\left(\frac{2\pi n}{2T}x\right)-i\sin\left(\frac{2\pi n}{2T}x\right)\right)f(x)dx =\]\[ = \frac{1}{2T}\int_{-T}^{T} \left(cos\left(-\frac{2\pi n}{2T}x\right)+i\sin\left(-\frac{2\pi n}{2T}x\right)\right)f(x)dx =\]\[=  \frac{1}{2T}\int_{-T}^{T} e^{-i\frac{2\pi n}{2T}x}f(x)dx \] e detto $t_n=\frac{n}{2T}$, si ha \[c(t_n) = \frac{1}{2T}\int_{-T}^{T} e^{-2\pi i t_n x}f(x)dx. \]

Ora l’ultimo step per arrivare ad ottenere la trasformata di Fourier è pensare di passare al limite per $T\to + \infty$. Per preservare le informazioni che questo sviluppo in serie mi fornisce, posso pensare di rimuovere il coefficiente $1/2T$ che altrimenti farebbe tendere il tutto a 0. Ottengo quindi \[c(t) = \int_\mathbb{R} e^{-i2\pi t x}f(x)dx.\]

Ma pensiamo un attimo a cosa stiamo facendo passando al limite, così da renderci conto che effettivamente il tutto rispecchia l’analogia del minestrone 😉 . Il limite ci porta a considerare la funzione reale in tutto il suo dominio (chiaramente se è definita su un sottoinsieme di $\mathbb{R}$ non ha senso definire la trasformatasu tutto $\mathbb{R}$). In questo modo codifichiamo tutti i valori assunti dalla funzione.

Codifichiamo?! In che senso?

Trasformazione nello spazio delle frequenze

Ecco, questo non l’avevo ancora specificato…immagino ti sia già chiesto il perchè questo operatore matematico sia chiamato TRASFORMATA e non integrale o in altro modo. In effetti un senso dietro  a questa scelta c’è, infatti tale operatore trasforma delle informazioni appartenenti ad un dato dominio, quello dei reali, in informazioni in un secondo spazio, quello delle frequenze.

E’ proprio questo l’obiettivo della trasformata: trasformare le informazioni di un segnale dallo spazio reale allo spazio delle frequenze. Infatti il parametro $t$ che abbiamo utilizzato nella costruzione matematica precedente è proprio da intendersi come una frequenza!

E’ probabile che queste ultime righe ti siano poco chiare, un po’ per colpa mia (non è facile semplificare un concetto avanzato come questo), un po’ perchè va metabolizzato con calma. Ma vediamo di consolidare il tutto con un paio di grafici 😉

       

In questo esempio sono rappresentate a sinistra la funzione $f(x)=e^{-4x^2}$ e a destra la sua trasformata. Vediamo intanto i calcoli che ho fatto per trovarla 😉

\[\hat{f}(t) = \int_\mathbb{R} e^{-2\pi i x t}e^{-4x^2}dx = \int_\mathbb{R} e^{-2\pi i x t-4x^2}dx=e^{-\frac{\pi^2t^2}{4}}\int_\mathbb{R} e^{-(2x+\frac{\pi it}{2})^2}dx \] e sostituendo $s=2x+\frac{\pi it}{2}$ si ha $ds = 2dx$ e quindi $dx=ds/2$. Ottengo così \[ e^{-\frac{\pi^2t^2}{4}}\frac{1}{2}\int_\mathbb{R} e^{-s^2}ds = \frac{\sqrt{\pi}}{2}e^{-\frac{\pi^2t^2}{4}} \]

Benissimo, ma a cosa ci serve trovare la codifica (ordinata) del segnale reale nello spazio delle frequenze? Eh, qui arriva il bello 😉 Immagina di andare ad uno spettacolo all’aperto e di dover registrare l’audio. Inevitabilmente registrerai del rumore che è fastidioso quando lo si riascolta. Bene, la trasformata di Fourier aiuta a rimuoverlo 😉

Infatti il rumore supponiamo corrisponda a delle alte frequenze acustiche. A questo punto ti basta codificare i segnali che hai raccolto, nello spazio delle frequenze e semplicemente tagliare da un certo punto in poi il tuo grafico.

In questo caso mi sono immaginato di voler rimuovere dal segnale da cui siamo partiti, $f(x)=e^{-4x^2}$, le frequenze di intensità superiore ai 0.6 Hz (gli Hertz sono l’unità di misura delle frequenze, 1 Hertz = 1 / 1 secondo). Allora ho rimosso, nello spazio delle frequenze, tutto ciò che è evidenziato in blu nell’immagine qui sopra. Al posto di tale parte della curva, posso sostituire una funzione costantemente uguale a 0.

Quindi, intuitivamente, più $f$ è regolare e priva di oscillazioni, più la sua trasformata $\hat{f}$ sarà concentrata attorno all’asse delle ordinate, nello spazio delle frequenze.

Se stai seguendo bene il filo del discorso, sono certo che ti sia sorta la seguente domanda: Ma cosa me ne faccio del segnale “pulito” dal rumore se lo conosco solo nello spazio delle frequenze? C’è un modo per tornare nello spazio “reale” e potermi sentire il suono ripulito dal rumore?

Certo che c’è! Si chiama formula di inversione per la trasformata di Fourier 😉

Vediamo però prima di introdurla un risultato interessante che ci avvicina alla formula che ci interessa:

Se $\hat{f}\in L^2(\mathbb{R})$, e lo sarà sempre nel caso $\f\in L^2(\mathbb{R})$, allora $\mathcal{F}: L^2(\mathbb{R})\rightarrow L^2(\mathbb{R})$ è invertibile e vale \[\hat{\hat{f}}=f(-x).\]

La dimostrazione di questo risultato non è nulla di troppo complicato ma preferisco evitare di riportarla per non appesantire ulteriormente questo articolo. Se ti interessa fammelo sapere che magari ti indirizzo verso qualche risorsa ben fatta 😉

Ah, giusto come curiosità, vale anche il seguente:

\[ \hat{\hat{\hat{\hat{f}}}} = f. \]

Ora penso ti sia abbastanza chiara quale sia la formula dell’inversa $\mathcal{F}^{-1}$, comunque eccola qui:

\[ \mathcal{F}^{-1}\{\hat{f}(t)\} = f(x) = \int_\mathbb{R} e^{-2\pi i (-x) t}\hat{f}(t)dt = \int_\mathbb{R}e^{2\pi i x t}\hat{f}(t)dt.\]

Ecco quindi che ci siamo 🙂 Una volta ripulito il segnale audio raccolto allo spettacolo, abbiamo ormai capito che possiamo riconvertirlo nel segnale reale e ascoltarci lo spettacolo senza fastidiosi rumori. Interessante, no?! Chiaramente quanto visto fino ad ora non è nulla di approfondito, ma secondo me è utile per capire le potenzialità che ha questo strumento matematico e, almeno in via intuitiva, come può aiutarci ad analizzare dei segnali.

A questo punto si potrebbe proseguire in due direzioni:

  1. Elencare le innumerevoli proprietà matematiche della trasformata di Fourier con relativi esempi
  2. Guardare oltre la matematica e parlare un po’ di come può essere utile questo strumento nella realtà.

Per questo articolo ho deciso però di lasciarle entrambe in sospeso e dedicare un articolo ad ognuna di esse in futuro. Mi sembra che abbiamo già fatto un bel percorso con le precedenti righe, partendo da un minestrone siamo passati a ripulire un segnale acustico 😉 Niente male, no?!

Se ti interessa la tematica e hai qualche aspetto che ti interessa maggiormente approfondire fammelo sapere nei commenti. Comunque fra non molto pubblicherò i successivi due articoli, giusto il tempo di riorganizzare le idee e trovare un modo per presentarle.

Se intanto hai la curiosità di approfondire in autonomia questa tematica, ecco alcuni link che di sicuro ti aiuteranno:

  • Trasformata di Fourier per l’ingegneria: LIBRO
  • La trasformata di Fourier è una figata: ARTICOLO
  • La trasformata di Fourier – Uniroma: PDF
  • La trasformata di Fourier – Proprietà ed esempi: PDF
  • An Interactive Guide To The Fourier Transform: ARTICOLO

Con ciò ti saluto, ci sentiamo al prossimo articolo 🙂

Rovina del giocatore: sbancherai o perderai tutto?

Immagina di essere in un casinò con 100€ in tasca. Prendi parte ad un semplice gioco in cui ad ogni partita puoi vincere 1€ o perdere 1€. Decidi di smettere di giocare quando andrai in profitto di 5€. Tu vinci quando esce una carta di picche dal mazzo (52 carte da poker), il banco vince quando esce qualsiasi altra carta.

Sapresti calcolare la probabilità che tu finisca la partita perché hai guadagnato effettivamente 5€? Mentre quella di terminarla perché sei senza soldi? In quanto tempo mediamente si conclude una partita? Queste probabilità varierebbero di molto se tu fossi entrato nel casinò con 1000€?

Queste e molte altre domande sono caratteristiche di un particolare problema spesso definito significativamente come rovina del giocatore . Esso è un caso particolare di una classe di processi stocastici ben più ampia, è infatti una passeggiata aleatoria su un insieme degli stati finito, con barriere assorbenti. Comunque, non fissiamoci troppo su questi concetti per il momento, l’importante è che l’ambientazione ti sia chiara, in caso non lo fosse rileggiti il problema all’inizio prima di proseguire 😉

Formalizzazione matematica del problema

Fino a questo punto, il problema immagino ti sembri interessante ma difficile da “attaccare” (o almeno per me è stato così). Le carte in gioco sono effettivamente parecchie, quindi un po’ di formalizzazione matematica non può che aiutare 😉

Diciamo $a=100€$ il capitale iniziale da cui parti con le tue giocate, esso è meglio definibile come stato iniziale del processo stocastico di rovina del giocatore.

Definiamo quindi $b=5€$ il capitale del banco, così da far corrispondere la casistica in cui tu (giocatore) sbanchi a quella di rovina del banco.

Possiamo definire ora il nostro problema come una passeggiata aleatoria sull’insieme finito ${0,1,2,…,a+b}$ con ${0}$ e ${a+b}$ stati assorbenti.

Capisco che di queste ultime righe tu possa non aver chiare molte cose, vediamo quindi di introdurre un minimo di nozioni teoriche, così da poter proseguire agevolmente nella trattazione del problema 😉

Assumiamo di valutare l’evolversi del gioco in termini del numero di partite fatte (piuttosto che del tempo trascorso tra la prima giocata e l’ultima), risulterà in questo modo più gestibile e facile da descrivere la sua evoluzione.

Definiamo stato della processo la quantità di denaro che il giocatore possiede in un determinato istante. Nel nostro particolare processo, diciamo stato ogni numero naturale che sta tra lo 0 e $a+b$.

Due stati $s_1$, $s_2$ si dicono comunicanti se, tramite un certo numero di transizioni, è possibile passare dal primo, $s_1$ al secondo, $s_2$.

Diciamo invece due stati direttamente comunicanti se tale transizione può avvenire in un singolo step (quindi giocando una sola partita).

Vediamo di spiegare meglio questi due ultimi concetti concentrandoci sul nostro problema particolare 😉

Nel contesto della rovina del giocatore, ad ogni partita io posso semplicemente guadagnare 1€ o perderne uno. Quindi ogni stato, che non sia ${0}$ o ${a+b}$, comunica direttamente solo con il precedente ed il successivo.

Con chi comunicano invece queste due eccezioni? Beh, se valutiamo il problema realistico, risulta evidente che essi non comunichino con alcuno stato (né direttamente, né dopo un qualsiasi numero di iterazioni), infatti dopo che il giocatore raggiunge 0€ o $a+b€$, il gioco terminerà. Diremo tali stati assorbenti proprio per questa ragione.

Risulta altrettanto intuitivo dire che ogni stato, che non sia ${0}$ e ${a+b}$, comunica indirettamente con tutti gli altri stati ${0,…,a+b}$. Infatti qualsiasi sia il mio capitale attuale, potrei vincere o perdere abbastanza partite per arrivare ad avere un qualsiasi altro capitale, semplice no? 😉

Per concludere questa parte di terminologia, diciamo transitorio uno stato nel quale il processo torna un numero finito di volte, ossia si ha probabilità maggiore di 0 di non tornarvi in tempo finito. Diciamo ricorrente uno stato visitato infinite volte dal processo, ossia nel quale si ha la certezza di ritornavi in tempo finito dopo averlo abbandonato.

Nel nostro caso particolare, gli stati ${0}$ e ${a+b}$ essendo assorbenti, sono anche ricorrenti infatti ho la certezza di ritornarvi in tempo finito una volta raggiunti (banalmente non mi muovo più da quegli stati appena li raggiungo).

Intuitivamente, tutti gli altri stati sono transitori, infatti comunicano con degli stati (${0}$ e ${a+b}$) che non sono comunicanti con quello di partenza. Sono destinato a non tornare nello stato iniziale quindi con probabilità maggiore di 0.

Una volta formalizzato leggermente il problema, possiamo divertirci ad analizzarne meglio alcune domande, senza dover appesantire troppo il linguaggio utilizzato.

Con che probabilità concludo il gioco perché senza soldi?

Detto tutto ciò e affiancandolo alla più immediata comprensione della situazione concreta, è abbastanza chiaro che il gioco prima o poi finisca. Per dimostrare quanto appena detto servirebbe un po’ di teoria in più, ma ci facciamo bastare l’intuizione e la seguente idea:

Se il gioco potesse durare all’infinito, dovrei visitare almeno qualche stato infinite volte. Ma siccome tutti gli stati tranne 2 sono transitori, questi li visiterò solamente un numero finito di volte. Segue che starò “infinito tempo” in uno dei due stati ricorrenti ${0}$ o ${a+b}$. La partita quindi si concluderà certamente in tempo finito 😉

E’ quindi banale chiedersi la probabilità di concludere la partita, questa sarà unitaria. Non è però per niente banale chiedersi quale sia la probabilità di perdere tutti i soldi, o equivalentemente di essere assorbiti nello stato ${0}$.

Per calcolare tale probabilità di assorbimento, anche detta di rovina del giocatore, si possono impostare delle equazioni di ricorrenza da cui ricavare delle forme esplicite per le probabilità.

L’obiettivo dei seguenti conti, sintetizzati per necessità di chiarezza, è quello di arrivare a fornire una formula esplicita per valutare la probabilità di essere assorbiti nello stato ${0}$ partendo dallo stato ${S}$. O più semplicemente, la probabilità di perdere tutti i soldi partendo con $S€$.

Prima di passare alle equazioni, vediamo la notazione che useremo:

La probabilità di perdere tutti i soldi partendo da un capitale di $I€$ al tempo 0 è:

$ P(X_n=0 \mid X_{0}=I)=P_I$

Indichiamo inoltre con $ q = P(X_{n+1}=i-1 | X_{n} = i) $ la probabilità di perdere la partita (quindi 1€) e con $ p = P(X_{n+1}=i+1 | X_{n}=i)$ la probabilità di vincere la partita.

Se non fosse chiaro, preferisco specificare che con $ X_{n}=i $ indicheremo che dopo $n$ partite (o al tempo se ti risulta più intuitivo), ho in tasca $i€$.

L’equazione di riferimento che svilupperemo per trovare la formula esplicita della probabilità di rovina del giocatore è la seguente:

$ P_{i} = qP_{i-1} + pP_{i+1}$ che, intuitivamente, dice che la probabilità di perdere il gioco è uguale alla probabilità di vincere una partita e poi essere assorbiti in 0 dal nuovo stato raggiunto, a cui sommiamo la probabilità di perdere una partita ed essere assorbiti in 0 da questo nuovo stato. Per comodità, d’ora in poi ci riferiremo questa equazione con il simbolo (#).

L’equazione (#), può essere scritta così per ogni stato diverso da ${0}$ e ${a+b}$, le quali hanno delle equazioni più semplici e particolari:

$P_{0}=1 $ dato che essendo già nello stato 0, ho la certezza di rimanervi, mentre $P_{a+b}=0 $ dato che la partita si conclude con la rovina del banco e non essendoci più nulla da vincere, il gioco si conclude e io non posso perdere arrivando nello stato ${0}$.

Per comodità, nei prossimi calcoli indicheremo con $m=a+b $.

Ora, l’idea per sviluppare questo sistema di equazioni di ricorrenza, è di porre in relazione uno stato con il precedente nel seguente modo:

Sappiamo che $p+q=1$ infatti ad ogni partita ho la certezza di vincere o di perdere, non può accadere altrimenti. Quindi posso manipolare (#) come segue:

$P_{i}=(p+q)P_{i} $ e raccogliendo opportunamente $q$ a sinistra dell’uguale e $p$ alla sua destra in (#) segue che \[q (P_i – P_{i-1}) = p (P_{i+1} – P_i) \].

Ora, sviluppando tale equazione per il primo stato si ricava che $q(P_{0}-P_{1}) = p(P_{1}-P_{2})$, ovvero che $P_{1}-P_{2} = q/p (P_{0}-P_{1}) $.

Iterando tale relazione, si vede che $P_{i}-P_{i+1} = (q/p)^{i}(P_{0}-P_{1}) $. Questa equazione la chiameremo (*).

Infine, si esegue una somma a destra e sinistra sugli $i\in{0,1,2,..,m-1}$ per ricavare \[P_{0}-P_{m} =  \sum_0^{m-1} (q/p)^{i}  (P_{0}-P_{1})\] e quindi \[P_0-P_{1} = \frac{1}{\sum_0^{m-1} (q/p)^{i}}.\]

Ecco che finalmente, sommando in (*) per $i\in {j,j+1,..,m-1}$ otteniamo la formula finale \[P_j = \sum_{i=j}^{m-1} (q/p)^i (P_0-P_1)=\frac{\sum_{i=j}^{m-1} (q/p)^i}{\sum_{i=0}^{m-1} (q/p)^i }.\]

Qual è la probabilità di sbancare?

Ora che abbiamo fatto il “lavoro sporco” per trovare quale sia la probabilità di terminare il gioco senza soldi, abbiamo anche la possibilità di valutare quale sia la probabilità di vincere tutti i soldi del banco! 😉

Notando infatti che il gioco termina certamente (cosa non scontata per tutti i giochi), sappiamo che le possibilità sono due, ovvero esso termina perchè sono senza soldi o perchè ho sbancato. Possiamo quindi ricavare la probabilità di sbancare come segue:

$1 = P($ finisco senza soldi $\cup$ sbanco$) = P($finisco senza soldi$) + P($sbanco$)$, questo perché i due eventi sono incompatibili, ovvero non esiste alcuna casistica in cui io sbanco e perdo contemporaneamente (eventi ad intersezione nulla).

Quindi detta $P(X_{n}=m | X_{0}=i) = Q_{i}$ la probabilità di sbancare partendo da $i€$, ho la validità della seguente relazione: $Q_{i} = 1 – P_{i} $ e ciò è vero per ogni stato $i$ 😉

Analisi di un caso particolare del problema

Finora abbiamo ottenuto molti risultati davvero interessanti, ma se magari non avevi mai visto nulla relativo a questa classe di problematiche di matematica applicata, potresti avere un po’ di confusione in testa. Vediamo quindi di fare qualche conto più pratico sul problema, ponendoci in un caso molto particolare 🙂

Supponiamo che il gioco a cui stiamo partecipando sia testa o croce e la moneta con cui stiamo giocando è equilibrata, ossia $ p=q=1/2 $.

Risulta quindi chiaro che si semplificherà il tutto, infatti $\frac{p}{q}=1 $ e quindi tutte le sommatorie che comparivano in precedenza non diventano che delle semplici somme algebriche tra due numeri.

Infatti \[\sum_0^{m-1} (q/p)^{i} = m,\] molto semplice, no?! 😉

Mentre se tronchiamo la somma e la facciamo da $j$ a $m-1$ otterremo che tale sommatoria è semplicemente $m-j$.

Stai iniziando ad intravedere dove voglio portarti?

Beh, è abbastanza chiaro, infatti la formula esplicita che abbiamo ricavato prima, e che poteva sembrarti di difficile lettura, diventa molto più concisa e ricca di significato:

$P_{i} = {(m-i)} / {m} $ è la probabilità di essere assorbiti nello 0, partendo dallo stato i, sapendo che ad ogni partita si perde/vince con la stessa probabilità.

Per quanto visto prima, la probabilità di sbancare è

$Q_{i} = 1 – P_{i} = \frac{i}{m} $. Quindi in questo modo stiamo praticamente dicendo che più sono vicino allo 0, più è alta la mia probabilità di perdere il gioco, mentre più sono vicino alla m, più è alta la mia probabilità di vincere. Per vicinanza intendiamo una vicinanza relativa, rispetto alla “lunghezza” totale della mia possibile passeggiata aleatoria 😉

Ecco quindi che abbiamo risposto parzialmente ad un’altra delle domande iniziali, se avessi un capitale iniziale più alto e il rapporto tra esso e il capitale totale è superiore, allora ho più probabilità di sbancare.

Conclusione

Direi che con ciò abbiamo sviscerato parecchi aspetti di questo problema, seppur ce ne siano ancora un’infinità che non abbiamo nemmeno toccato. Se ti interessa l’analisi di questa tipologia di problemi, faccelo sapere che qualcos’altro da condividere lo troviamo sicuramente 😉

La catenaria: una curva ricca di proprietà e che piace alla natura

Catenaria? Che cos’è?! Un insetto? Beh, in realtà è una curva che conosci molto bene e di sicuro ti è capitato più di una volta di scambiare per una parabola. Quando prendi da due estremità una corda con peso uniformemente distribuito, generi proprio una catenaria. Oppure anche quando vedi le catene a penzoloni attaccate a dei paletti vedi delle catenarie, ma anche i ponticelli di legno si dispongono in quel modo. Questa curva geometrica è anche utilizzata in arte ed architettura perché gode di proprietà di stabilità molto interessanti, che  vedremo nei prossimi paragrafi. 

Ti sembrerà strano ma nonostante la catenaria sia una curva poco nota ai più, essa è davvero ovunque e nelle prossime righe cercherò di illustrarti in breve la sua storia con alcune applicazioni e proprietà.

Studiare matematica a volte può risultare noioso. Uno stratagemma che secondo me funziona con chiunque per capire ed interessarsi a ciò che si studia è partire da degli esempi e da delle cose osservabili concretamente nel mondo in cui viviamo (ne ho parlato anche nell’articolo COME STUDIARE LA MATEMATICA). Studiare le proprietà e l’equazione della catenaria è quindi per me un ottimo modo per introdursi alla geometria differenziale delle curve e scoprire come la matematica sia sempre intorno a noi senza che ce ne rendiamo conto.

Un po’ di storia della catenaria

Lo studio della catenaria non è da farsi risalire a tempi molto antichi, almeno a quanto sappiamo. Il primo ad interessarsene fu Galileo Galilei nel 1638. Lui però la confuse con la parabola, infatti si convinse che la forma di una corda appesa per i suoi due estremi sotto la sola forza di gravità, fosse una parabola.

Ecco quello che Salviati afferma nella Seconda giornata del dialogo Discorsi e
dimostrazioni intorno a due nuove scienze (Ecco il link del libro di Galilei : LIBRO):

Salviati: …Ferminsi ad alto due chiodi in un parete, equidistanti all’orizonte e tra di loro lontani il doppio della larghezza del rettangolo su ‘l quale vogliamo notare la semiparabola, e da questi due chiodi penda una catenella sottile, e tanto lunga che la sua sacca si stenda quanta è la lunghezza del prisma: questa catenella si piega in figura parabolica, sì che andando punteggiando sopra ‘l muro la strada che vi fa essa catenella, aremo descritta un’intera parabola, la quale con un  perpendicolo, che penda dal mezo di quei due chiodi, si dividerà in parti eguali….

Il primo a dimostrare che tale curva non fosse una parabola è Joachim Jungius nel 1669. Tale risultato fu affermato e rafforzato dai fratelli Bernoulli, Huygens e Leibniz che nel 1691 dimostrarono anche che tale curva non fosse algebrica (in caso di dubbi si veda: “Curve algebriche: Nozioni di base“) e fu battezzata catenaria da Huygens.

Questa curva e talvolta chiamata funicolare velaria e fu studiata anche da Eulero che nel 1744 dimostrò che la sua rotazione attorno all’asse $x$ del piano cartesiano genera una superficie minima, chiamata catenoide.

Equazione della catenaria e alcuni risultati interessanti

Sulla storia di questa strana curva ci si potrebbe dilungare ancora molto, ma il mio interesse in questo articolo è quello di concentrarci sulle proprietà più caratteristiche e sugli esempi che possiamo trovare tranquillamente uscendo di casa.

La catenaria è una curva trascendente (si veda: Curve trascendenti ) che ammette la seguente equazione:

$y=a \cosh(\frac{x}{a}) = a\big (\frac{\mathrm{e}^{x/a}+\mathrm{e}^{-x/a}}{2}\big)$

dove $a$ è una costante che rappresenta la distanza del punto più basso con il “terreno”. Dall’equazione si nota che la curva non dipende dalla distanza dei punti a cui è appesa la fune. Inoltre la curva è simmetrica rispetto all´asse $y$.

Ruote quadrate

Un problema interessante che coinvolge la geometria e le equazioni differenziali è il problema della ruota quadrata. La domanda è: Quale dovrebbe essere la forma della strada per far si che una ruota quadrata rotoli/scorra regolarmente?

[divider style=”0″]

             

[divider style=”0″]

Si può dimostrare che nel caso di ruote poligonali, la strada deve essere composta da catenarie ribaltate collegate tra loro. Se vuoi vedere come mostrare tale risultato anche solo per il caso di ruote quadrate puoi guardare lo svolgimento dell’esame di maturità (seconda prova) del liceo scientifico un paio di anni fa : PROBLEMA RUOTA QUADRATA. Per un analisi più generale del problema si veda: Roads and Wheels.

Catenaria e trattrice

La curva trattrice, qui sopra raffigurata, gode di una proprietà essenziale: la lunghezza della tangente tra la stessa e l’asse x rimane costante per qualsiasi punto. Bene, una volta introdotta questa particolare curva, vediamo al volo il legame che c’è tra essa e la catenaria 😉

Nella geometria differenziale delle curve, si dice involuta ( o anche evolvente) una curva ottenuta da un’altra curva data seguendo questa procedura:

Si incolla una ipotetica striscia non allungabile ad un punto della curva data. Poi si tira il suo estremo libero e si fa aderire alla curva data la rimanente parte della striscia.

Nel caso della catenaria, l’estremo libero va ad individuare una metà della  curva trattrice se ne si disegna l’involuta 🙂 Legame strano ma interessante, no?!

Dove trovare la catenaria in natura?

Come già detto per i frattali in un precedente articolo (Frattali in natura), anche la catenaria è molto presente in natura, nell’arte, in architettura e molti altri ambiti, soprattutto grazie alle sue proprietà caratteristiche.

Lasciamo quindi ora le proprietà puramente geometriche viste nella precedente sezione per parlare della curva catenaria in natura e nei suoi molteplici utilizzi.

Catenoide e bolle di sapone

Come già citato prima, la rotazione della catenaria attorno all’asse delle ascisse, genera una superficie minima detta catenoide. Tale risultato, oltre che mediante il calcolo differenziale, è mostrabile come nella figura qui in alto mediante le bolle di sapone. Esse tendono ad occupare meno spazio possibile distribuendosi su superfici minime, soprattutto a causa della tensione superficiale. Su questo tema ci sarebbe davvero molto da dire, ma di sicuro dedicherò un apposito articolo all’argomento più avanti.

Per ora ti basti notare che immergendo due strutture a forma circolare (uguale) nell’acqua e sapone si genera proprio il catenoide, che è quindi superficie minima 😉

Archi e catenarie rovesciate

Numerose sono le applicazioni in vari ambiti dell’architettura. La catenaria ha la proprietà di avere in ogni suo punto una distribuzione uniforme del suo peso totale. Essa è stata quindi spesso utilizzata per realizzare manufatti e strutture architettoniche. Le strutture realizzate secondo tale curva subiscono soltanto sforzi a trazione, come le funi di sostegno nei ponti sospesi, oppure, in alternativa, a compressione, quando la struttura realizzata ha la forma di una catenaria rovesciata, come nelle strutture di cupole. (Fonte : https://goo.gl/VRNxBQ ) Ne sono un esempio la cupola della cattedrale di St. Paul a Londra e la Sagrada Familia a Barcellona.

                 

Anche molti ponti sono stati costruiti sulla base della struttura della catenaria, come il famoso ponte di Santa Trinità a Firenze . Infine citiamo il famoso Gateway Arch

dell’architetto finlandese Saarinen, posto nel parco del Jefferson National Expansion Memorial.

Gateway Arch – Catenaria

Ponte santa trinità – Catenaria

Catenaria e gravità

          

Il termine CATENARIA deriva del Latino catenaria ed è per definizione “la curva che descrive la forma di una catena flessibile appesa o di un cavo priva/o di pesi aggiuntivi o esterni”. Tutti i cavi appesi liberi da altri pesi o striscie di materiali vari assumono questa forma. Il requisito affichè essa si formi è che la massa del corpo deve essere distribuita uniformemente nella lunghezza del corpo, ovvero esso deve avere densità uniforme. Inoltre il corpo (cavo o catena che sia) deve essere soggetto alla sola forza di gravità.

Conclusione

La catenaria, come molte altre curve che vedremo magari in futuro, è un esempio lampante di come l’analisi matematica della realtà non sia una perdita di tempo ma piuttosto un mezzo in grado di concederci nuovi e più avanzati strumenti e conoscenze. Spero di averti quantomeno incuriosito e interessato, ho appositamente cercato di usare anche più immagini e contenuti visuali possibili 😉

Se vuoi proseguire nell’approfondimento, qui sotto trovi i contenuti che ho usato per comporre questo articolo e alcune risorse per studiare qualcosa in più, sono sicuro che ti divertirai!

Bibliografia e approfondimenti

Lectures on minimal surfaces in $\mathbb{R}^3$ : PDF

La catenaria – Progetto matematica : ARTICOLO

Mathematics and technology: LIBRO

The catenary – Mathematics all around us : VIDEO 

Una non parabola – La catenaria : PDF

Hyperbolic Functions: Catenary: Formula and Proof : VIDEO

The Catenary: Art, Architecture, History, and Mathematics : PDF

Catenary: Wikipedia

Catenary: Wolfram  MathWorld

Teoria del caos: Introduzione e primi esempi

La teoria del caos è la scienza delle sorprese, dei fenomeni non lineari e imprevedibili. Ci insegna ad aspettarci l’inaspettabile. Mentre la scienza tradizionale ha a che fare con fenomeni supposti prevedibili come la gravità, l’elettricità, o le reazioni chimiche, la teoria del caos tratta situazioni non lineari che sono effettivamente impossibili da prevedere o controllare, come la turbolenza, il tempo meteorologico, il mercato delle azioni e molto altro.

La parola caos deriva dal latino chaos, e indirettamente dal greco χάος (che contiene la stessa base χα- dei verbi χαίνωχάσκω «essere aperto, spalancato»). In matematica e in fisica, pur mantenendo un collegamento metaforico con il suo significato ordinario, il termine ha assunto un’importanza crescente, specialmente nello studio dei sistemi complessi: si dice che un sistema tende al caos quando le sue leggi di evoluzione comportano, dopo un certo caratteristico intervallo di tempo, comportamenti del tutto imprevedibili (senza sapere con esattezza le condizioni iniziali del sistema) e irregolari, mancando qualsiasi forma di correlazione tra stati successivi.

Caos non è Caso

La teoria del caos è un campo di studi relativamente recente e spesso frainteso nell’uso comune.Siamo abituati ad usare la parola caos abbastanza di frequente, chiaramente non con significato matematico. Tuttavia questa varietà di significati porta talvolta a fraintendere il termine nel campo matematico. Ti sarà capitato più volte di dire “La mia scrivania è un caos” volendo dire che “Nella mia scrivania ci sono tante cose messe a caso” o qualcosa di simile. In matematica però Caos e Caso sono due termini che si discostano, e di molto!

Le dinamiche caotiche non hanno necessariamente un carattere casuale/probabilistico nascosto. In questi sistemi se conosciamo l’ESATTA posizione attuale o iniziale, possiamo trarre tutte le informazioni che desideriamo sull’evoluzione futura della dinamica. Il problema non è quindi la casualità della dinamica o della posizione attuale, il problema è alla radice: conoscere la condizione esatta dalla quale il sistema inizia ad evolvere. Nel caso di dinamiche semplici (o meglio, non caotiche), anche conoscendo la condizione iniziale in maniera approssimativa, si possono comunque trarre delle rilevanti considerazioni sull’evoluzione della dinamica. Infatti in questi casi abbiamo una dipendenza continua della dinamica dai dati iniziali, ovvero almeno localmente se partiamo sufficientemente vicini alla condizione iniziale di riferimento, otterremo un comportamento dinamico simile. Nel caso di sistemi dinamici caotici, invece, nel tempo il comportamento relativo a condizioni iniziali approssimativamente simili a quella di nostro interesse sono COMPLETAMENTE IRRILEVANTI.

Come puoi vedere dai due esempi che ho fatto qui sopra, nel sistema caotico può essere che anche se ti avvicini arbitrariamente bene alla condizione iniziale con traiettoria rossa, ottieni sempre dinamiche completamente diverse oppure che variano completamente dopo un certo tempo, il quale non dipende però minimamente con la distanza tra le condizioni iniziali. Mentre nel caso della prima immagine, ovvero dinamica non caotica, hai sempre un certo tempo $T>0$ tale che per $0<t<T$ la distanza tra le due traiettorie è controllata dalla distanza dei punti iniziali. Inoltre la cosa importante è che in questo caso il tempo $T$ è strettamente legato alla distanza tra le due condizioni iniziali, più queste sono vicine, più le due traiettorie saranno simili a lungo, ovvero $T$ sarà grande.

Giusto per fare chiarezza, comunque nella seconda immagine le due traiettorie che ho disegnato non sono soggette al caso, sono loro certamente, sono traiettorie deterministiche 😉

Prima di proseguire ti consiglio un ottimo libro divulgativo se vuoi approfondire questi temi, è stato scritto da Ian Stewart e se intitola Dio gioca a dadi? La nuova matematica del caos, ti assicuro che vale la pena leggerlo 😉

Ecco perché spesso si coinvolge il termine caos deterministico. Partendo da un problema apparentemente semplice, il moto di tre corpi che interagiscono tra loro attraverso la forza di gravità (che tratteremo approfonditamente in un seguente articolo), Poincaré arrivò a descrivere in modo chiaro il fenomeno del caos deterministico, scrivendo nel 1903:

Una causa piccolissima che sfugga alla nostra attenzione determina un effetto considerevole che non possiamo mancare di vedere, e allora diciamo che l’effetto è dovuto al caso. Se conoscessimo esattamente le leggi della natura e la situazione dell’universo all’istante iniziale, potremmo prevedere esattamente la situazione dello stesso universo in un istante successivo. Ma se pure accadesse che le leggi naturali non avessero più alcun segreto per noi, anche in tal caso potremmo conoscere la situazione iniziale solo approssimativamente. Se questo ci permettesse di prevedere la situazione successiva con la stessa approssimazione, non ci occorrerebbe di più e dovremmo dire che il fenomeno è stato previsto. Ma non è sempre così; può accadere che piccole differenze nelle condizioni iniziali ne producano di grandissime nei fenomeni finali. Un piccolo errore nelle prime produce un errore enorme nei secondi. La previsione diviene impossibile

Poincaré

Ah dimenticavo, il primo contributo sostanziale alla teoria del caos fu fornito da Henri Poincaré, su cui ho di recente scritto un articolo biografico in cui analizzo anche i suoi principali riconoscimenti e contributi alla ricerca, lo puoi trovare qui: Henri Poincaré – L’ultimo universalista.

Immagine trovata su un video Youtube: https://www.youtube.com/watch?v=GDp8w19WGUo

Si parla quindi di determinismo nel senso che se sapessimo esattamente il nostro punto di partenza avremmo la certezza della dinamica evolutiva che lo caratterizza, mentre di caos per sottolineare la forte sensibilità ai dati iniziali e all’impossibilità di approssimarli per trarre informazioni rilevanti per la dinamica in analisi.

La teoria del caos ha come oggetto di interesse i sistemi dinamici, ma non tutti. La particolarità dei sistemi che seguono un comportamento caotico è la loro forte sensibilità ai dati iniziali. Ovvero sistemi in cui partendo da due situazioni iniziali di poco diverse, si verifica un’evoluzione nel tempo COMPLETAMENTE diversa.

Per non lasciare troppe idee astratte vagare nell’aria, iniziamo subito con un esempio chiaro da un punto di vista visivo, ma non per questo di semplice analisi matematica (la cui trattazione rimando a un articolo/video futuro), il PENDOLO DOPPIO.

Pendolo doppio – un classico esempio di teoria del caos

Il pendolo lo conosci giusto? Ci sono varie modalità per costruire un pendolo, tutte più o meno vicine alla situazione ideale che di solito si studia sui libri. In quest’ultima si suppone la totale assenza di attrito con l’aria solitamente. Si considera in particolare un punto materiale (massa supposta concentrato in un punto nello spazio) vincolato ad una corda/asta rigida e lasciato muoversi partendo da una condizione inziale, la cui altezza non verrà raggiunta periodicamente ma mai superata.

Se vuoi studiare qualcosina sul pendolo semplice ho scritto un articolo qui sul Blog a riguardo, potrai trovare un’analisi dell’equazione che ne regola la dinamica, il disegno del ritratto di fase e qualche considerazione finale a seguito di questo grafico, in pieno stile sistemi dinamici e analisi qualitativa 😉 , eccolo qui: Pendolo semplice.

Per complicare questo sistema dinamico ci si può muovere in varie direzioni, si può analizzare un pendolo 3-dimensionale in cui la particella non è vincolata a muoversi in sole due direzioni (si veda Pendolo di Foucault) o considerare un pendolo forzato da agenti esterni (si veda Oscillatore armonico forzato), oppure si possono analizzare situazioni a queste simili. Quella che però ci interessa per i nostri scopi è il pendolo doppio.

Questo oggetto si costruisce semplicemente vincolando un’altra asta rigida/corda al punto materiale del pendolo semplice. Ancorando all’estremità di questo nuovo “braccio” una nuova massa puntiforme. Avrai già intuito che in questo prolungamento si può giocare sulla lunghezza del braccio, sulla variazione della massa e così via per ottenere i comportamenti più strani. Però forse non immagini che in realtà non serve nemmeno giocare troppo per ottenere un comportamento strano, caotico in particolare.

Prima di analizzare un attimo l’evoluzione, ti consiglio di guardarti questo video per farti un’idea del fenomeno 😉

Già qui nel video è interessante vedere la particolare evoluzione della dinamica. Ma di per sé non è evidente alcun comportamento caotico in questo video, il caos lo si vede sensibilmente confrontando l’evoluzione di due dinamiche che partono da condizioni iniziali molto vicine. La dinamica in questi due casi (simili inizialmente) è completamente diversa all’avanzare del tempo. Guarda qua per fartene un’idea 😉

Non posso negarti di aver guardato il video 3-4 volte, è davvero spettacolare come fenomeno ma soprattutto contro intuitivo. Noi siamo abituati a pensare a dipendenze continue dai dati iniziali, siamo abituati a pensare che oggetti che seguono le stesse leggi e partono vicini, rimarranno vicini. Il che è esattamente il contrario rispetto al pendolo doppio!

Il fenomeno della caoticità è molto ampio e si può approfondirlo sotto vari aspetti ma per non mettere troppa carne al fuoco chiudiamo l’articolo con un esempietto semplce e numerico di dinamica caotica, per poi salutarci 🙂 .  Intanto spero che l’esempio appena fatto e il confronto tra caos e caso ti siano chiari. In caso di qualsiasi dubbio puoi contattarmi a list@mathone.it oppure lascia pure un commento qui sotto 😉

Un semplice esempio di teoria del caos con la calcolatrice

Prova a calcolare più volte consecutive, sulla tua calcolatrice $f(x) = 2x^2-1$ partendo da due $x$ iniziali molto simili, per esempio $x_1 = 0.54322$ e $x_2 = 0.54321$ e vedrai che dopo una cinquantina di iterazioni otterrai cose completamente diverse. Ecco un esempio molto semplice di caos in una mappa iterativa discreta. Perchè questa differenza? Prova un po’ a pensarci 😉

Ti ricordo che se ti piace guardare video, Mathone ha anche un canale Youtube, lo puoi trovare qui: CANALE

Fonti e approfondimenti

Dio gioca a dadi?  La nuova matematica del caos

La fisica del caos. Dall’effetto farfalla ai frattali

What is Chaos theory?

Sistemi dinamici e caos deterministico

Sistemi Dinamici Caotici – Liceo Locarno

Teoria del caos.pdf – Studio Legale Masciarelli

Teorema dei quattro colori: storia, colorazioni di grafi e applicazioni

Il Teorema dei quattro colori è indubbiamente uno dei più famosi ed affinascinati
teoremi della Teoria dei Grafi. In questo articolo vediamo come è nato questo problema
ed i vari risultati che hanno portato alla dimostrazione del teorema, senza
ovviamente tralasciare il legame con le colorazioni di grafi, molto importanti anche
in virtù delle loro applicazioni. Se invece di leggerti l’articolo preferissi scaricarti il PDF e guardarlo con calma, lo puoi scaricare qui: Teorema quattro colori PDF.

Questo articolo è stato gentilmente scritto da Anita Pasotti,  Prof. Associato presso l’Università degli Studi di Brescia (Dipartimento DICATAM – Sezione di Matematica). Per informazioni, questa è la sua pagina :

 

http://anita-pasotti.unibs.it/

Teorema dei quattro colori. Data una qualsiasi carta geografica politica è
possibile colorare stati adiacenti con colori distinti utilizzando al più quattro colori.

Ad esempio in Figura 1 la cartina degli Stati Uniti d’America è stata colorata
usando esattamente quattro colori. Bisogna precisare che ogni stato deve essere
connesso e che per stati adiacenti si intendono due stati con almeno un segmento
di confine in comune e non solo un punto.

FIGURA 1. Colorazione Stati Uniti d’America

L’origine del problema risale al 1852 quando Francis Guthrie, studente di De
Morgan, colorando la cartina della contee britanniche in modo che stati adiacenti
avessero colori distinti si accorse che erano sufficienti quattro colori. Non riuscendo
a trovare una carta che richiedesse più di quattro colori, Francis iniziò a chiedersi se
fosse vero che OGNI mappa potesse essere colorata utilizzando solo quattro colori.
De Morgan propose la congettura alla London Mathematical Society chiedendo se
qualcuno fosse in grado di risolverla. Moltissimi matematici dedicarono anni della
loro vita allo studio di questo problema. Nonostante per molti anni nessuno riuscì
a provare la congettura, i vari tentativi portarono non solo a molti risultati inerenti
alle colorazioni di grafi, ma contribuirono anche allo sviluppo di altre aree
della Teoria dei Grafi.

La prima pubblicazione inerente all’argomento è di Cayley che nell’articolo “On the colouring of maps” del 1879 spiegò le difficoltà incontrate nel cercare di risolvere tale congettura. Nello stesso anno Alfred Bray Kempe, un avvocato londinese che studiò matematica a Cambridge sotto la guida di Cayley, pubblicò una dimostrazione della congettura che venne riconosciuta valida per ben undici anni, fino a quando, nel 1890, Percy John Heawood, un docente universitario della Durham England, vi trovò un errore. Nel lavoro “Map colouring theorem”, Heawood non solo confutò la dimostrazione di Kempe, ma dimostrò il Teorema dei cinque colori che afferma che ogni mappa può essere colorata usando al più cinque colori. L’errata dimostrazione di Kempe ebbe comunque un importante valore poichè per ottenerla introdusse le cosiddette catene di Kempe che sono state poi utilizzate nella dimostrazione definitiva del teorema.

 

Negli anni a seguire sono stati ottenuti vari risultati parziali da molti matematici. Heesch, ad esempio, sviluppò i concetti di riducibilità e di scaricamento, che si rivelarono essere indispensabili per l’ultima dimostrazione. E’ doveroso osservare che mentre l’idea di riducibilità era già stata studiata da altri ricercatori, quella dello scaricamento è dovuta interamente a Heesch, il quale riteneva che un adeguato sviluppo di questo metodo avrebbe portato alla soluzione del problema.

Ciò fu confermato nel 1977 quando Kenneth Appel e Wolfgang Haken, due matematici dell’Università dell’Illinois, pubblicarono la loro dimostrazione del Teorema dei quattro colori [1], [2]. Questa dimostrazione si basa sulla riduzione del numero infinito di mappe possibili ad un numero finito di configurazioni (per l’esattezza 1476) per le quali la validità del teorema viene verificata caso per caso grazie ad un complesso algoritmo informatico che utilizza proprio le catene di Kempe.

Fondamentale fu l’aiuto di Koch, uno studente di informatica, che migliorò man mano il programma. Il programma definitivo aveva avuto ben 500 variazioni da quello originario e fu eseguito su due macchine diverse con algoritmi indipendenti al fine di ridurre al minimo la possibilità di errore. Per analizzare tutti i casi possibili i computer impiegarono circa 50 giorni e servirono più di 500 pagine per trascrivere a mano tutte le verifiche che costituivano la dimostrazione.

L’utilizzo di algoritmi informatici nella dimostrazione di Appel e Haken scatenò grandi polemiche nel mondo scientifico, tanto che alcuni matematici ne contestarono la validità non solo per l’impossibilità di verifica manuale, ma anche perchè la logica afferma che è impossibile dimostrare la correttezza dell’algoritmo.

Fino ad oggi nell’algoritmo non è stato trovato alcun errore, ad ogni modo anche se
ne viene accettata la validità, la dimostrazione non è di certo considerata elegante a
tal punto da essere stata paragonata ad un elenco telefonico. Nel 1997 N. Robertson,
D.P. Sanders, P.D. Seymour e R. Thomas [5] proposero una dimostrazione al
computer che consiste in una riduzione del numero di configurazioni da 1476 a 633,
ma anche la loro dimostrazione non è verificabile manualmente. Infine, nel 2000,
Ashay Dharwadker [6] propose una nuova dimostrazione del teorema che richiede
l’utilizzo della Teoria dei Gruppi.

 

Abbiamo quindi visto come un problema apparentemente così semplice sia stato
in realtà irrisolto per più di un secolo. Vediamo ora come esso possa essere formulato
in termini di colorazioni di grafi. Per fare ciò ci servono alcune nozioni
di base [3]. Un grafo $G$ è una coppia $(V, S)$ dove $V$ è un insieme di punti detti
vertici ed $S$ è un insieme di coppie non ordinate di punti detti spigoli. Sia
ad esempio $G$ il grafo rappresentato in Figura 2. Si ha $V (G) = \{0, 1, 2, 3, 4\}$ e
$S(G) = \{[0, 1], [0, 2], [0, 3], [1, 2], [2, 3], [3, 4]\}$. Due vertici si dicono adiacenti se c’è lo spigolo che li congiunge. Quindi, nel grafo in Figura 2 il vertice 0 è adiacente ai vertici 1, 2, 3, mentre il vertice 4 è adiacente solo al vertice 3.

 

FIGURA 2. Un esempio di grafo ed una sua 3-colorazione

 

Una colorazione di un grafo è una funzione che associa ad ogni vertice un colore in modo che vertici adiacenti abbiano colori distinti. Con c-colorazione si intende una colorazione che utilizza esattamente $c$ colori distinti. Si dice numero cromatico di un grafo $G$ il minimo $c$ per cui esiste una $c$-colorazione di $G$. Ad esempio il grafo in Figura 2 ha numero cromatico 3, a fianco abbiamo infatti una sua 3-colorazione ed è immediato osservare che una 2-colorazione non esiste.

Piccola parentesi esterna all’articolo originale. Se sei interessato/a ad approfondire la teoria introduttiva ai grafi, qui puoi trovare una bella playlist di video, sono davvero molto chiari 😉 , inoltre avevo scritto un articolo sul problema dei ponti di Konigsberg, lo puoi trovare qui: I 7 ponti di Konigsberg

Per enunciare il Teorema dei quattro colori in termini di colorazioni di grafi basta
osservare che ad ogni mappa geografica può essere associato un grafo nel seguente
modo. Rappresentiamo ogni stato della mappa con un punto in corrispondenza della
propria capitale e uniamo due punti se e solo se le capitali che essi rappresentano
corrispondono a stati adiacenti. In tal modo trasformiamo la carta in un grafo i cui
vertici sono le capitali mentre gli spigoli sono i segmenti congiungenti le capitali di
stati adiacenti. Si può dimostrare che il grafo che si ottiene in tal modo è sempre
planare, cioè si può disegnare in modo che i suoi spigoli si incontrino solo nei vertici.

Risulta quindi evidente che il Teorema dei quattro colori può essere enunciato
nel seguente modo: ogni grafo planare ammette una 4-colorazione.
Il filone delle colorazioni di grafi, che si è sviluppato ovviamente anche grazie
allo studio del problema dei quattro colori, ha svariate applicazioni concrete.

Ricordiamo, ad esempio, quella ai numerosi problemi di schedulazione [4]. In tutti
questi problemi si deve assegnare un dato insieme di compiti a degli spazi temporali,
ma alcune coppie di compiti sono in conflitto, cioè non possono essere assegnate
allo stesso spazio temporale. Per risolvere il problema si costruisce il grafo i cui
vertici rappresentano i compiti e due vertici sono adiacenti solo se rappresentano
una coppia di compiti in conflitto. Il numero cromatico del grafo è esattamente il
tempo ottimale per finire tutti i compiti senza conflitti. I dettagli del problema di
schedulazione definiscono la struttura del grafo, vediamo come tramite un esempio
concreto.

Consideriamo il problema di schedulazione del diario degli esami universitari:
Qual è il minimo numero di giorni necessario per far sostenere ad $n$ studenti
$m$ esami, in maniera tale che nessuno studente debba sostenere due esami lo stesso
giorno? Per rappresentare il problema consideriamo il grafo i cui vertici rappresentano
gli $m$ esami e due vertici sono adiacenti se c’è almeno uno studente che
deve sostenere entrambi gli esami rappresentati da quei due vertici. È immediato
vedere che il numero cromatico del grafo così ottenuto è proprio il minimo numero
di giorni necessari. Altri importanti problemi di schedulazione sono ad esempio
quello dell’assegnazione di aeromobili ai voli o quello dell’allocazione delle ampiezze
di banda alle stazioni radio.

Infine concludiamo osservando che anche molti problemi matematici ben noti,
sia ricreativi che non, possono essere formulati in termini di colorazioni di grafi.
Ad esempio il sudoku può essere visto come il completamento di una 9-colorazione
(ogni numero corrisponde ad un colore) di un assegnato grafo con 81 vertici (ogni
cella corrisponde ad un vertice).

Riferimenti bibliografici

[1] K. Appel e W. Haken, Every planar map is four colorable. Part I. Discharging, Illinois J. Math. 21 (1977), 429–490.
[2] K. Appel e W. Haken, Every planar map is four colorable. Part II. Reducibility, Illinois J. Math. 21 (1977), 491–567.
[3] F. Harary, Graph Theory, Addison-Wesley, Reading MA, 1969.
[4] D´aniel Marx, Graph colouring problems and their applications in scheduling, in Periodica Polytechnica, Electrical Engineering, 48 (2004), 11–16,
[5] N. Robertson, D. P. Sanders, P. D. Seymour e R. Thomas, The four-colour theorem, J. Combin. Theory Ser. B. 70 (1997), 2–44.
[6] A. Dharwadker, A New Proof of the Four Colour Theorem,
http://www.geocities.com/dharwadker/, 2000.