Archivi autore: Davide Murari

Fondamenti di teoria delle curve

Qualunque corso di base di geometria differenziale, inizia parlando di curve e superifici. Ho quindi pensato di iniziare questa serie di post che dedicherò alla geometria differenziale con un paio di articoli sulle curve e un altro paio sulle superfici.

Il mio intento è provare a spiegare i concetti fondamentali di quest’area della matematica, senza l’ambizione di essere esaustivo (per quello ci sono i libri di testo) ma con l’obiettivo di far arrivare l’intuzione dietro a concetti molto astratti quali quello di varietà. Cercherò di farlo tramite esempi e spiegazioni discorsive quando possibile.

Ovviamente ci saranno anche definizioni, enunciati e risultati matematici, però eviterò spesso di proporre le dimostrazioni (per le quali però darò delle referenze). In questo articolo e nel prossimo, dedicati alle curve, farò riferimento ad un libro per me davvero ottimo, ovvero l’Abate Tovena. Ti consiglio davvero di leggerne almeno i pezzi più importanti.

Ma veniamo quindi a questi due articoli…cosa esploreremo della teoria delle curve? Ho pensato di organizzarlo nei seguenti punti:

  • Definizione del concetto di curva
  • Cos’è la parametrizzazione con lunghezza d’arco
  • Cosa sono curvatura e torsione
  • Triedro di Frenet-Serret
  • Cos’è il grado di una curva
  • Cosa intendiamo per intorno tubolare di una curva

Cos’è una curva?

Iniziamo subito con la definizione, per poi passare a qualche esempio che di sicuro chiarirà il concetto.

Definizione (Curva parametrizzata) Una curva parametrizzata in $\mathbb{R}^n$ è una mappa $\sigma: I \rightarrow\mathbb{R}^n$, dove $I$ è un intervallo della retta reale. Diciamo $t\in I$ il parametro della curva, che definisce un punto (almeno) $\sigma(t)$ lungo quello che è chiamato sostegno della curva, ovvero l’immagine $\sigma(I)\subset\mathbb{R}^n$. Supposto $I=[a,b]$, diciamo $\sigma$ una curva chiusa se $\sigma(a)=\sigma(b)$.

In base a quante volte possiamo derivare la mappa $\sigma$, possiamo definire la regolarità della curva. Più precisamente, se la curva ammette le prime $k$ derivate continue, allora la curva sarà almeno di classe $C^k$.

Prima di sviscerare per bene la definizione, ci tengo a soffermarmi su una cosa importante ovvero

L’idea di curva che abbiamo di solito è di un sottoinsieme di $\mathbb{R}^n$, dato che se ti chiedono di disegnare una curva sul foglio vai a colpo sicuro. Però matematicamente è importante fare distinzione tra l’immagine in $\mathbb{R}^n$ della curva (ovvero quello che disegnamo), e la curva (parametrizzata) stessa.

Per fissare questo concetto, direi che è ora di vedere un esempio! Vediamo quindi due curve diverse, i cui sostegni però coincidono. Ovvero, in parole povere, i due disegni delle curve coincidono ma le loro parametrizzazioni no.

Esempio Consideriamo due curve $\sigma,\gamma : [0,2\pi]\rightarrow \mathbb{R}^2$ definite come segue:

  • $\sigma(t) = (\cos{t},\sin{t})$
  • $\gamma(t) = (\cos{(2t)}, \sin{(2t)})$.

Intanto vediamo che essendo entrambe le componenti di queste curve delle funzioni trigonometriche, queste curve possono essere derivabili infinite volte e quindi sono curve di classe $C^{\infty}$.

Probabilmente hai già visto queste curve e sai già come rappresentarle, però ho pensato di mostrarti un’animazione in cui è evidente come stiamo parametrizzando ciascuna curva:

https://www.mathone.it/wp-content/uploads/2021/05/SquareToCircle-1.mp4
Qui puoi vedere due punti che scorrono sulla circonferenza unitaria, uno alla velocità doppia dell’altro..ovvero nel tempo in cui un punto fa un singolo giro, l’altro ne fa 2, esattamente come descritto dalle parametrizzazioni viste sopra (il video è realizzato con Manim).

Non c’è molto da approfondire della definizione vista poco fa, se non il fatto che non necessariamente una curva è definita su un dominimo che è un aperto (intervallo) della retta reale. Per esempio, nel caso l’intervallo $I$ sia un insieme compatto (per esempio nel caso $I=[a,b]$) possiamo estendere la definizione della curva su un aperto che contiene tale insieme $I$ propriamente.

Una cosa molto interessante da precisare è che non necessariamente le curve che consideriamo sono iniettive. Un esempio di questa possibilità l’abbiamo visto con la parametrizzazione $\gamma$ vista sopra. Ciò significa che potremmo avere due punti distinti dell’intervallo $I$ che sono mandati nello stesso punto di $\mathbb{R}^n$. Un altro classico esempio è fornito dalla seguente curva:

$$ t\in\left(-\frac{\pi}{2},\frac{3}{2}\pi\right)\mapsto (\cos{t},\sin{t}\cos{t}) $$

Ciò significa, in particolare, che non tutte le curve parametrizzate devono essere rappresentate da un omeomorfismo dell’intervallo $I$ sul sostegno della curva, nel caso tu abbia già utilizzato questo concetto

Un altro classico esempio di curva che di sicuro avrai utilizzato in passato, è quello ottenibile dal grafico di una funzione. Supponi infatti di avere una funzione $f:I\rightarrow\mathbb{R}^{n-1}$ di classe $C^k$. Allora essa definirà il sostegno di una curva, altrettanto regolare, parametrizzata come segue $\sigma:I\rightarrow\mathbb{R}^n,$ $\sigma(t) = (t,f(t))$.

Prima di passare a vedere il concetto di parametrizzazione tramite lunghezza d’arco, direi che è molto interessante (anche da un punto di vista applicativo) parlare di riparametrizzazione di curve e di curve equivalenti.

Date due curve parametrizzate $\sigma: I \rightarrow\mathbb{R}^n$, $\sigma’:\tilde{I}\rightarrow \mathbb{R}^n$ di classe $C^k$, diciamo che esse sono equivalenti se esiste un diffeomorfismo (funzione differenziabile e invertible, con inversa differenziabile) $h:\tilde{I}\rightarrow I$ della stessa regolarità, tale che $\sigma’ = \sigma\circ h$. Si dice quindi che $\sigma’$ è una riparametrizzazione di $\sigma$.

Prima abbiamo per esempio visto la riparametrizzazione $t\rightarrow 2t$ per muoverci al doppio della velocità lungo la circonferenzia unitaria.

Questo esempio, è anche uno dei vari che potremmo fare per parlare di curve chiuse. Chiaramente le curve chiuse non sono iniettive. La nozione di curva chiusa è stata introdotta nella definizione all’inizio di questa sezione, ma non mi ci soffermo più di tanto dato che penso sia abbastanza intuitivo. Giusto per non trascurare nulla però, ecco un altro esempio di curva chiusa: $$ t\in [0,6\pi]\mapsto (1+\sin{t}, 3+3(\cos{t})^3) $$

Parametrizzazione rispetto alla lunghezza d’arco

Essendo che in tutta la serie di articoli che sto iniziando con questo parleremo di geometria differenziale, vogliamo almeno essere in grado di calcolare le derivate prime degli oggetti che introduciamo. Nel caso delle curve, parametrizzate da $\sigma(t)$, vogliamo quindi che la funzione sia almeno di classe $C^1$.

Un ottimo modo per vedere una curva parametrizzata e capire anche il senso della sua derivata, è quello di pensare in termini fisici. Infatti se noi ci riferiamo al parametro $t\in I$ come un tempo, possiamo dire che il sostegno della curva rappresenta la strada percorsa da una particella in $\mathbb{R}^n$ nell’intervallo temporale $I$.

Ogni particella, oltre ad una strada che percorre, è anche caratterizzata da una velocità con cui la percorre. In un qualche modo (complicato) abbiamo già visto il concetto di velocità di percorrenza di una curva quando abbiamo introdotto la nozione di curve equivalenti. Infatti in tal caso abbiamo detto che due curve sono equivalenti se hanno lo stesso sostegno, il quale è però "coperto" in tempi diversi, ovvero con velocità diverse.

La velocità di una particella, non è altro che la derivata temporale della sua traiettoria. Nel caso quindi di una curva parametrizzata $\sigma(t) = (\sigma_1(t),…,\sigma_n(t))$, possiamo calcolare la derivata che sarà ancora un vettore di $\mathbb{R}^n$ definito come $\dot{\sigma}(t) = (\dot{\sigma}_1(t), … ,\dot{\sigma}_n(t))$. Questa derivata, come siamo abituati a pensare per qualsiasi funzione $f$, geometricamente rappresenta il vettore tangente nel punto $\sigma(t)\in\mathbb{R}^n$ al sostegno della curva in $\sigma(t)$.

Vediamo quindi un esempio di curva parametrizzata con rispettivo calcolo e rappresentazione del vettore tangente. Consideriamo la curva $\sigma(t) = (t,\sin{t})$ con $t\in [0,2\pi]$. La sua derivata definisce il vettore tangente $\sigma’(t) = (1,\cos{t})$ ottenuto semplicemente derivando le singole componenti rispetto a $t$. Qui sotto puoi vedere la rappresentazione grafica di ciò che stiamo facendo:

Una definizione importante in questo contesto è quella di curva regolare.

Diciamo una curva $\sigma:I\rightarrow\mathbb{R}^n$ regolare se per ogni $t\in I$, si ha $\sigma’(t)\neq 0\in\mathbb{R}^n$.

Prima di vedere un esempio di curva non regolare, ci tengo a stressare il fatto che nel caso di curve derivanti dal grafico di una funzione $f$, non avremo mai punti non regolari, ovvero dove la velocità è zero. Infatti tutte le curve di questo tipo prendono la forma $\sigma(t) = (t,f(t))$ e quindi $\sigma’(t) = (1,f'(t))$ che è sempre diverso dal vettore nullo.

Ecco un semplice esempio di curva non regolare: $\sigma(t) = (t^2,t^3)$ con $t\in [0,1]$. Infatti qui abbiamo $\sigma’(t) = (2t,3t^2)$ che si azzera in $t=0$. Ecco qui il grafico di questa situazione:

Come puoi vedere, il vettore tangente continua ad allungarsi mano a mano che $t$ cresce, però coincide con il vettore nullo nel caso $t=0$.

Questo allungamento del vettore tangente, non è sempre una cosa desiderabile dato che ci impone di "portarci dietro" delle normalizzazioni per definire concetti quale curvatura o torsione della curva. Ecco quindi che entra in gioco la parametrizzazione rispetto alla lunghezza d’arco di cui volevo parlarti in questa sezione.

Una curva $\sigma$ di classe $C^k$, con $k\geq 1$, che è parametrizzata rispetto alla lunghezza d’arco ha $|\sigma’(t)|\equiv 1$.

Parleremo di curve parametrizzate rispetto alla lunghezza d’arco quando la velocità istantanea di queste è unitaria in termini di modulo. Ogni sostegno di una curva ammette una ed una sola parametrizzazione rispetto alla lunghezza d’arco. E’ abbastanza chiaro poi che nel caso di questa scelta della parametrizzazione, il vettore tangente non potrà mai annullarsi e quindi avremo sempre curve regolari.

Per tutte queste belle proprietà, spesso questa parametrizzazione viene chiamata parametrizzazione naturale. Per riferirci ad una curva parametrizzata in questo modo, invece di $t$ useremo il parametro $s$. Vediamo quindi un semplice esempio.

Consideriamo la curva $\sigma(t) = (r\cos{t},r\sin{t})$, con $t\in [0,2\pi]$. Essa chiaramente non ha vettore tangente in norma unitaria, quindi questa non è una parametrizzazione naturale della circonferenza unitaria. Cerchiamo quindi di ricavarla.

Per ricavare il parametro lunghezza d’arco di $\sigma$ possiamo ricorrere alla seguente definizione

Consideriamo una curva $\sigma:I\rightarrow\mathbb{R}^n$ di classe $C^k$ con $k\geq 1$. Fissato un $t_0\in I$, la lunghezza d’arco di $\sigma$ a partire da $t_0$ è la funzione $s:I\rightarrow \mathbb{R}$ data da $$ s(t) = \int_{t_0}^t |\sigma’(r)|dr. $$

Ciò ci porta a dire che una curva è parametrizzata rispetto alla lunghezza d’arco se e solo se $s(t) = t-t_0$, ovvero se a meno di traslazioni $t$ coincide con $s(t)$.

Torniamo quindi al nostro esempio. In questo caso $\sigma’(t) = (-r\sin{t},r\cos{t})$ e quindi $|\sigma’(t)|=r$. Possiamo quindi calcolare la lunghezza d’arco di questa curva tramite l’integrale visto poco fa, ovvero $$ s(t) = \int_{t_0}^t |\sigma’(r)|dr = r(t-t_0). $$ Questo implica che, scegliendo $t_0=0$, otterremo la lunghezza d’arco $s(t) = rt$.

Se quindi sostituiamo a $t$, la quantità $s/r$ nella parametrizzazione $\sigma(t) = (r\cos{t},r\sin{t})$ otterremo una curva parametrizzata rispetto alla lunghezza d’arco $s$ : $$\sigma(s/r) = \left(r\cos{\left(\frac{s}{r}\right)},r\sin{\left(\frac{s}{r}\right)}\right) = \tilde{\sigma}(s).$$ Se infatti calcoliamo la norma del vettore tangente a $\tilde{\sigma}$ otterremo $|\tilde{\sigma}'(s)|=\left(r^2\left(\frac{1}{r^2}\cos{(s/r)}^{2}+\frac{1}{r^2}\sin{(s/r)}^2\right)\right)^{1/2} = 1$.

Puoi divertirti ora a calcolare la parametrizzazione rispetto alla lunghezza d’arco di tutte le curve che abbiamo visto negli esempi sopra

Prima di passare alla prossima sezione, direi che è un buon momento per vedere un altro esempio molto interessante. Infatti di sicuro hai avuto modo di disegnare e studiare delle rette del piano o dello spazio. Queste sono curve tanto quanto quelle "che curvano" e abbiamo visto fino ad adesso. Ecco quindi brevemente quello che possiamo fare per parametrizzare una retta del piano e come trasformarla rispetto alla lunghezza d’arco. La retta che consideriamo è della forma $\sigma(t) = (t,mt+q)$, la cui derivata è $\dot{\sigma}(t) = (1,m)$. Intanto notiamo una cosa molto importante, ovvero che il vettore tangente che abbiamo trovato è costante, cosa che non è successa per nessuna delle curve precedenti.

La norma di tale vettore è costantemente uguale a $|\dot{\sigma}(t)| = \sqrt{1+m^2}$.

Abbiamo quindi visto che la lunghezza d’arco rispetto a $t_0=0$ è $s(t) = t\sqrt{1+m^2}$. Se sostituiamo $t = s/\sqrt{1+m^2}$ otteniamo la riparametrizzazione della retta rispetto alla lunghezza d’arco : $$ \sigma\left(\frac{s}{\sqrt{1+m^2}} \right) = \left(\frac{s}{\sqrt{1+m^2}},s\frac{m}{\sqrt{1+m^2}} + q \right). $$

Ottimo, ora siamo pronti per vedere in modo più chiaro cosa intendiamo con la frase la retta non è una curva che cuva mentre le altre che abbiamo visto sì. In particolare vedremo che una retta è una curva con curvatura zero.

Curvatura e torsione

Nel concludere la precedente sezione abbiamo realizzato che il vettore tangente ad una retta è costante e ciò si è verificato solo in quel caso. Possiamo quindi pensare ad una "curva che curva" come una curva il cui vettore tangente non è costante rispetto al parametro $t$ o $s$ nel caso della lunghezza d’arco.

Il vettore tangente a $\sigma(t)$, qualora essa sia una curva regolare e di classe almeno $C^1$, è sempre derivabile ed ha norma sempre maggiore di zero. Per cui possiamo tranquillamente anche definire una normalizzazione di questo vettore, semplicemente dividendo $\sigma’$ rispetto alla sua norma. Il motivo per cui vogliamo fare ciò, è che ci interessa parlare di come il vettore tangente varia lungo la curva, ma non ci interessano variazioni in norma, ma solo in direzione. E’ infatti intuitivo pensare a come una "curva curvi" parlando della variazione in direzione di tale vettore tangente.

Ecco quindi quello che possiamo chiamare versore tangente a $\sigma:I\rightarrow\mathbb{R}^n$ di classe $C^k$: $$ u(t) = \frac{\sigma’(t)}{|\sigma’(t)|}$$ che è una ben definita funzione da $I$ a $\mathbb{R}^n$ di classe $C^{k-1}$.

Una cosa importante da notare è che nel caso $\sigma$ sia parametrizzata rispetto alla lunghezza d’arco, abbiamo $|\sigma’(s)|\equiv 1$. In tal caso quindi abbiamo semplicemente $u(s) = \dot{\sigma}(s) = d\sigma(s)/ds$.

Ora abbiamo tutti gli strumenti per poter parlare di curvatura, semplicemente come norma della derivata del versore tangente. Infatti l’unico modo in cui può variare il versore tangente è in direzione, dato che la sua norma è fissata, quindi tale derivata misura effettivamente quanto la nostra curva $\sigma$ curva.

Definiamo quindi la curvatura di $\sigma$ come la funzione $k:I\rightarrow\mathbb{R}^+$ di classe $C^{k-2}$ data da $$ k(s) = |\dot{u}(s)| = |\ddot{\sigma}(s)|. $$ Introduciamo anche un’altra notazione, che ci verrà comoda anche per i ragionamenti futuri, ovvero quella di curva biregolare. Abbiamo visto che una curva è regolare se la sua derivata non si annulla mai, mentre è biregolare se la sua curvatura non è mai zero.

E’ quindi un ottimo momento per vedere qual è la curvatura della retta che abbiamo parametrizzato rispetto alla lunghezza d’arco prima, ovvero $$ \sigma(s) = \left(\frac{s}{\sqrt{1+m^2}},s\frac{m}{\sqrt{1+m^2}} + q \right). $$ La derivata è $$ \dot{\sigma}(s) = \left(\frac{1}{\sqrt{1+m^2}},\frac{m}{\sqrt{1+m^2}}\right) = u(s). $$ La curvatura è quindi la norma di $$ \ddot{\sigma}(s) = \left(0,0\right). $$ Ecco quindi "mostrato" che la curvatura di una retta è 0, come avevamo intuito in precedenza ma ora è più rigoroso.

Il perfetto esempio di "curva che curva" è una circonferenza, in tal caso vedremo che la curvatura è costante. La curvatura infatti ci fornisce un valore che è il reciproco di quello che chiamiamo raggio di curvatura. Data una curva $\sigma(s)$ ed un punto $\sigma(\bar{s})$ su essa, possiamo localmente vedere l’archetto nel sostegno intorno al punto $\sigma(\bar{s})$ come l’arco di una circonferenza, questa circonferenza avrà raggio pari a $1/k(\bar{s})$, ed è chiamato raggio di curvatura. Chiaramente tale raggio di curvatura è ben definito solo per curve biregolari, dato che dividiamo per la curvatura che deve essere diversa da zero. Nel caso di curvatura nulla, possiamo invece pensare ad un raggio di curvatura "infinito".

Per capire meglio il concetto ecco un paio di grafici legati alla curva $\sigma(s) = (\log{(s+\sqrt{1+s^2})}, \sqrt{1+s^2}) $ che dovrebbero aiutare:

Qui sopra abbiamo la circonferenza che nel punto $(0,1)$ è in grado di descrivere il modo in cui essa curva, che ha raggio $1 =1/k(0)$. Penso che con queste immagini sia parecchio chiaro cosa intendiamo per curvatura e raggio di curvatura, nel caso ciò non lo sia non farti problemi a scrivere un commento sotto all’articolo .

Oltre al versore tangente, possiamo anche definire un altro vettore molto importante per la curva $\sigma$, che è il versore normale. Intanto notiamo subito una cosa interessante, ovvero che la derivata del versore tangente $\dot{u}(s)$ è perpendicolare al vettore tangente $u(s)$ rispetto al prodotto scalare standard di $\mathbb{R}^n$. Infatti sappiamo che la norma di $u$ è costanetemente uguale a $1$ per costruzione, e quindi $u^T(s)u(s) \equiv 1$. Ciò implica che, se deriviamo entrambi i membri dell’equazione, otteniamo $\dot{u}^T(s)u(s) \equiv 0$, ovvero che $u(s)$ è ortogonale a $\dot{u}(s)$ per ogni $s$.

Possiamo quindi semplicemente normalizzare il vettore normale appena trovato e definire il versore normale alla curva nella posizione $s$. Esso è $n(s) = \dot{u}(s) /|\dot{u}(s)| = \dot{u}(s)/k(s)$. La curva $\sigma(s)$ localmente vive anche in un piano molto particolare, quello che è chiamato piano osculatore. Esso è quello definito dal vettore tangente e dal vettore normale appena definiti, ovvero $\sigma(s) + Span(n(s),u(s))$. Esso varia con $s$ ed è proprio questa variazione che ci permette di definire un altro concetto super importante per la teoria delle curve, ovvero quello di torsione.

Ah..prima di passare a parlare di torsione, ci tengo a dire che il versore normale e la curvatura sono calcolabili anche senza avere disponibile la parametrizzazione rispetto alla lunghezza d’arco, però ho deciso di non trattarla in questo articolo. Se però ti interessa, puoi per esempio andare a studiarti il lemma 1.3.10 del libro Abate Tovena.

Andando ad intuito, come definiresti una curva piana? Probabilmente ti verrà da pensare a delle curve nel piano cartesiano o, se hai un po’ più di esperienza in termini matematici, parlerai di curve in spazi di dimensione più alta ma che però sono contenuti in un singolo piano.

Avendo però appena introdotto cosa intendiamo per piano osculatore, possiamo quindi definire rigorosamente cosa intendiamo per curva piana:

Una curva piana è una curva per la quale il piano osculatore è costante per ogni $s$.

Tuttavia una curva è abbastanza chiaro che possa uscire da un piano, e quindi il piano osculatore torcersi. Per provare a chiarire l’idea, ecco qui un’immagine:

Chiaramente questa curva non sta tutta sullo stesso piano. Calcolare il piano osculatore di questa curva, di parametrizzazione $\sigma(t) = (\cos{t},\sin{t},t)$ passando per la lunghezza d’arco, sarebbe bello intricato e quindi evitiamo. Se però ti va di provare a farlo, ti consiglio di andarti a recuperare la formula menzionata prima (lemma 1.3.10 del libro).

Ora ci concentriamo sulle curve nello spazio $\mathbb{R}^3$. Una cosa molto interessante, è che un piano nello spazio $\mathbb{R}^3$ è unicamente identificato dal vettore normale ad esso. Ricordando quindi che il piano osculatore, nel quale la curva sta in un intorno di un suo punto, è definito dai versori tangente e normale, possiamo calcolare l’unico versore ad essi ortogonali. Questo definirà univocamente tale piano osculatore.

Tale vettore ha anche un nome, è infatti chiamato versore binormale. Esso è definito come $b = u\wedge n$ dove $\wedge$ definisce il prodotto vettoriale tra il versore tangente e il versore normale. Il motivo per cui esso abbia norma 1, e quindi possa essere chiamato versore, è che $u$ e $n$ sono ortogonali e $|b|= |u|\cdot|n|\cdot|\sin{\alpha}| = |u|\cdot|n| = 1$, dove $\alpha$ è l’angolo tra i due vettori, che in questo caso è $\pi/2$.

Tutto ciò ha anche una denominazione, infatti i versori tangente, normale e binormale sono particolarmente rilevanti per lo studio delle curve nello spazio, essi sono chiamati (insieme) triedro di Frenet-Serret associato alla curva $\{u(s),n(s),b(s)\}$.

A questo punto possiamo concludere la nostra discussione definendo cosa si intende per torsione e vedendo un modo semplice per caprie se una curva è piana. Diciamo infatti una curva biregolare piana, se il vettore binormale è sempre costante, infatti esso definisce il vettore ortogonale al piano osculatore. Se quindi lui non varia al variare di $s$, allora nemmeno il piano osculatore lo farà. Di conseguenza, anche il sostegno della curva sarà interamente contenuto in un piano.

Tutto quest’ultimo ragionamento ci porta al dire che il vettore binormale, e il modo in cui varia, è in grado di definire la torsione della curva. Per costruzione, il vettore binormale sarà ortogonale alla sua derivata rispetto ad $s$. Infatti ancora $b^T(s)b(s)\equiv 1$ e quindi $\dot{b}^T(s)b(s)\equiv 0$. Ciò implica che, essendo che ci stiamo riferendo a curve in $\mathbb{R}^3$, se un vettore è ortogonale a $b$, allora vive nel piano definito da $u(s)$ e $n(s)$, ovvero nel piano osculatore. Infatti $$\dot{b}(s) = \dot{u}(s)\wedge n(s) + u(s)\wedge \dot{n}(s) = u(s)\wedge \dot{n}(s) $$ visto che $\dot{u}(s)$ è parallelo a $n(s)$ (è solo la sua normalizzazione). Ciò ci porta anche a dire che $\dot{b}(s)$ è perpendicolare sia a $u(s)$ che a $\dot{n}(s)$, deve quindi essere un multiplo di $n(s)$.

Siamo finalmente pronti a parlare di torsione. Essa è la funzione $\tau:I\rightarrow\mathbb{R}$ di classe $C^{k-3}$, dove $\sigma\in C^k$, tale che $\dot{b}(s) = -\tau(s) n(s)$. Quindi la curva è piana se e solo se la curvatura $\tau(s)$ è identicamente nulla.

In questa trattazione fatta fino ad ora ho preferito dare spazio all’intuizione piuttosto che al ragionamento rigoroso, quindi in certi punti ho omesso requisiti di regolarità delle curve e funzioni utilizzate. Questo non perchè non siano importanti, tutt’altro, però per una comprensione iniziale ritengo sia più importante concentrarsi sul "big picture", dopo per capire meglio il tutto basta addentrarsi nei libri tecnici (come l’Abate Tovena. )

Potremmo dire dell’altro o fare più esempi, ma per ora direi che possiamo finire qui, ci leggiamo al prossimo articolo per proseguire con la discussione riguardo le curve .

Cosa si studia ad analisi 1?

Ecco alcuni punti chiave del video:

I principali argomenti trattati nel corso sono i seguenti.

  1. Numeri reali: perché ne abbiamo bisogno? Modelli dei numeri reali e definizione assiomatica. Assioma di completezza di $\mathbb{R}$, estremo superiore, inferiore e densità di $\mathbb{Q}$ in $\mathbb{R}$. Breve riassunto dei concetti topologici della retta reale, aperti, chiusi ecc..
  2. Definizione di limite e nozione di funzione continua. Descrizione dei punti di accumulazione, con altri teoremi fondamentali sui limiti (per esempio il teorema dei carabinieri) e sulla proprietà di continuità.
  3. Nozione di derivata, concetto di massimo e minimo, con teoremi annessi. Per esempio il teorema di Weierstrass. Calcolo delle derivate e relative proprietà.
  4. Teorema di espansione di Taylor, serie di Taylor e conseguenti tecniche per risolvere forme indeterminate nei limiti grazie a questi concetti. esempio $$e^x = 1 + x + \frac{x^2}{2!} + \frac{x^3}{3!} + … = \sum_{k=0}^{+\infty} \frac{x^k}{k!}$$
  5. Sviluppo del concetto di serie, somma infinita. Ci si concentra su particolari serie numeriche, si vede cosa si intende per convergenza di serie e vari criteri per valutare questa proprietà.
  6. Introduzione del concetto di integrale, con integrale superiore ed inferiore.  Descrizione delle varie proprietà, delle classi di funzioni integrabili e per esempio del teorema fondamentale del calcolo. Ci si concentra anche sugli integrali impropri (convergenza ecc..)
  7. Equazioni differenziali ordinarie e problemi di Cauchy. Ci si concentra su teoremi di esistenza e unicità, varie classi di ODE per esempio a variabili separabili, a coefficienti costanti del secondo ordine, o metodo di somiglianza –> l’idea è di arrivare a costruire delle soluzioni generali e integrali particolari di ODE. Cenni sullo studio qualitativo.

Libri suggeriti:

Analisi matematica 1 – Bramanti, Pagani, Salsa → https://amzn.to/3xGbgGZ

Analisi matematica (Vol. 1) – Giusti → https://amzn.to/3tgiOg1

Devo essere un genio per studiare matematica?

Beh, chiaramente deve essere un genio!

Ciao. Eccoci con un nuovo articolo. Oggi andremo a rispondere ad una domanda che mi è stata fatta parecchie volte e che ho trovato anche molto richiesta su Quora e altri siti.

La domanda è: “Per studiare matematica, devo essere un genio? Devo essere dotato in maniera innata? Devo essere nato con un quoziente intellettivo parecchio elevato? Oppure chiunque sostanzialmente può andare a studiarla?”.

Intanto, prima di proseguire la lettura, ti ricordo che se preferisci guardare video al leggere articoli, qui trovi la versione video dei contenuti che ho poi trascritto qui sotto :

Beh, l’affermazione con cui ho aperto l’articolo era abbastanza una provocazione chiaramente. Infatti, per quanto mi riguarda, per esperienza personale e per i miei amici che ho conosciuto nei 5 anni di università, non è necessario essere un genio per studiare matematica.

Le tre cose più importanti, per me, sono

  • la determinazione,
  • la passione e
  • l’interesse nel portare avanti questi studi.

E’ innegabile, chiaramente, che esistono persone dotate naturalmente, persone che arrivano prima alla soluzione dei problemi, persone che comprendono prima i risultati matematici della gran parte degli altri. Ovviamente loro sono avvantaggiati nel percorso universitario in matematica.

Però, andiamo un po’ a vedere qual è la definizione classica che puoi trovare su un qualunque dizionario del termine genio.

Solitamente si definisce genio una persona con una spiccata intelligenza, dove questa intelligenza che lo contraddistingue dagli altri, dalla massa, è un qualcosa di innato.

Ovviamente quindi, una persona che abbia questa dote naturale è avvantaggiata nella possibile carriera in quanto matematico o matematica e, in particolare, in quanto studente di questa disciplina.

Tuttavia, secondo me, questo non impedisce agli altri, con lo studio, il dovuto tempo e la fatica, di arrivare ad ottimi risultati. Funziona un po’ come negli sport, dove le capacità innate aiutano ma non sono tutto. Se uno è particolarmente dotato in termini fisici e di talento naturale nel giocare a basket, per esempio, è chiaro che abbia una marcia in più rispetto ad un ragazzo minuto e basetto.

E’ anche chiaro che, in termini probabilistici, questo abbia maggiori possibilità di arrivare in NBA rispetto alla seconda persona.

Però, se questo ragazzo dotato di natura non ci mette impegno, non ci mette dedizione e costanza andandosi ad allenare, andando alle partite e mettendoci la testa, difficilmente arriverà a competere con i grandi del basket.

Cosa diversa invece è se andiamo a vedere quale potrebbe essere la carriera dell’altro ragazzo, quello più minuto. Lui, magari, è molto appassionato, la natura non è dalla sua parte però è determinato, si allena costantemente, continua a migliorare giorno dopo giorno e, soprattutto, punta sul gioco di squadra. Ovvero, fa sue delle capacità che vanno a colmare le lacune che la natura purtroppo gli ha dato..

In parole povere, questo secondo ragazzo non si rassegna al fatto che ci sia qualcuno che è più forte di lui. Invece, continua a lavorare e, magari, un giorno può diventare un ottimo giocatore di serie B o magari anche in serie A .

Insomma, secondo me la cosa importante nello sport come nello studio della matematica, è il voler capire le cose, il voler capire come risolvere un problema e quindi l’essere determinati e costanti nello studio.

Ovviamente il parallelo che ho fatto con lo sport vale in modo limitato, è solo per dare un’idea. E’ evidente che la competizione sportiva non abbia alcun legame nella matematica, dato che il successo di una persona nel risolvere un problema non implica in nessun modo la sconfitta degli altri 😉 . Comunque, penso possa essere sufficientemente esplicativo.

Dai discorsi che ho fatto qui sopra, probabilmente capirai che io non ritengo un motivo valido per rinunciare all’iscrizione all’università di matematica la frase “ma io non vado bene in matematica alle superiori”.

Infatti, se comunque il tuo interesse verso la matematica è forte (intendo verso la matematica, non verso il saper fare i conti correttamente 😉 ), allora secondo me hai tutte le carte in regola per iscriverti e studiare matematica.

Questo era un breve articoletto in cui ho condiviso la mia idea riguardo questo tema. Mi farebbe ovviamente piacere leggere qui sotto nei commenti cosa ne pensi, o se hai qualsiasi suggerimento per nuovi video/articoli.

Con ciò ti saluto e ci leggiamo alla prossima, ciao!

principio del terzo escluso – Cos’e’ e qualche esempio

Ciao. Eccoci con un nuovo articolo. Oggi andremo a continuare la lista di terminologie matematiche spiegate brevemente. In questa sequenza di articoli/video ho previsto contenuti un po’ enciclopedici, in cui cerco di prendere quei termini/concetti che all’università vengono dati per scontati (e magari ti fai anche dei problemi a porre delle domande a riguardo perché pensi siano stupide).

Prima di proseguire, se preferisci guardare video alla lettura, qui trovi il video:

Oggi andremo a vedere che cosa si intende per principio del terzo escluso.Questo è un risultato molto semplice da capire. E’ un principio che è abbracciato in maniera molto aperta da gran parte dei rami della matematica. Vedremo poi però che ci sono anche dei matematici che non lo approvano, che non prendono in considerazione questo principio e sono chiamati matematici costruttivisti.

Il principio del terzo escluso si basa su un’idea molto semplice, o meglio evidenzia un’idea molto semplice: una proposizione matematica può essere o vera o falsa, non può esserci una terza possibilità.

Per esempio, quando sei davanti ad un numero naturale e affermi che è pari, ci sono solo 2 possibilità: hai ragione o hai torto. Infatti un numero naturale o è pari o non lo è, e in tal caso lo chiamiamo dispari. Però non può esserci una terza possibilità, ed ecco perché parliamo di “escludere il terzo”.

Questo è anche il principio che regola fondamentalmente la dimostrazione per assurdo. Infatti l’idea alla base di questa tecnica dimostrativa è di partire da un’assunzione (che solitamente è l’opposto di quello che vogliamo dimostrare) e poi, tramite dei ragionamenti logici e coerenti, arrivare ad una contraddizione.

Da ciò, possiamo dedurre che siccome partendo dall’assunzione di partenza, siamo arrivati ad una contraddizione, allora questa è errata. A questo punto entra a gamba tesa il principio del terzo escluso. Infatti, siccome non c’è alcuna possibilità oltre al fatto che un’assunzione sia errata o corretta, questa contraddizione vuol dire che abbiamo mostrato la validità della tesi.

Occhio però! Abbiamo mostrato la tesi non in modo costruttivo, ma l’abbiamo fatto escludendo l’altro caso possibile. Ecco dove arrivano i matematici costruttivisti, che si rifiutano di accettare risultati mostrati in questo modo e, più in generale, decidono di rinunciare completamente al principio del terzo escluso.

I matematici costruttivisti, vogliono mostrare tutti i risultati in modo costruttivo, ovvero concretamente partire dalle ipotesi e, logicamente, arrivare alla tesi.Detto ciò, magari non hai mai sentito parlare di questo principio, ma probabilmente avrai già utilizzato, magari senza accorgertene, tutti questi concetti di cui abbiamo parlato. Perché? Perché semplicemente è un principio molto ragionevole.

Noi infatti siamo abituati a dare per scontato che un concetto matematico sia o vero o falso. Chiaramente, nel mondo reale, nei problemi della vita concreta, ci sono delle verità opinabili, ci sono delle situazioni dove non c’è solo l’attributo di verità o falsità, e ci sono cose discutibili.

Però in questi casi si parla di “problemi” del linguaggio comune o di situazioni legate alle opinioni, ovvero tutte cose che in matematica non sono ben viste e presenti.

Con ciò spero di aver chiarito il principio del terzo escluso. Ti ricordo poi che se hai altri termini/concetti che ti interesserebbe che trattassi, puoi lasciare tranquillamente un commento qui sotto e proverò a trattarlo in altri video/articoli.

Con ciò ti saluto, e ci leggiamo al prossimo articolo 😉

Davide

Modello matematico: cos’e’ e a cosa serve?

Questo articolo è molto importante in quanto, visti un po’ i miei interessi, mi dedicherò particolarmente al mondo della matematica applicata e in questo settore il concetto di modello matematico è fondamentale.

Se alla lettura preferisci la visione di un video, puoi guardare la versione video di questo articolo qui:

In futuro probabilmente andremo ad analizzare qualche modello in particolare, come per esempio modelli per la diffusione di epidemie, per il trasporto del calore, per l’andamento del traffico o quant’altro… Quindi questa introduzione sarà fondamentale.

Cos’è un modello matematico?

Infatti, nelle scienze applicate e nel mondo fisico, i modelli matematici vengono utilizzati quotidianamente, soprattutto per dare una formalizzazione a quello che succede nella realtà e poter poi avere degli strumenti per capire cosa sta succedendo, cosa potrebbe succedere e perché.

Infatti, per modello matematico, intendiamo un insieme di relazioni e/o leggi matematiche in grado di catturare gran parte delle caratteristiche di un fenomeno e permetterci poi quindi di controllarne lo sviluppo, il cambiamento, l’andamento e poter trarre informazioni utili riguardo esso.

Da ciò segue naturalmente che il modello e la struttura matematica che si va a costruire è fondamentale che sia rilevante e coerente con il mondo fisico e l’applicazione a cui andiamo a riferirci.

Questo è un approccio molto diverso rispetto a quello tipico della matematica pura. Per esempio, nella congettura di Goldbach questo legame tra applicabilità del risultato e importanza dello stesso non è necessario da un punto di vista matematico. Se non sai cosa sia la congettura di Goldbach ecco un video in cui te la introduco:

Finché le leggi della matematica si riferiscono alla realtà, non sono certe, e finché sono certe, non si riferiscono alla realtà.

(Albert Einstein)

È importante specificare inoltre, che quando parliamo di scienze applicate non stiamo solo andandoci a riferire a quelle classiche, quelle a cui riusciamo a pensare più naturalmente in quanto legate alla matematica (come per esempio la fisica o la chimica), ma facciamo riferimento a molte altre scienze complesse tra le quali ricadono la medicina, la finanza, la biologia, l’ecologia e varie altre.

Proprietà ed elementi fondamentali dei modelli matematici

La modellazione matematica intesa come

  • costruzione di un modello matematico, a cui segue poi
  • una fase di analisi e implementazione numerica e
  • un confronto dei risultati ottenuti con la realtà )quindi tramite via sperimentale),

è ormai all’ordine del giorno. Precisamente, questi modelli matematici ormai si è capito che sono davvero fondamentali e ci permetteranno di capire fenomeni complessi in maniera più rigorosa, così da poter quindi prevedere i possibili esiti degli stessi.

Sostanzialmente, l’origine di un modello matematico può essere ridotta a due elementi fondamentali: il primo sono delle leggi generali, il secondo sono delle relazioni costitutive.

Quindi vediamo che cosa sono questi due mattoni della costruzione di un modello matematico. Partiamo dalle leggi generali. Queste sono di natura abbastanza teorica, quindi possono essere per esempio le leggi della meccanica e i principi di conservazione dell’energia o del momento angolare. Esse sono quindi delle relazioni fisiche oppure delle leggi di bilanciamento chimiche e quant’altro. L’importanza di queste leggi è che non sono specifiche del singolo modello, ma possono descrivere vari fenomeni.

Per quanto riguarda invece le relazioni costitutive, abbiamo qualcosa di carattere più sperimentale. Infatti, in questo caso si vanno per esempio a utilizzare delle peculiarità del fenomeno in analisi. Tramite via sperimentale, si vanno a introdurre delle particolari costanti, oppure si va a modellizzare una particolare funzione in conseguenza a qualche risultato ottenuto sul campo. Questo secondo mattone quindi è un qualcosa di strettamente legato al modello e non generalizzabile, differentemente per esempio dalle leggi della meccanica che valgono per vari fenomeni, varie applicazioni.

Alcuni esempi di leggi costitutive sono la legge di Fourier per il flusso di calore oppure ci sono molte altre leggi che ci permettono di decidere, per esempio, che forma dare a un flusso numerico oppure a un flusso in generale. Queste scelte le faremo chiaramente in base a quello che stiamo analizzando.

Il risultato della combinazione di questi due mattoni fondamentali di un modello matematico è solitamente descrivibile in forma sintetica tramite un’equazione o un sistema di equazioni, spesso differenziali alle derivate parziali.

Questa struttura complessa non è necessaria in ogni circostanza. Può benissimo esserci qualche modello, comunque interessante e utile per certi fenomeni, che non coinvolge nemmeno equazioni differenziali. Magari vedremo qualcosa riguardo questo tema.

Comunque spesso i modelli che si vanno a costruire per analizzare situazioni che evolvono nel tempo (o nello spazio), coinvolgono equazioni alle derivate parziali e in questo ambito ti consiglio (nel caso tu sia interessato a questi temi) di guardarti questo libro: Equazioni a derivate parziali: Metodi, modelli e applicazioni. Questo libro si concentra soprattutto sulla costruzione dei modelli e fornisce anche molti strumenti per analizzare questi modelli, vederne le proprietà e magari risolvere (nel caso sia possibile) anche le equazioni alle derivate parziali sottostanti. La risoluzione di queste equazioni non è sempre possibile e magari questo sarà argomento di altri video o articoli (un argomento legato a questo sono gli spazi di Hilbert, se ti interessa puoi capire di cosa si parla in questo articolo https://www.mathone.it/spazio-hilbert/).

Esiste un solo modello per ogni fenomeno?

Un’altra cosa importante da evidenziare, è che nel momento in cui andiamo a interessarci a un fenomeno legato a una delle scienze complesse, è quasi certo che il modello che possiamo andare a costruire non sia unico. È quindi importante chiedersi se il modello che andiamo a costruire vada bene o meno e bisogna essere in grado di capire se questo modello possa funzionare o meno.

Ecco che dobbiamo introdurre il concetto di problema ben posto:

Di modelli ce ne sono un’infinità, alcuni sono di semplice comprensione e interpretazione…altri non lo sono. C’è sempre margine per complicare le cose anche se è importante evidenziare il fatto che non è detto che un modello più complicato di un altro sia in grado di spiegare meglio un certo fenomeno. Spesso la sintesi è una grande qualità di un modello a volte. Non è infatti raro che sia premiata la disponibilità a sacrificare la capacità di prevedere un fenomeno a favore di rendere il modello un po’ più semplice. Il perché dietro a questo fatto è che, grazie a questa scelta, magari possiamo abbassare i tempi di calcolo o i costi computazionali per poter elaborare le informazioni. Da ciò segue che potremmo riuscire a trovare delle informazioni utili su una situazione concreta in tempi ragionevoli. La velocità può essere davvero utile.

Per esempio, nel campo dello studio delle epidemie, la velocità e la capacità di prevedere in fretta dove potrebbe diffondersi un’epidemia, oppure le tempistiche con cui intervenire con un certo farmaco a volte possono premiare più dell’avere una descrizione estremamente accurata e dettagliata della realtà. Chiudiamo quindi notando che spesso è utile ponderare precisione con velocità di elaborazione.

Se ti interessa vedere un modello per l’analisi delle epidemie, il modello SIR, davvero snello ma comunque efficace per descrivere il numero di infetti di un’epidemia, ti consiglio di guardare questo mio video:

La matematica nella vita quotidiana

Probabilità è il termine matematico che fa riferimento all’eventualità che qualcosa accada o non accada, come, per esempio, pescare un asso da un mazzo di carte o prendere una caramella rossa da una confezione con colori assortiti. 

La probabilità è un aspetto che influenza ogni giorno della vita delle persone, quando vengono prese decisioni che non si sa quali conseguenze porteranno con sé. Per esempio, utilizziamo la probabilità quotidianamente per prevedere il meteo. I meteorologi non possono predire con totale esattezza che tempo ci sarà, utilizzano strumenti ad hoc per determinare quali siano le probabilità che piova, nevichi o grandini. Se la possibilità di pioggia è data al 60%, significa che su 100 giorni con condizioni meteorologiche simili, in 60 ha effettivamente piovuto. E ognuno di noi, nel suo piccolo, deve decidere se uscire con un ombrello oppure no.

La probabilità permea anche le strategie sportive: un allenatore di baseball, per esempio, valuta la media in battuta di ciascun giocatore prima di farlo mettere in fila. Quando si pensa alle strategie e alla probabilità, però, l’esempio più calzante nonché il primo a venire in mente è sicuramente il poker.

La matematica e la probabilità nel poker

Spesso per descrivere la probabilità si usa l’esempio del lancio di una moneta: ci sono due possibili risultati – testa o croce. E la probabilità in entrambi i casi è del 50%. Quando si ragiona con un mazzo di carte, però, il numero dei risultati possibili cresce notevolmente. Ogni mazzo di carte da poker, nello specifico, ha 52 carte divise per 4 semi diversi (cuori, picche, quadri e fiori) e organizzate in una scala di 13 valori (i numeri da 1 a 10 e Jack, Regina e Re): questo significa che le probabilità di pescare un asso come prima carta sono 1 su 13 (7,7%), mentre quelle di pescare una qualsiasi carta di picche sono di 1 su 4 (25%).

A differenza delle monete, poi, si potrebbe dire che le carte da poker hanno una memoria: mentre le probabilità di ottenere testa o croce dopo aver lanciato una monetina rimangono sempre del 50% e 50%, dopoché si pesca un asso da un mazzo, le probabilità di pescare un altro subito dopo non rimangono fisse al 7,7% come quando nessuna carta era ancora stata presa. Questo perché dopo aver pescato un asso, ne rimangono solamente 3 nel mazzo, il che abbassa le probabilità di prenderne un altro al 5,9% (3 su 51). 

Quello dell’asso è un semplice esempio per comprendere quanto la probabilità influenzi le partite di poker. La probabilità è una variante che fluttua parecchio, pertanto i giocatori non possono affidarsi solamente alla fortuna: i campioni sanno che usare la matematica per vincere ai tavoli di poker è un aspetto importante, a cui vanno però imprescindibilmente associate le abilità, le conoscenze, la disciplina e la pazienza – i veri segreti del successo. Capire come funziona la probabilità e, soprattutto, imparare a calcolarla, tuttavia, è fondamentale per poter prendere le decisioni migliori durante ogni mano: avere una solida base matematica di calcolo della probabilità, infatti, aiuta ad aggiustare il tiro delle strategie e delle tattiche di gioco, e a dare ragionevoli aspettative sui possibili risultati.

Quindi, nel concreto, qual è un esempio di probabilità nel poker? La mano migliore in assoluto è il Royal Flush (scala reale massima), che è composta da 10, Jack, Regina, Re e Asso. Ci sono solo 4 vie per ottenere questa mano, pertanto le probabilità che capiti sono di 4÷2.598.960, cioè 0,000001539.

La probabilità per analizzare le polizze assicurative per le auto

Qual è il piano assicurativo migliore per ogni famiglia? Il calcolo della probabilità aiuta nella decisione, poiché è opportuno considerare quali siano le probabilità, appunto, che si compili una constatazione amichevole. Se, per esempio, 12 automobilisti su 100 (quindi il 12%) nella zona hanno investito un cinghiale, ha più senso considerare di stipulare una polizza Kasko piuttosto che una Bonus/Malus.

Da come decidiamo di vestirci ogni giorno a come passiamo il tempo divertendoci con i nostri hobby preferiti, fino a come tuteliamo noi stessi e la nostra vettura, la probabilità gioca un ruolo fondamentale e rappresenta un aiuto importante per prevedere i possibili risultati e fare la scelta migliore.

Sistemi dinamici integrabili : cosa sono e alcuni esempi introduttivi

Cos’è un sistema integrabile? Ci sono esempi semplici di sistemi integrabili? In questo articolo cercheremo di capire il concetto di integrabilità di un sistema dinamico, partendo da degli esempi e derivando quindi qualche risultato più generale.

Introduzione al concetto di integrabilità

In un vecchio articolo sul sito abbiamo parlato di cosa sia un integrale primo ed un sistema dinamico (se vuoi lo trovi qui https://www.mathone.it/integrale-primo/ ), oggi invece andremo a scoprire quando un sistema sia integrabile.

Cosa si può intuire dal termine “integrabile”? Supponiamo di partire da una semplice equazione differenziale : $x'(t) = 6x(t)$. Secondo te questa è integrabile?

Beh, intuitivamente sì, nel senso che possiamo integrarla, ovvero possiamo calcolarne la soluzione in forma chiusa. Infatti la funzione $x(t) = x(0)e^{6t}$ risolve l’equazione, per cui siamo riusciti ad integrare l’equazione.

Bene, questo era un esempio semplice potresti dire, ma come possiamo capire se un sistema più complicato sia o meno integrabile? Cosa vuol dire che esso è integrabile?

Intanto definiamo più rigorosamente un generico sistema dinamico, seguendo però un approccio geometrico, ovvero parlando di campi vettoriali invece che di sistemi di equazioni differenziali. Riguardo la distinzione tra questi due punti di vista puoi vedere un video che ho fatto qui sotto:

Definiamo quindi un campo vettoriale $X:\mathbb{R}^n\rightarrow\mathbb{R}^n$ che sia di classe $\mathcal{C}^1(\mathbb{R}^n,\mathbb{R})$, così che valga il teorema di esistenza e unicità. Il sistema di equazioni differenziali associato è $$\dot{x}(t)=X(x(t)).$$

Tale sistema si dice integrabile se si può trovare una funzione $x=x(t)$, tramite una sequenza di operazioni algebriche e integrazioni, che risolva il sistema di equazioni differenziali qui sopra presentato.

Bene, una volta introdotto questo concetto però è interessante scoprire se ci sono dei risultati, delle ipotesi, che ci garantiscano l’integrabilità del sistema senza integrarlo direttamente.

Infatti, immagino tu ci abbia fatto caso, la semplice equazione $x’=6x$ l’abbiamo definita integrabile perchè l’abbiamo esplicitamente risolta, ovvero integrata.

Ma la domanda importante è: esistono delle ipotesi che quando soddisfatte da un sistema ci permettono di definirlo integrabile?

Ci tengo ad evidenziare un parallelismo con le equazioni algebriche e la loro risolubilità. La teoria della risolubilità in quel caso fa riferimento ai gruppi di Galois e non andremo certo ad approfondirla, visto che non so praticamente nulla a riguardo. Però se tu avessi dimestichezza con quegli argomenti, sappi che c’è uno stretto legame almeno in termini di approccio ed intuizioni tra queste due aree della mateamatica.

Prima di vedere il più semplice risultato di questo tipo (la teoria dell’integrabilità è molto ampia e richiede buone basi teoriche nel campo della geometria differenziale e teoria dei sistemi dinamici), è importante fare una precisazione.

L’integrabilità di un sistema dinamico ( o di un campo vettoriale più in generale ), è strettamente legata alla presenza di quantità/oggetti invarianti per il sistema. Per esempio in questo campo diventano molto importanti insiemi invarianti, misure invarianti, integrali primi o simmetrie dinamiche (campi vettoriali invarianti).

Se ti interessa capire cosa sia un integrale primo, qui ho fatto un video in cui introduco questo concetto:

Integrabilità algebrica: teorema di integrabilità di Lie

Supponiamo di avere ancora un generico campo vettoriale $X=X(x_1,…,x_n)$ che sia sufficientemente regolare, per esempio $\mathcal{C}^1$. Supponiamo inoltre che esso ammetta $(n-1)$ integrali primi che siano funzionalmente indipendenti.

Prima di tutti specifichiamo cosa si intenda con quest’ultima frase. Vuol dire che ci sono $(n-1)$ funzioni $f_1,…,f_{n-1}:\mathbb{R}^n\rightarrow \mathbb{R}$ che soddisfano le due seguenti proprietà:

  • $\mathcal{L}_Xf_i = \nabla f_i \cdot X = 0 ,\;\forall i=1,…,n-1,$

  • $\nabla f_i \text{ e }\nabla f_j \text{ non sono paralleli per ogni }i\neq j.$

Allora se ciò è vero, possiamo integrare il sistema. Nel caso ci sia un integrale primo, come spiego nel video, abbiamo che gli insiemi di livello di ognuna di queste funzioni è invariante. Inoltre essendo che i gradienti di queste funzioni non sono paralleli, ovvero non sono linearmente dipendenti, ciò vuol dire che gli insiemi di livello di questi integrali primi sono tutti diversi.

Quest’ultimo fatto è dovuto alla proprietà geometrica del gradiente di essere localmente ortogonale agli insiemi di livello di $f$, per esempio se $f(x,y)=x^2+y^2$, il gradiente è $\nabla f (x,y) = [2x,2y]^T$ che, come puoi vedere nel grafico qui sotto, è localmente ortogonale alle circonferenze che definiscono gli insiemi di livello di $f$.

Cosa vuol dire nel concreto questo? Vuol dire che se fissiamo un punto iniziale da cui lasciare evolvere la dinamica, $y_0\in\mathbb{R}^n$, sappiamo che per ogni $i=1,…,n-1$, la dinamica evolverà per ogni tempo $t$ nell’insieme di livello dove vive $y_0$ di $f_i$.

Quindi supponiamo che $f_i(y_0)=c_i\in\mathbb{R}$ per ogni $i=1,…,n-1$. Allora abbiamo che l’orbita del punto $y_0$ rispetto al campo vettoriale $X$, ovvero l’insieme

$$orb(y_0) = \{\Phi_t(y_0):\,t\in\mathbb{R}\}\subset\mathbb{R}^n$$

è contenuto nell’insieme di livello $\{x\in\mathbb{R}^n : f_i(x)=c_i\}$ per ogni $i=1,…,n-1$. Di conseguenza esso apparterrà all’insieme di livello della funzione vettoriale

$$ F : \mathbb{R}^n\rightarrow \mathbb{R}^{n-1} ,\quad F(x):=(f_1(x),…,f_{n-1}(x))$$

associato al punto $\boldsymbol{c}=(c_1,…,c_{n-1})\in\mathbb{R}^{n-1}$. Essendo gli integrali primi indipendenti, questa è una funzione suriettiva e l’insieme di livello $\{x\in\mathbb{R}^n: \,F(x)=\boldsymbol{c}\}$ è di dimensione 1, ed è invariante rispetto alla dinamica. Di conseguenza sappiamo che le orbite sono contenute in questi sottoinsiemi invarianti.

In più si vede facilmente che il sistema può essere integrato esplicitamente, questo è anche chiamato teorema di integrabilità di Lie.

Giusto per essere chiari, il fatto che sia integrabile esplicitamente non vuol dire che non rimarranno integrali da calcolare nell’espressione finale, vuol dire che a meno di essere in grado di calcolare quegli integrali, abbiamo un’espressione esplicita. Spesso infatti si incontrano i cosiddetti integrali ellittici che non sono risolvibili, ma ciò non è un problema o almeno non è un ostacolo verso la definizione di integrabilità.

Per accertarci della possibilità di integrare il sistema e trovarne l’integrale generale in forma chiusa, senza perderci in formalismi eccessivi, supponiamo di definire $n-1$ variabili come segue: $y_1=f_1$, …., $y_{n-1}=f_{n-1}$. Prendiamo poi una $n-$esima variabile da esse indipendente (questa esiste visto che abbiamo uno spazio di dimensione $n$: $\mathbb{R}^n$), chiamiamola $y_n$.

Allora siccome, per quanto abbiamo visto prima riguardo gli integrali primi, gli insiemi di livello di queste funzioni sono invarianti, esiste una funzione $g:\mathbb{R}^n\rightarrow \mathbb{R}$ tale che il sistema può essere riscritto, nelle nuove coordinate $\boldsymbol{y}$ come segue:

$$ \dot{y}_1 = 0 $$

$$ …. $$

$$ \dot{y}_{n-1} = 0 $$

$$ \dot{y}_n = g(y_1,…,y_n) $$

dove l’ultima equazione può essere integrata e possiamo quindi risolvere in forma chiusa il sistema.

Proviamo a ragionare più nel dettaglio su questa nuova formulazione del sistema. Quello che abbiamo fatto è trasformare il campo vettoriale di partenza, che era nelle coordinate $\boldsymbol{x}=(x_1,…,x_n)$, nelle nuove coordinate $\boldsymbol{y}=(y_1,…,y_n)$ che non sono prese a caso ma sono “speciali”. Per precisazione, questa operazione si dice coniugazione topologica del campo vettoriale.

Detto ciò, come possiamo sfruttare queste coordinate? Beh, vediamo facilmente che le prime $(n-1)$ equazioni sono integrabili e restituiscono $y_i=c_i$ con $i=1,…,n-1$. Da ciò segue che non resta che risolvere l’ultima equazione differenziale:

$$ \frac{dy_n}{dt}(t) = g(c_1,…,c_{n-1},y_n) = \tilde{g}_{\boldsymbol{c}}(y_n(t)), $$

che ci permette di ricavare $y_n(t)$, a meno di risolvere integrali.

Conclusione

La teoria dell’integrabilità è un campo molto interessante sia nel caso di campi vettoriali su spazi vettoriali (o varietà) di dimensione finita che infinita (nel caso della teoria quantistica per esempio). I risultati però si fanno parecchio complicati e quindi ho preferito concentrarmi solo su uno tra i risultati più intuitivi, ovvero il teorema di Lie.

Un altro famoso e classico risultato invece riguarda i sistemi Hamiltoniani, esso è il teorema di Liouville-Arnol’d e, nel caso le sue assunzioni siano soddisfatte da un sistema Hamiltoniano, esso ci porta a definire completamente integrabile tale sistema.

Magari su questo risultato possiamo soffermarci in un articolo più avanti, dopo averne dedicato uno all’introduzione dei campi vettoriali Hamiltoniani, così da definire un po’ di contesto.

Per questo articolo direi che possiamo concludere, se hai qualche domanda o suggerimento lascia pure un commento qui sotto, appena posso ti risponderò 🙂

Spazi di hilbert parte 2

Nel precedente articolo (che puoi leggere qui https://www.mathone.it/spazio-hilbert/) abbiamo introdotto il concetto di spazio di Hilbert da un punto di vista storico e abbiamo definito gli strumenti base che ci serviranno ora per fare un passo oltre, introducendo effettivamente da un punto di vista matematico cosa sia uno spazio di Hilbert.

Progettando un po’ l’articolo ho realizzato che diventerebbe troppo pesante e lungo se oltre alla definizione e alle prime proprietà andassimo a parlare di importanti teoremi in questo settore, per cui dedicheremo un’ultima puntata della “rubrica” a quei risultati.

Cos’è uno spazio vettoriale di dimensione infinita?

Nel precedente articolo abbiamo visto cos’è uno spazio vettoriale. Però ci siamo limitati a parlare del caso finito dimensionale. Tuttavia per parlare di spazi di Hilbert nella loro completezza dobbiamo lavorare su spazi a dimensione infinita.

Se non hai mai visto un corso di analisi funzionale o ragionato su questi spazi in precedenza, probabilmente ti è sorta una domanda: “Qual è l’esempio di uno spazio matematico che mi capita di usare ed abbia dimensione infinita?”.

Eccoti quindi accontentato, vediamo subito un esempio che poi prenderemo come esempio di riferimento nella costruzione di spazio di Hilbert che porteremo avanti nel corso dell’articolo.

Probabilmente hai già sentito parlare di funzioni reali ad una variabile continue giusto? Se non ti è ancora capitato per il momento ti consiglio di prendere questa definizione un po’ grossolana : “Una funzione $f:[a,b]\rightarrow\mathbb{R}$ è continua se possiamo tracciarne il grafico senza staccare la penna dal foglio, ovvero il grafico è una curva senza salti”.

Ottimo, ma cosa centrano queste funzioni con gli spazi di Hilbert? In realtà poco infatti vedremo che per arrivare a quella costruzione dovremo puntualizzare qualche proprietà, però queste sono un perfetto esempio di spazio vettoriale a dimensione infinita.

Infatti se definiamo l’operazione di composizione come $f\circ g (x):= f(g(x))$ otteniamo che lo spazio $(C^0([a,b]),\circ)$ dove $C^0([a,b]):=\{f:[a,b]\rightarrow\mathbb{R}: f \text{ è continua }\}$ è uno spazio vettoriale.

Perché ha dimensione infinita? Semplicemente perché possiamo trovare infinite funzioni continue linearmente indipendenti l’una dall’altra. Vediamo perché particolare famiglia di funzioni continue linearmente indipendenti è data dalle funzioni trigonometriche:

\[T =  \{ \cos{nx} : n\in\mathbb{N} \} \]

Questa è per esempio anche utile per definire una base dello spazio in analisi. Tuttavia siccome avendo la dimensione infinita il concetto di base è un bel po’ più complesso rispetto al caso finito-dimensionale, preferisco sorvolare su questo argomento per questo articolo. Se ti interessa approfondire cosa sia una base di uno spazio vettoriale a dimensione finita ecco un sito che ti aiuterà : https://it.wikipedia.org/wiki/Base_(algebra_lineare)

Cos’è uno spazio normato?

Prima di passare a definire gli spazi di Hilbert, partendo dalla nozione di spazio vettoriale (a dimensione finita o infinita che sia) dobbiamo definire il concetto di spazio di Banach. Per farlo ci serve una norma ben definita sul nostro spazio che in questo paragrafo chiameremo $B$.

Una norma è da pensare come una funzione che associa ad ogni elemento dello spazio $v\in B$ un numero reale e non negativo. Questo numero che andiamo ad associare può essere visto come una misura della distanza dell’elemento $v$ dall’elemento neutro dello spazio, lo $0$.

Per far sì che questa funzione $|| \cdot || : B\rightarrow \mathbb{R}^+$ definisca effettivamente una norma su $B$ è necessario chiedere che sia non degenere, ovvero che $||v||=0$ se e soltanto se $v=0$.

A questo punto possiamo definire la coppia $(B,||\cdot ||)$ uno spazio normato.

Gli spazi di Banach sono spazi normati con una proprietà ulteriore che fra poco vedremo, ma prima direi che è utile  vedere un paio di esempi di spazio normati.

Partiamo da uno semplice che di sicuro conosci, in cui andremo a lavorare su uno spazio vettoriale a dimensione finita: $\mathbb{R}^n$.

Su questo spazio Euclideo possiamo definire la norma classica che associa al punto $x=(x_1,…,x_n)$ il numero non negativo $||x|| = \sqrt{x_1^2+…+x_n^2}$. Questa funzione è non degenere infatti la norma è 0 se e soltanto se $x_1=x_2=…=x_n=0$ ovvero se $x=0$ (dove qui con 0 si intende lo zero di $\mathbb{R}^n$, il suo elemento neutro quindi, con un abuso di notazione, stiamo dicendo 0=(0,…,0) ).

Passando ora ad un esempio a dimensione infinita, possiamo definire l’importantissimo spazio di Lebesgue $\mathcal{L}^2$ come segue:

\[ \mathcal{L}^2(a,b)=\{f:[a,b]\rightarrow \mathbb{R} : \int_a^b f^2(x)dx<+\infty\}. \]

Un esempio di funzione che sta qui dentro sono le funzioni trigonometriche. Infatti si può vedere che

$\int_a^b cos^2(x)dx < b-a <+\infty$ quindi richiesta soddisfatta. Se l’intervallo $[a,b]$ è limitato, allora per esempio abbiamo anche che tutte le funzioni continue sull’intervallo appartengono a questo spazio dato che, per il teorema di Weierstrass, sugli intervalli chiusi e limitati le funzioni continue ammettono massimo $M$ e minimo $m$ per cui se $f$ è continua nell’intervallo allora si ha

\[

\int_a^b f^2(x)dx < max{m^2,M^2}(b-a)<+\infty.

\]

Per definire con $\mathcal{L}^2(a,b)$ uno spazio normato dobbiamo avere una norma, che è definibile naturalmente come \[||f||=\Big(\int_a^b f^2(x)dx\Big)^{\frac{1}{2}}.\] La coppia $(\mathcal{L}^2(a,b),||\cdot ||)$ così costruita è uno spazio normato.

Dopo vedremo che questo spazio sarà davvero interessante e ricco di sorprese

Ma veniamo ora alla definizione di spazio di Banach.

Cos’è uno spazio di Banach?

Uno spazio di Banach è uno spazio normato completo.

Abbiamo già visto cosa sia uno spazio normato, ci manca la definizione di spazio completo. Se hai visto un corso di Analisi uno saprai senz’altro che la retta dei numeri reali è completa e avrai già sentito parlare di assioma di completezza.

Se non hai mai sentito questi termini non disperare, intuitivamente la retta dei numeri reali si dice completa perché non ha buchi, ovvero presi a caso due numeri nell’insieme dei reali ne esiste sempre un terzo tra essi contenuti.

Questa però non è una definizione troppo operativa o generalizzabile agli spazi normati in generale, vediamo quindi qualcosa di più pratico:

Uno spazio di dice completo se una successione converge se e soltanto se è di Cauchy.

Non parlerò nel dettaglio di successioni di Cauchy qui perché sarebbe troppo dispersivo, mi limito quindi a caratterizzare le successioni con questo carattere con la seguente definizione:

La successione $\{x_n\}_{n\in\mathbb{N}}$ è di Cauchy se e solo se $\forall\,\varepsilon>0$ esiste un $n_0\in\mathbb{N}$ per cui $\forall n,m>n_0$ si ha $||x_n-x_m||<\varepsilon$.

Ottimo, quindi ora abbiamo visto la definizione di spazio di Banach.

Chiudiamo la sezione con un esempio di spazio di Banach per poi passare, finalmente, al concetto di spazio di Hilbert.

Grazie all’assioma di completezza di $\mathbb{R}$, estensibile naturalmente anche ad $\mathbb{R}^n$, se definiamo su questi spazi Euclidei la norma classica come visto poco più sopra, otteniamo uno spazio di Banach a dimensione finita.

Un altro esempio di spazio di Banach è sempre dato dall nostro $(\mathcal{L}^2(a,b),||\cdot||)$.

Concludiamo quindi in bellezza questo breve ma intenso excursus nell’analisi funzionale con il concetto di spazio di Hilbert che da tanto stiamo tenendo sott’occhio.

Cos’è uno spazio di Hilbert?

Uno spazio di Hilbert è uno spazio vettoriale che generalizza la nozione di spazio Euclideo. Nello spazio euclideo abbiamo uno strumento molto utile a nostra disposizione: un prodotto scalare.

Di prodotto scalare e di proiezioni ne abbiamo parlato nello scorso articolo (lo trovi qui https://www.mathone.it/spazio-hilbert/ ) quindi in questo lo suppongo noto.

L’idea è quindi di definire gli spazi di Hilbert partendo da questo concetto. Formalmente abbiamo la seguente definizione di Spazio di Hilbert:

Uno spazio di Hilbert è una coppia $(H,\langle\cdot,\cdot\rangle)$ fatta da uno spazio vettoriale $H$ e un prodotto scalare su $H$. Inoltre la norma $||v||:=\sqrt{\langle v,v\rangle}$ naturalmente indotta dal prodotto scalare, definisce uno spazio di Banach $(H,||\cdot ||)$.

Bene, questa coppia $(H, \langle\cdot,\cdot\rangle )$ è una generalizzazione dello spazio euclideo dove si possono fare le stesse belle cose tra cui calcolare prodotti, proiettare, scomporre in serie di Fourier (generalizzate) e molto altro. Chiaramente non ce ne occuperemo nel dettaglio in questo articolo ma alcune proprietà interessanti tra queste le vedremo nel prossimo ed ultimo articolo della rubrica.

Chiudiamo però recuperando l’esempio $\mathcal{L}^2(a,b)$. Su questo possiamo infatti definire un prodotto scalare come segue:

$$ \langle f,g \rangle = \int_a^b f(x)g(x)dx\quad\forall f,g\in \mathcal{L}^2(a,b). $$

Nel prossimo articolo vedremo molti risultati su questo spazio, per ora ci fermiamo così che sono convinto che abbiamo già visto un bel po’ di concetti.

DIVULGAZIONE MATEMATICA? ECCO Perché leggere I libri divulgativi

Un paio di mesi fa ho visitato il museo oceanografico a Monaco. Girando al suo interno mi sono accorto che gran parte delle cose che leggevo e vedevo non le conoscevo e proprio per questo mi è piaciuto davvero molto.

Camminando poi mi è venuto in mente che questo è esattamente lo stesso motivo per cui mi piace e trovo utile leggere libri di divulgazione riguardo ad argomenti e temi che non conosco.

Prima di elencare 3 motivi per cui ti consiglio di leggere questa tipologia di libri e di suggerirti un paio di titoli da cui partire, nel caso tu fossi in alto mare, però ci tengo a specificare che in questo periodo io non ne sto leggendo nessuno.

Non perché non li trovi utili o interessanti, ma piuttosto perché leggo molti libri tecnici/didattici per l’universitá, poi leggo articoli per trovare idee per Mathone, capirai bene che quando poi trovo il tempo di leggere preferisco staccare dalla matematica e svagarmi con altro

Comunque quando riesco a trovare periodi di pausa, magari durante l’estate, un paio riesco sempre a leggerli e ormai ne ho accumulati un bel po’ nel corso degli anni, magari potrei anche recensirne qualcuno in dei video o articoli dedicati se può interessarti.

Ma torniamo ai motivi per cui ti suggerisco di leggere libri di divulgazione:

  1. Non sono quasi mai letture pesanti, spesso all’interno ci sono delle storie, e ti permettono di vedere sotto una luce diversa ciò che magari hai già studiato a scuola o all’università.
  2. Sono utili per incuriosirsi ad argomenti sconosciuti. Se per esempio non hai mai provato a ragionare su cosa siano le dimensioni in geometria, o non hai mai studiato la geometria dello spazio, una prima lettura di Flatlandia di sicuro ti illuminerà e ti lascerà a tratti dubbioso.
  3. Riescono a rispondere a domande un po’ più profonde, che spesso quando si studia su libri tecnici si lasciano in disparte. Per esempio sono interessanti le domande: Che cos’è la matematica? Perché studiare e fare matematica? E oltre a queste ce ne sarebbero molte altre, ma ho citato loro perché voglio suggeriti due letture davvero interessanti a riguardo, che sono: Che cos’è la matematica e Apologia di un matematico.

Vedrai che questi due libri non ti deluderanno, magari parti dal secondo che è molto breve e diretto.

E ora voglio rispondere ad un’ultima domanda: ma a cosa serve incuriosirmi ad un argomento? Comunque quando finisco il libro non sapró molto su questo!

Sono d’accordissimo con te! Infatti, proprio come quando trovi qualcosa di interessante in una cittá nuova, in un museo o nei discorsi con i tuoi amici vai ad approfondire dopo il tutto su dei testi piú tecnici o siti di riferimento, anche con i libri di divulgazione é cosí!

Se trovi un argomento che ti interessa o ti appassiona grazie ad un libro di divulgazione hai fatto bingo! Peró poi sta a te proseguire con gli approfondimenti tecnici se ti interessa veramente.

A dirla tutta questo “servizio” di incuriosire a vari temi é proprio quello che provo a dare io nei video o negli articoli, non ho nessuna pretesa di spiegarti in termini didattici cosa sia un’equazione alle derivate parziali, peró posso provare a presentarti esempi, situazioni reali e suggerirti qualche strumentio per approfondire in maniera rigorosa

Ottimo, direi che ci siamo dilungati fin troppo, grazie per la lettura e alla prossima!

Intanto se vuoi leggerti un articolo in cui consiglio 50 libri di divulgazione matematica eccoti servito: https://www.mathone.it/migliori-libri-sulla-matematica/

Magari con un video o articolo in cui faccio una recensione 🙂

Cosa sono le differenze finite

In questo articolo andremo a parlare di differenze finite. Questo sarà un articolo introduttivo all’argomento.

Oltre alla descrizione del metodo vedremo un paio di esempi molto semplici scritti con Matlab, dove andremo a risolvere l’equazione di Poisson su un intervallo $I\subset\mathbb{R}$ e una sua variante.

Se vuoi vedere anche un video che ho fatto su questo argomento lo trovi sul canale Youtube 😉

Di sicuro ti è stato detto o comunque hai studiato e letto da qualche parte che è davvero piccolo l’insieme di equazioni differenziali risolvibili in maniera analitica ed esatta. Molto poche ammettono una soluzione esprimibile tramite una funzione che ha una sua espressione precisa. Descrivibile in forma chiusa.

Per questo motivo è necessario trovare un’alternativa alla procedura analitica. La procedura esatta che ci permette di arrivare ad una soluzione delle equazioni è infatti spesso limitante.

Ok, è importante saper risolvere gli esercizi in cui viene chiesto di trovare un integrale generale di un’equazione differenziale, ma questi sono appunto esercizi. Spesso le equazioni che definiscono un modello matematico, una volta che si riesce a mostrare che una soluzione esista, sono trattati in termini numerici.

Infatti tutto quello che è presente nel mondo, nella realtà, è descritto da una variazione di certe quantità, di certe proprietà mentre il tempo scorre liberamente.

Quindi come possiamo descrivere tutti questi fenomeni? Beh, intanto dobbiamo necessariamente coinvolgere delle equazioni differenziali. Quindi chiaramente non possiamo fermarci davanti al fatto che non sia possibile risolvere un’equazione di questo tipo in maniera esatta, in forma chiusa.

Se a noi interessa fare previsioni su qualche modello, su qualche fenomeno, dobbiamo trovare comunque un modo per ottenere informazioni sulla soluzione. A questo punto si aprono due strade molto interessanti:

L’analisi qualitativa (di cui magari ci occuperemo in altri articoli e puoi trovare già un esempio in questo articolo https://www.mathone.it/pendolo-semplice/) ma puoi già trovare un mio video sull’argomento qui di seguito:

e l’approssimazione numerica della soluzione, argomento di cui inizieremo ad occuparci proprio in questo articolo.

Per questa prima introduzione parleremo di equazioni differenziali ordinarie, quindi del caso in cui compaiono solo derivate ordinarie e c’è una sola variabile. Non andiamo quindi a coinvolgere le equazioni alle derivate parziali anche perché in quel caso il metodo alle differenze finite è abbastanza limitante perché non è comodo per lavorare con domini di dimensioni di forma particolari perché è necessario avere delle griglie fatte in un certo modo (spesso in quel caso si usa il metodo degli elementi finiti).

Comunque di sicuro porterò qualche esempio riguardo al metodo applicato al caso delle derivate parziali perchè permette di analizzare, senza andare troppo nel complesso, sistemi che evolvono in spazio e tempo, ampliando così di molto la classe dei modelli che potremo analizzare.

Ma torniamo alle equazioni differenziali ordinarie. Questa tipologia di equazioni solitamente ci interessa risolverle in un certo dominio. Per poterle risolvere numericamente dobbiamo imporre un’importante condizione su questo dominio: deve essere limitato.

Numericamente infatti non possiamo direttamente risolvere un’equazione differenziale su tutta la retta reale, ma dobbiamo considerarne un sottodominio compatto della forma $[0,L]$ con $L<+\infty$.

Le differenze finite si prestano molto bene a risolvere equazioni differenziali ordinarie che descrivono fenomeni stazionari, ovvero nel caso le quantità non varino nel tempo ma nello spazio. Spesso ci si riferisce ad essi come problemi al bordo (boundary value problems o BVP). Per esempio parliamo dell’equazione di Poisson $$-\frac{d^2u(x)}{dx^2}= f(x)$$ con $x\in[0,L]$ ed $f:\mathbb{R}\rightarrow \mathbb{R}$ una funzione qualsiasi, con delle opportune condizioni al bordo $u(0)=a$ e $u(L)=b$.

Chiaramente vediamo subito che serve un minimo di regolarità per la funzione $f$ per poter dire di avere una soluzione classica in questo esempio, ovvero siccome dobbiamo calcolare la derivata seconda di $u$ si può richiedere di avere $u\in\mathcal{C}^2(\mathbb{R},\mathbb{R})$ e quindi segue naturalmente $f\in\mathcal{C}^0(\mathbb{R},\mathbb{R})$. Se hai già sentito parlare di soluzioni deboli sai che in realtà si può chiedere meno regolarità per $f$ in generale, ma non preoccupiamocene per questo articolo.

Andiamo quindi ad introdurci alle tecniche approsimative che ci porteranno a definire uno schema alle differenze finite per risolvere l’equazione differenziale precedente, che possiamo per esempio complicare anche passando a questa dove comprare anche la derivata prima :$$\frac{d^2u(x)}{dx^2}+\frac{du(x)}{dx}=f(x)$$ per ogni $x\in[0,L]$ e ancora delle buone condizioni al bordo.

La prima idea che dobbiamo avere per approcciare l’approssimazione di una derivata, perché è questo che vogliamo fare, con delle strategie alternative è quello di definire una discretizzazione del nostro dominio.

Cos’è una discretizzazione? Semplicemente vogliamo dividere il nostro intervallo $[0,L]$ in intervallini sufficientemente piccoli, la cui unione restituisce esattamente l’intero dominio:

Definiamo la discretizzazione $$\tau = \{x_1=0<x_2<…<x_{N-1}<x_N=L\}$$ in modo dale che $$\cup_{i=1}^{N-1} [x_i,x_{i+1}] = [0,L].$$

Questa discretizzazione può essere fatta in maniera uniforme o non uniforme nel senso che le distanze $$\Delta x_k = x_{k+1}-x_k$$ possono essere rispettivamente tutte uguali o diverse.

Per semplicità d’ora in poi nella trattazione e anche nel codice supporremo tale discretizzazione uniforme e chiamiamo quindi $\Delta x = x_{n+1}-x_n$.

Benissimo ora siamo pronti a fare lo step fondamentale dietro l’idea delle differenze finite.

Se ti ricordi un po’ come ti è stato introdotto il concetto di derivata, ti ricorderai senz’altro che è coinvolto il limite del rapporto incrementale

Infatti la derivata di una funzione $u:\mathbb{R}\rightarrow\mathbb{R}$ è definita come il limite del rapporto incrementale, qualora esso sia finito:

$$ u'(x) = \lim_{\Delta x\to 0}\frac{u(x+\Delta x)-u(x)}{\Delta x}. $$

Allo stesso modo si può definire anche la derivata seconda:

$$ u”(x) = (u'(x))’ = \lim_{\Delta x\to 0}\frac{u'(x+\Delta x)-u'(x)}{\Delta x}.$$

Introduciamo quindi l’ultima notazione: $u(x_k) \approx u_k$, ovvero noi quello che andremo a calcolare sarà $u_k$ che è l’approssimazione numerica della soluzione esatta in $x_k$.

Ottimo, ora possiamo finalmente fornire un’approssimazione alle differenze finite di queste due derivate. Per farlo basta la semplice idea: invece di passare al limite su $\Delta x$, definiamo una discretizzazione sufficientemente raffinata del dominio $[0,L]$, ovvero tale che gli elementi $x_k$ e $x_{k+1}$ distano sufficientemente poco.

Ecco quindi una prima approssimazione della derivata

$$ u'(x_k)\approx \frac{u_{k+1}-u_k}{\Delta x}.$$

Questa è però una stima un po’ rozza infatti si può mostrare, espandendo con i polinomi di Taylor, che $$|u'(x_k)-\text{questa approssimazione}|$$ va a zero con la stessa velocità con cui ci va $\Delta x$, quindi è un’approssimazione di ordine 1:

$$ u(x_{k+1}) = u(x_k) + u'(x_k)(x_{k+1}-x_k) + o(\Delta x^2) $$

$$\frac{1}{\Delta x}(u(x_{k+1})-u(x_k)) = \frac{1}{\Delta x} (u(x_k)+u'(x_k)\Delta x + o(\Delta x^2)-u(x_k))$$

$$ = u'(x_k) + o(\Delta x).$$

Un modo per ottenere un’approssimazione più precisa, del secondo ordine, è quello di procedere con una differenza finita centrata invece che in avanti come abbiamo visto prima. Ti chiedo di provare a verificare da solo che la prossima approzione è precisa al secondo ordine 😉

$$ u'(x_k) \approx \frac{u_{k+1}-u_{k-1}}{2\Delta x}. $$

Similmente, partendo dalla differenza finita in avanti vista prima, si può ottenere un’approssimazione accurata al secondo ordine della derivata seconda come segue:

$$ u”(x_k) \approx \frac{\frac{u_{k+1}-u_k}{\Delta x} – \frac{u_k-u_{k-1}}{\Delta x}}{\Delta x} $$

$$ = \frac{u_{k+1}-2u_k+u_{k-1}}{\Delta x^2}.$$

Ottimo, direi che con la “teoria” siamo a posto. Vediamo di applicare questi risultati alle due equazioni prima introdotte. Prima però è importante rimarcare il fatto che il risultato del metodo delle differenze finite sarà un vettore che corrisponde alle approssimazioni della soluzione dell’equazione analizzata nei nodi della discretizzazione. Otterremo quindi un vettore $\vec{u}\in\mathbb{R}^N$ definito come segue:

$$ \vec{u} \approx \begin{bmatrix} u(x_1) \\ u(x_2) \\ . \\ .\\ . \\ u(x_N) \end{bmatrix} $$

e solitamente quando rappresenteremo graficamente la soluzione ottenuta si costruisce un’interpolazione lineare di tali valori, ovvero negli intervalli $(x_k,x_{k+1})$ si congiungono i punti $(x_k,u_k)$ e $(x_{k+1},u_{k+1})$ con un segmento come puoi vedere qui sotto:

Ottimo direi che la parte introduttiva può dirsi chiusa, qui di seguito oltre ai codici che ho scritto per Matlab e che puoi scaricare cliccando sul link di GitHub, ti riporto l’idea in breve dietro l’implementazione. La cosa interessante da precisare per il codice è che l’ho scritto in forma matriciale. Ho definito quindi due matrici $D1$ e $D2$ in modo tale che la loro azione sul vettore $u$ permetta di ottenere rispettivamente l’approssimazione della derivata prima e della derivata seconda. Ecco qui cosa intendo:

$$D1\, u = \begin{bmatrix}
0& 0&0& \dots &\dots \\
-1/(2\Delta x)& 0& 1/(2\Delta x)&0&\dots\\
0& -1/(2\Delta x)& 0& 1/(2\Delta x)&0\\ 0&\ddots&\ddots&\ddots&\dots\\
\dots& \dots& \dots& 0& 0
\end{bmatrix} \begin{bmatrix} u_1 \\ u_2 \\ . \\ .\\ . \\ u_N \end{bmatrix} = \begin{bmatrix} 0 \\ \frac{u_3-u_1}{2\Delta x} \\ . \\ .\\ \frac{u_N-u_{N-2}}{2\Delta x}\\ 0 \end{bmatrix} $$

$$D2\, u = \frac{1}{\Delta x^2}\begin{bmatrix}
1& 0&0& \dots &\dots&\dots&\dots \\
1& -2& 1&0&0&0&\dots\\
0& 1& -2&1&0&\dots&\dots\\ 0&\ddots&\ddots&\ddots&\dots&\dots&\dots\\
\dots& \dots&\dots&\dots& \dots& 0& 1
\end{bmatrix} \begin{bmatrix} u_1 \\ u_2 \\ . \\ .\\ . \\ u_N \end{bmatrix} = \begin{bmatrix} \frac{u_1}{\Delta x^2} \\ \frac{u_3-2u_2+u_1}{\Delta x^2} \\ . \\ .\\ \frac{u_N-2u_{N-1}+u_{N-2}}{\Delta x^2}\\ \frac{u_N}{\Delta x^2} \end{bmatrix} $$

E quindi i due problemi si ridurranno semplicemente a risolvere un sistema lineare. Il problema

$$\begin{cases}-u”(x) = 1,\quad x\in(0,1) \\ u(0)=u(1)=0\end{cases} $$

diventa quindi

$$ -D2\, u = \begin{bmatrix} 0\\ 1 \\ . \\ .\\ 1\\ 0 \end{bmatrix} .$$

Ecco quindi cosa otteniamo, dove la soluzione analitica con cui ho comparato quella numerica è la seguente parabola $$u_{\text{esatta}} (x)= -\frac{1}{2}x(1-x).$$

Invece il secondo problema

$$\begin{cases}u”(x)+u'(x) = 0,\quad x\in(0,1) \\ u(0)=0,u(1)=1\end{cases} $$

diventa quindi

$$ (D2+D1)\, u = \begin{bmatrix} 0\\ 0 \\ . \\ .\\ 0\\ \frac{1}{\Delta x^2} \end{bmatrix} .$$

Ecco quindi cosa otteniamo, dove la soluzione analitica con cui ho comparato quella numerica è la seguente $$u_{\text{esatta}} (x)= \frac{e-e^{1-x}}{e-1}.$$