Archivi tag: Spazio di Hilbert

meccanica quantistica

Meccanica quantistica – introduzione alla matematica (Parte 2)

Bentornati in questa serie sulle basi matematiche della meccanica quantistica. Se hai letto il primo articolo sarai curioso di conoscere quale sia il formalismo che si usa (e perchè). Come promesso questa volta mettiamo le mani in pasta con la matematica!

Prima di iniziare voglio fare alcune doverose premesse. Oltre a leggere la prima parte dei questa serie di articoli, ovviamente, consiglio vivamente (anzi direi che è praticamente necessario ) di leggere la serie di articoli di Davide sugli spazi di Hilbert . La serie di articoli in questione sarà parallela alla mia e in molti sensi saranno collegate: infatti la formulazione matematica della meccanica quantistica è nata grazie alla teoria fatta per gli spazi lineari e gli spazi lineari hanno giovato molto del lavoro fatto per la meccanica quantistica (come già accennato nell’articolo da Davide), un altro dei tanti esempi della prolifica e utilissima collaborazione tra matematica e fisica. In quell’articolo sono presenti concetti fondamentali che ci aiuteranno a capire perchè e come i padri fondatori che ho citato nello scorso articolo abbiano formalizzato in questo modo la meccanica quantistica, che è il punto focale della mia serie di articoli.

Il lettore più interessato ed esperto può consultare tranquillamente come fonti quelle lasciate da Davide. Volendo, per esperienza personale, un ottimo libro (anzi un classico per dire la verità) su questi argomenti è il A. Kolmogorov: Elementi di teoria delle funzioni e di analisi funzionale.

Spazi di Hilbert

Adesso passiamo finalmente alla matematica! Come detto nella parte storica dello scorso articolo il formalismo che si usa è prettamente dovuto a Dirac-Schrödinger-Heisenberg.

La prima domanda che possiamo farci è “dove vive il nostro sistema?”, che è un modo per chiederci quale sia lo spazio da considerare. Come da titolo possiamo sfruttare gli spazi di Hilbert. La serie di articoli di Davide fa una trattazione più chiara della mia, quindi cercherò solo di mostrare alcune proprietà fondamentali (magari ripetendole) e come si collegano alla fisica. Ultima piccola digressione: In realtà la teoria matematica richiesta sugli spazi è leggermente più complicata di questa, però si può già sfruttare la matematica che esporrò di seguito per capire bene come formalizziamo la meccanica quantistica. Adesso, cominciamo!

Definizione (Spazio di Hilbert): Uno spazio vettoriale $H$ in cui è definito un prodotto scalare e che risulta essere completo (cioè in cui ogni successione di Cauchy converge) rispetto alla norma definita dal prodotto scalare si dice di Hilbert.

Effetivamente questa definizione, anche se da manuale, è troppo generale per quello che ci interessa. Molti spazi rientrano in questa definizione, tra cui gli spazi $ \mathbb{R} ^n$ e $ \mathbb{C} ^n$, la cosa interessante però è che con questa definizione di possono trovare anche spazi a dimensione infinita (quindi con una base infinita) in cui succedono molte cose “strane”. Possiamo cercare una definizione di spazio più semplice, ma che sia sempre di Hilbert, e lavorare con quella (anche se per tradizione continueremo a chiamarla spazio di Hilbert). Introduciamo alcuni concetti interessanti:

Definizione (Spazio Euclideo): Uno spazio $X$ Euclideo è uno spazio vettoriale dotato di prodotto scalare.

Adesso sfruttiamo un concetto che potete trovare in questo articolo del sito insieme alla storia e le idee di Cantor, ovvero quello della cardinalità di uno spazio. Ti invito inoltre a dare una lettura al concetto di punto di accumulazione.

Definizione (Spazio separabile): Uno spazio euclideo $X$ si dice separabile se esiste un sottospazio numerabile (cioè con la stessa cardinalità dell’insieme $\mathbb{N}$) e denso (ovvero se ogni punto del sottospazio appartiene all’insieme o ne è punto di accumulazione).

In questa parte introdurrò alcuni concetti molto avanzati, con cui forse non tutti voi avete dimestichezza. Quindi nel caso ti consiglio di leggerli ed approfondirli con il testo prima citato o eventualmente aspettare che la serie di articoli di Davide vada avanti nella teoria degli spazi di Hilbert.

Definizione (vettori ortonormali): Un insieme di vettori $\{ \alpha_i \} $ si dice ortonormale quando il prodotto scalare tra due vettori risulta essere $\alpha_i \cdot \alpha_j=0$ per $i \ j$ e $\alpha_i \cdot \alpha_i=1$.

Definizione (set ortonormale completo): Un set ortonormale $\{\alpha_i\}$ è un insieme di vettori ortonormali, esso è completo quando $\forall$ $x\in X$ la serie di Fourier di x rispetto al set converge, nella norma di H, ad x stesso.

In questo caso abbiamo appena introdotto un nuovo concetto, ovvero le serie di Fourier! Questo strumento fondamentale della matematica torna più volte utile in fisica e questo è solo uno dei tantissimi casi.

Definizione alternativa (set ortonormale completo): $\{\alpha_i\}$ è completo se è una base per lo spazio vettoriale. Essa si può dimostrare equivalente alla precendente.

Grazie a questa definizione, più comoda e facile in molti sensi, procediamo illustrando un teorema molto utile:

Teorema: Uno spazio $X$ euclideo è separabile se e solo se $\exists$ un $\{\alpha_i\}$ ortonormale, completo e numerabile.

Bene, ma perchè introdurre tutti questi concetti? Come detto prima cerchiamo una definizione di spazio di Hilbert più semplice, che usiamo poi nella nostra descrizione fisica. Si può facilmente dimostrare infatti che uno spazio $H$ euclideo che sia completo e separabile è uno spazio di Hilbert! Introduciamo ora un teorema fondamentale:

Teorema: Uno spazio di Hilbert (come definito prima) è isomorfo a $L^2$.

Non conoscete lo spazio $L^2$? Sul sito è presente un ottimo articolo sulle trasformate che ti consiglio di leggere per avere idea di cosa siano e in che spazio siano definite. Questo ci aiuto molto, poichè connette tutti gli elementi dello spazio di Hilbert fisico con funzioni a quadrato sommabile.

Senza continuare col formalismo matematico, di cui ci sarebbero infinite cose da dire in realtà, carchiamo di capire il motivo fisico. Sicuramente sarà strano per voi pensare perchè i grandi fisici abbiano deciso di usare questa matematica apparentemente astrusa per descrivere la realtà fisica, cerchiamo di fare chiarezza. Ogni sistema fisico è associato con uno spazio di Hilbert, la scelta dell’utilizzo di questi spazi è data principlamente da:

  • Linearità: la sovrapposizione di più vettori restituisce ancora un vettore dello spazio, fondamentale per spiegare fenomeni come la diffrazione e l’interferenza.
  • Completezza: fa in modo che se applichiamo un operatore (ne parleremo dopo di cosa siano) restituisce ancora uno stato, sarà utile per lavorare con le grandezza fisiche.
  • Separabilità: garantisce che un vettore ha una base ortonormale numerabile che lo definisce univocamente, servirà per proiettare i vettori rispetto a certe basi con un particolare significato fisico.

Parliamo della natura di questi “vettori”, qual è il significato che la meccanica quantistica da a questi elementi che “abitano lo spazio”?

Chiamiamo $|{\psi}> \in H$ una rappresentazione dello stato fisico del sistema, in breve “ket”. Mentre $<\psi| \in H^*$ è un elemento dello spazio duale e si chiama “bra” (qui per sapere cosa sia lo spazio duale) . Questo modo di scrivere i vettori si chiama notazione di Dirac, i nomi vengono dal fatto che in inglese la parentesi si chiama “bracket”… capito la battuta? Che simpaticone Dirac!

Definizione (funzionale lineare): Il funzionale è una funzione su uno spazio vettoriale $F:$ $H \rightarrow \mathbb{C} $ tale che $F[\psi] \in \mathbb{C} $. Esso è lineare poichè $F[x\psi+y\psi’]=xF[\psi]+yF[\psi’]$ $\forall \psi , \psi’ \in H$.

Grazie ai funzionali si può esprimere il prodotto scalare già definito nel nostro spazio come un funzionale: $F_\phi[\psi]=<\phi|\psi>$ $\forall \psi\in H$. Potreste chiedervi, giustamente, come fa un elemento dello spazio duale ad associarsi con un elemento dello spazio stesso? Ci viene in aiuto questo teorema:

Teorema (Riesz): Dato uno spazio di Hilbert $H$ allora $\forall$ $F:H \rightarrow \mathbb{C} $ lineare e continuo (dove vale una condizione simile alla continuità per funzioni) allora $\exists$ un solo $\phi_F \in H$ tale che $<\phi_F|\psi>=F[\psi]$ $\forall \psi \in H$.

Fisicamente questo prodotto scalare $<\phi|\psi>$ consiste nel proiettare uno stato “vecchio” in uno “nuovo”, così che il prodotto scalare definisce l’ampiezza di probabilità del passaggio da uno stato all’altro. La probabilità di misurare il sistema nello stato del bra (se lo stato è normalizzato con $<\psi|\psi>$) è data per definizione da $P=>{|<\phi|\psi>|}^2$… ecco a voi la famosa interpretazione probabilistica della meccanica quantistica! La linearità dello spazio (e del prodotto scalare) garantisce così la cosidetta sovrapposizione di stati, con questa si risolve il problema della doppia fenditura citato inizialmente immaginando che ogni elettrone che passi per una fenditura abbia uno stato diverso (in questo caso saranno 2) o una somma dei due. È infatti questo il modo in cui viene formalizzata la famosa idea che un osservatore cambi lo stato fisico del sistema (su cui spesso la fantascienza gioca), essa è data semplicemente dal fato che nel misurare si sta in realtà “facendo” un prodotto scalare con uno stato deciso da noi (quello della misura)!

Ultimo concetto fondamentale: Se come stato bra decidiamo di prendere una base otteniamo come risultato le cosidette funzioni d’onda. Se si usa la base delle posizioni $<r|$ otteniamo la funzione d’onda della posizione $\psi(r)=<r|\psi>$ che fornisce in modo diretto la posizione della particella. Mentre $<p|$ è la base degli impulsi e fornisce la funzione d’onda degli impulsi $\psi(r)=<r|\psi>$ che fornisce la quantità di moto. Esse sono funzioni complesse e si usano per calcolare i prodotti scalari che abbiamo definito prima come integrali, della connessione tra le due funzioni parleremo in un altro articolo.

Ottimo, adesso sappiamo un accenno di cosa siano le funzioni d’onda e gli stati. Andiamo avanti scoprendo cosa siano gli osservabili fisici e come spunti fuori la quantizzazione.

Operatori e fisica quantistica

Adesso parliamo degli operatori in fisica quantistica. Le seconda domanda che ci poniamo viene da un semplice ragionamento basato sulla prima, in un certo senso. Se lo spazio in cui “vive” la nostra fisica è H e il vettore bra $|\psi>$ rappresenta il nostro sistema fisico allora ci si chiede: “Ma le variabili come quantità di moto, energia, posizione, ecc. cosa diventano?”… la risposta è operatori!

Definizione (operatore): Si dice $\hat{A}$ operatore lineare un’ applicazione $H_1 \rightarrow H_2$ tale che $ \hat{A} |h_1>=|h_2>$ con $|h_1> \in H_1 , |h_2> \in H_2$ e per cui valgono le consizioni di linearità analoghe al prodotto scalare:

  • $( \hat{A} + \hat{B} )h= \hat{A} h+ \hat{B} h$
  • $a( \hat{A} h)= \hat{A} (ah)$ con $a \in \mathbb{R}$
  • $\hat{A} \hat{B} h= \hat{A} ( \hat{B} h)$

Questa definizione è generale ma se come spazi si scelgono quelli “fisici” dello spazio di Hilbert prima detto e quindi gli stati come vettori allora si sta cambiando stato dopo un’osservazione (data dall’applicare l’operatore), e una scrittura del tipo $<\psi| \hat{A} |\phi>$ rapprensenta un prodotto scalare dopo aver trasformato il vettore $|\phi>$. Una definizione importante è la seguente:

Definizione (operatore aggiunto): Si può scrivere un prodotto scalare $<\psi|\hat{A}|\phi>$ anche nella forma $<\hat{A ^\dagger } \psi| |\phi>$, dove $ \hat{A ^\dagger } $ si chiama operatore aggiunto. Se un operatore è uguale al suo aggiunto allora si dice operatore hermitiano.

Adesso, come per il paragrafo precedente, cerchiamo di spiegare a cosa serva tutta questa matematica appena definita. Gli operatori possono essere rappresentati come matrici sotto opportune condizioni dello spazio, quindi in quanto tali la loro applicazione ad un vettore (nel nostro caso uno stato) da luogo ad uno spettro di autovalori discreto, ovvero ad un insieme di valori discreti $\lambda \in \mathbb{C} $ per cui $\hat{A}|\psi>=\lambda|\psi>$ (cioè il l’operatore applicato al vettore torna il vettore stesso per un valore complesso). Come accennato prima ipotizzando che gli operatori (aggiungiamo ora) hermitiani siano osservabili fisici gli autovalori non sono altro che i valori che una misura di una variabile fisica torna se fatta su di un certo stato quantistico, cioè se andiamo in un laboratorio e misuriamo per esempio la quantità di moto di una particella mi aspetto che l’apparato sperimentale mi dia sullo schermo proprio quelli. Il fatto che questi autovalori siano discreti adesso ci fa capire in che senso la fisica quantistica accetta solo certi valori discreti… sono infatti proprio gli autovalori! Ed il fatto che questi $\lambda$ siano complessi non deve preoccuparci (poichè non esistono misure fisiche complesse), esiste per fortuna un teorema che garantisce che gli operatori hermitiani ammettano solo autovalori reali.

Alcuni esempi di questi concetti?:

  • Immaginiamo un atomo di idrogeno: L ‘energia si misura grazie all’operatore hamiltoniano $\hat{H}$ che applicato allo stato da come autovalori i livelli energetici $ \hat{H}|\psi>=E|\psi>$ anche detti orbitali, che molti di voi conosceranno magari dalla chimica e che giustificano tra le moltissime cose la presenza dei colori (dall’idrogeno o meno).
  • Prendendo in esempio l’effetto fotoelettrico: La creazione di un fotone viene descritta da degli operatori chiamati di creazione e annichilazione, anche se quello è il regime della Quantum Electrodynamics.
  • L’operatore posizione , come da nome, l’autovalore che rappresenta la posizione della particella. Sempre nel caso dell’atomo questa rapprensenta il cosidetto raggio dell’orbitale.

Esistono molte altri operatori diversi. L’idea è che rispetto alla fisica classica si ribalta il concetto di una variabile che descrive tutto passando ad un operatore che è un concetto totalmente diverso. Ultimo concetto importante è che se si vuole avere un valore di aspettazione per un certo osservabile, cioè il valore che ci si aspetta probabilisticamente da una misura fatta in un esperimento, in uno stato esso è per definizione: $<\psi|\hat{A}|\psi>$.

Conclusione

Questa “puntata” della serie è stata davvero complicata vero? Ho cercato di fare del mio meglio ma purtroppo certi concetti richiedono tanto studio per poter essere digeriti bene. Mi scuso quindi se non sono riuscito e rendere chiarissimo questo articolo e ti invito anzi ad approfondire meglio grazie alla serie di Davide e alle risorse fornite. Ci vediamo alla prossima e ultima puntata sulla matematica che sta alla base della meccanica quantistica parlando, anche, del principio di indeterminazione!

Spazio di Hilbert (PARTE 1) : concetti base e cenni storici

Magari ti è già capitato di sentire nominare Hilbert, ma a meno che tu non abbia già seguito un corso di analisi funzionale o qualcosa di analogo, probabilmente non sai cosa sia uno spazio di Hilbert.

Andremo quindi alla scoperta di questi particolari spazi, vedendone un po’ di storia, una caratterizzazione formale e rigorosa, le principali proprietà, alcuni esempi e per finire introdurremo l’importante concetto di Serie di Fourier generalizzata parlando di proiezioni.

In questo articolo lascerò da parte gli ultimi tre punti di questa lista, “limitandomi” quindi a introdurre alcuni concetti base e a fare un preambolo storico, perché altrimenti verrebbe troppo lungo. Termineremo quindi questo percorso alla scoperta degli spazi di Hilbert in un secondo episodio che scriverò tra non molto. Se vedo che sarebbe troppo lungo anche il secondo non si sa mai che lo spezzi in un ulteriore terzo, tanto di cose da dire ce ne sarebbero una marea 😉

Di strada da fare quindi ne abbiamo parecchia, ma cercherò di renderla il più scorrevole e piacevole possibile quindi, cosa stiamo aspettando?! Iniziamo con il succo dell’articolo!

Prima di iniziare ti lascio una piccola legenda della notazione matematica che userò, e che è usata classicamente, per rendere il testo più scorrevole (nel caso tu non ci fossi già abituato):

  • $v\in V$ vuol dire che l’elemento $v$ appartiene all’insieme $V$
  • $\exists x\in X$ significa che esiste una $x$ nell’insieme $X$
  • $\forall x\in X$ sta ad indicare per ogni $x$ dell’insieme $X$.

Definizioni e concetti base che useremo per scoprire gli spazi di Hilbert

Per poter parlare di spazi di Hilbert, è necessario che alcuni concetti siano noti, vediamo quindi di sintetizzarli in questo paragrafo 😉 . Non voglio fare sbrodoloni inutili in questa sezione, per cui tutte queste nozioni sono organizzate qui sotto in maniera sintetica ma più che sufficiente per capire il seguito dell’articolo e soprattutto le prossime puntate.

Spazio vettoriale su $\mathbb{R}$

Diciamo spazio vettoriale rispetto al campo $\mathbb{R}$ un insieme $V$, i cui elementi saranno chiamati vettori, equipaggiato di due operazioni

$+ : V\times V\rightarrow V$ e $* : \mathbb{R}\times V \rightarrow V$ tali che soddisfino le seguenti proprietà:

  • $(V,+)$ è un gruppo abeliano, ovvero:
  1. Esiste un elemento neutro $0_V$ rispetto a $+$, quindi esiste $0_V$ tale che $a+0_V=a\,\forall a\in V$.
  2. Esiste un elemento inverso rispetto a $+$, quindi esiste un $\bar{a}$ tale che $a+\bar{a}=0_V\,\forall a\in V$.
  3. L’operazione $+$ è associativa, ovvero $(a+b)+c=a+(b+c)$, $\forall a,b,c\in V$.
  4. Vale la proprietà commutativa (perché è abeliano): $a+b=b+a$, $\forall a,b\in V$.
  • Vale la proprietà distributiva tra $*$ e $+$:
  1. $k*(a+b) = k*a + k*b$, $\forall a,b\in V,\,k\in\mathbb{R}$.
  2. $(k+m)*a = k*a + m*a$, $\forall k,m\in\mathbb{R},\,a\in V$.
  • Proprietà di neutralità
  1. Se $1_{\mathbb{R}}*k = k\,\forall k\in\mathbb{R}$, allora deve valere che $1_{\mathbb{R}}*a=a\,\forall a\in V$.

P.S. Ci tengo a sottolineare che le due operazioni $+$ e $*$ non sono necessariamente le classiche addizione e moltiplicazione che siamo abituati a usare con i numeri reali. Si possono definire le più svariate operazioni sullo spazio $V$, purché la terna $(V,+,*)$ soddisfi le proprietà elencate qui sopra 🙂 . D’ora in poi parleremo di spazio vettoriale $V$ per denotare questa terna, quindi si sottintende che esso sia equipaggiata di due operazioni come sopra.

Prodotto scalare

Dato uno spazio vettoriale $V$ possiamo introdurvi un prodotto scalare, che è un’operazione tra elementi $v,w\in V$ che soddisfa alcune proprietà. Vediamo quindi come definirlo:

Un prodotto scalare sullo spazio vettoriale $V$ è un’operazione $\langle\cdot\,,\,\cdot\rangle : V\times V\rightarrow \mathbb{R}$ tale che

  1. $\langle v,v \rangle \geq 0$ per ogni $v\in V$, ovvero è un’operazione definita positiva, in particolare è $=0$ se e solo se $v=0_V$.
  2. Sia simmetrica, ovvero $\langle v,w\rangle = \langle w,v\rangle$ per ogni $v,w\in V$.
  3. Sia bilineare, data la simmetria però basta la linearità rispetto al primo termine:
  • $\langle kv,w \rangle = k\langle v,w\rangle$ per ogni $k\in\mathbb{R}$ e $v,w\in V$.
  • $\langle v+v’,w\rangle = \langle v,w \rangle + \langle v’,w\rangle.$

Si dice il prodotto scalare essere degenere, e quindi non ben definito, se esiste un vettore $w\neq 0$ tale che

$\langle v,w \rangle = 0$ per ogni $v\in V$, ovvero un vettore $w\in V$ perpendicolare a tutti gli altri vettori di $V$.

Infatti il concetto di prodotto scalare, deve essere ricondotto da un punto di vista geometrico al concetto di proiezione ortogonale. In particolare quando si calcola $\langle v,w\rangle$ non si sta altro che cercando la lunghezza della proiezione di $v$ lungo $w$ (o viceversa) rispetto ad una particoalre proiezione.

Questo è un classico esempio dove lo spazio vettoriale usato è $\mathbb{R}^2$ e la proiezione standard, quella basata sul prodotto scalare euclideo.

Un prodotto scalare è in grado di definire una norma, ovvero una nozione di lunghezza, sullo spazio $V$. Per farlo si può semplicemente procedere così: $||v|| = \langle v,v \rangle ^{\frac{1}{2}}$ per ogni $v\in V$. L’idea dietro a questa definizione e di definire la norma come la lunghezza della proiezione di un vettore su se stesso.

Prima di proseguire, vediamo un’importante proprietà che segue da quelle che caratterizzano il prodotto scalare: la disuguaglianza triangolare.

Questa si può esprimere così: $||u+v||\leq ||u|| + ||v||$ per ogni $u,v\in V$. In termini pratici, hai già visto di sicuro questa disuguaglianza quando hai studiato i triangoli. Ricordi infatti che la somma delle lunghezze di due lati è sempre maggiore del terzo singolarmente? Ecco, se ogni lato lo vedi come un vettore tutto torna 😉

Se vuoi approfondire il concetto di prodotto scalare ti consiglio questa pagina: Prodotto scalare.

Proiezione ortogonale

Ci siamo, vediamo l’ultimo concetto per poi passare a parlare sul serio di spazi di Hilbert! 🙂 Se ti è capitato di studiare un minimo la geometria nello spazio euclideo $\mathbb{R}^n$, anche solo in $\mathbb{R}^2$ è sufficiente, certo saprai che in questo spazio è ben definito un prodotto scalare.

In particolare lo possiamo definire come segue presi due vettori $\vec{x},\vec{y}\in\mathbb{R}^n$, dove $\vec{x}=(x_1,x_2,…,x_n)$ mentre $\vec{y}=(y_1,y_2,…,y_n)$:

$\langle (x_1,x_2,…,x_n), (y_1,y_2,…,y_n)\rangle := x_1\cdot y_1 + x_2\cdot y_2 + … +x_n\cdot y_n = \sum_{i=1}^n x_i\cdot y_i.$

Grazie all’esistenza di un prodotto scalare possiamo anche parlare di proiezione ortogonale , che in termini intuitivi si equivale al concetto di ombra. Infatti ti sarai certamente accorto che, nella realtà, quando un oggetto come una matita è posto in posizione inclinata sopra una superficie, con una luce che lo illumina dall’alto, sul tavolo potrai vedere un’ombra. Bene, da un punto di vista matematico quest’ombra si chiama la proiezione ortogonale del vettore matita sul piano del tavolo 😉 .

In alternativa potresti anche proiettare un vettore su un altro vettore, rappresentando il concetto intuitivamente nello stesso modo.

Nell’immagine qui sopra non ho una luce perfettamente sopra la penna, ma il concetto penso sia chiaro. Infatti nonostante la luce venga un po’ in diagonale, abbiamo un ombra sul tavolo. Questa non sarà una proiezione ortogonale ma qualcosa di leggermente diverso, ma non curiamocene visto che non è questo il tema dell’articolo. La foto qui sopra vuole solo essere da immagine per capire ciò di cui stiamo parlando 😉

Per concludere, come si calcola la proiezione ortogonale (che d’ora in poi chiamerò solo con proiezione) di un vettore $v=(v_1,…,v_n)\in\mathbb{R}^n$ su un vettore $w=(w_1,…,w_n)\in\mathbb{R}^n$?

Beh, è molto semplice! Per trovare la lunghezza del vettore di proiezione basta fare il prodotto scalare tra i due vettori, poi basta trovare la direzione lungo la quale si trova $w$ e quindi moltiplicare la lunghezza della proiezione per questo vettore unitario di direzione 😉 Ma vediamo un po’ di conti che sono sicuro che ti chiariranno il concetto. Qui sotto denoteremo con $P_w(v)$ il vettore proiezione ortogonale di $v$ lungo il vettore $w$.

$P_w(v) = \langle v,w\rangle \frac{w}{||w||} = \frac{1}{\sqrt{w_1^2+…+w_n^2}}(w_1,…,w_n) \sum_{i=1}^n v_i\cdot w_i $.

Dove all’inizio vedi il vettore $w’= \frac{w}{||w||} $, intendo il vettore unitario di direzione lungo la quale vive il vettore $w$, infatti ho usato il vettore $w$ è l’ho diviso per la sua norma, così che $||w’||=1$. Chiaramente, visto che stiamo parlando di $\mathbb{R}^n$ mi è venuto naturale spiegarti questi concetti usando norma euclidea e il classico prodotto scalare euclideo, ma si può fare lo stesso discorso con un qualunque prodotto scalare e la relativa norma indotta. Infatti la prima uguaglianza qui sopra vale ancora, poi quando ho esplicitato i conti invece va sostituita la corretta norma e prodotto scalare.

Ci siamo! Ora siamo pronti per addentrarci negli spazi di Hilbert, che sostanzialmente ambiscono a definire questi strumenti su spazi più generali, a dimensione infinita in particolare. Ma non spaventarti, pian piano ti sarà tutto più chiaro.

Ti faccio una doverosa premessa…la parte storica qui sotto nomina parecchi concetti avanzati che provo a spiegarti ma se non li hai mai sentiti immagino sarà di difficile lettura. Per cui se ti interessa sapere cosa si nasconde nella storia dietro il concetto di Spazio di Hilbert ti consiglio di fare un tentativo, magari non capirai tutto ma in linea generale lo sviluppo e le motivazioni dietro questo oggetto matematico ti saranno chiari 🙂

Altrimenti, se al momento non hai voglia di cose difficili o se non ti interessa la parte storica e preferisci aspettare che esca la seconda puntata sulle proprietà e sugli esempi, ci possiamo salutare qui e amici come prima .

Un po’ di storia sugli spazi di Hilbert

Prima dello sviluppo del concetto di spazio di Hilbert, furono ottenute altre generalizzazioni degli spazi Euclidei $\mathbb{R}^n$, che erano note ed utilizzate sia da fisici che matematici. In particolare, l’idea di uno spazio lineare astratto maturò e ricevette sempre più interesse verso la fine del 19° secolo.

Questo spazio a cui si arrivò, era uno spazio i cui elementi potessero essere sommati tra loro e moltiplicati per uno scalare (un numero reale o complesso per esempio) senza però doverli necessariamente associare con il classico vettore geometrico di $\mathbb{R}^n$. Un esempio classico sono gli spazi di matrici, che godono tranquillamente di queste proprietà ma non sono intuitivamente associabili all’immagine di un vettore (in realtà si può fare questa associazione, ma non è necessaria per poter lavorare con le matrici).

Anche altri oggetti studiati dai matematici a cavallo del 20° secolo, in particolare gli spazi di sequenze e gli spazi di funzioni, possono essere naturalmente intesi come spazi lineari (ti ricordo che per spazi lineari, di per sè, intendiamo gli spazi vettoriali di cui abbiamo parlato prima 😉 ).

Le funzioni, per esempio, possono essere sommate tra loro e moltiplicate per una costante, e queste operazioni obbediscono alle classiche proprietà delle operazioni di somma e prodotto per uno scalare che rispettano i vettori nello spazio Euclideo.

Nel primo decennio del 20° secolo, sviluppi paralleli portarono all’introduzione degli spazi di Hilbert. Il primo di questi sviluppi fu l’osservazione, emersa quando David Hilbert e Erhard Schimidt stavano studiando le equazioni integrali (se non ne hai mai vista una ecco qui qualcosa che può esserti utile: equazioni integrali), che due funzioni quadrato sommabili a valori reali, $f$ e $g$, su un intervallo $[a,b]$ (ovvero $f,g:[a,b]\rightarrow\mathbb{R}$), ammettono un prodotto scalare:

$\langle f,g\rangle = \int_a^b f(x)g(x)dx$

che ha tutte le classiche proprietà a cui siamo abituati per il prodotto scalare dei vettori nello spazio $\mathbb{R}^n$ e di cui abbiamo parlato in generale nel paragrafo sopra.

Ah…per non spaventare nessuno, quando scrivo che una funzione è “quadrato sommabile”, intendo che l’integrale del quadrato della funzione è finito:

$\int_a^b f^2(x)dx < +\infty$.

Un esempio di funzione che non è quadrato sommabile è la funzione $f(x)=\frac{1}{\sqrt{x}}$ nell’intervallo $[0,1]$, infatti si ha:

$\int_0^1 \Big(\frac{1}{\sqrt{x}}\Big)^2dx = \int_0^1 \frac{1}{x} dx = \log{1}-\lim_{x\to 0^+} \log{x} = +\infty$.

Giusto per completezza, ti dico che lo spazio delle funzioni che hanno questa proprietà si denota solitamente con $\mathcal{L}^2([a,b])$ ed è uno spazio di Hilbert se equipaggiato del prodotto scalare definito qualche riga più in su.

Schmidt sfruttò le somiglianze tra questo prodotto interno (scalare) con il classico prodotto di $\mathbb{R}^n$ per dimostrare una versione ampliata del teorema spettrale dell’algebra lineare (se non lo conosci qui trovi una bella spiegazione: Teorema spettrale) per ottenere una decomposizione di un operatore della forma:

$f(x)\rightarrow \int_a^b K(x,y)f(y)dy$

con $K$ che è una funzione continua e simmetrica di $x$ ed $y$. Questo operatore è chiamato operatore di Hilbert-Schmidt (questa non tutti la capiranno, ma va bene così: symmetric self-adjoint, smooth compact!)

Il secondo sviluppo che portò alla costruzione della nozione di spazio di Hilbert fu l’integrale di Lebesgue. Questo è un’alternativa all’integrale di Riemann che solitamente si studia ad analisi 1 e che è poi quello che si vede anche in quinta superiore 😉

Questo “nuovo integrale” fu introdotto da Henri Lebesgue nel 1904 e permise di integrare più funzioni, una classe più ampia di funzioni. Questo integrale permise, nel 1907, a Frigyes Riesz e Ernst Sigismund Fischer di dimostrare, indipendentemente, che lo spazio $\mathcal{L}^2$ di cui ti ho parlato prima è uno spazio metrico completo.

La completezza è una proprietà fondamentale di $\mathbb{R}^n$ e questo non fa che aumentare le somiglianze tra gli spazi euclidei e questa nuova tipologia di spazi che questi grandi matematici stavano introducendo. Se non conosci il termine spazio completo ti consiglio di dare una letta qui, è spiegato in modo chiaro: Spazio metrico completo.

Come conseguenza naturale del forte legame tra la geometria dello spazio Euclideo e il risultato di completezza, i risultati del 19° secolo raggiunti da Joseph Fourier (se vuoi qui trovi un articolo che avevo scritto sulla Trasformata di Fourier che è strettamente legata con ciò di cui stiamo parlando), Friedrich Bessel e Marc-Antoine Parseval sulle serie di Fourier, o comunque sulle serie trigonometriche, si generalizzarono a questi spazi più ricchi e “potenti”. Andarono così a costituire la struttura geometrica e analitica del teorema di Riesz-Fischer.

Chiudo questa serie di teoremi importanti con il riferimento a un altro che è obbligatorio citare, il teorema di Rappresentazione di Riesz. Questo, in linea pratica, dice che ogni funzione lineare

$L(\alpha v + w) = \alpha L(v) + L(w)$, $\forall \alpha\in\mathbb{R}$ o $\mathbb{C}$ e $\forall v,w\in H$

e continua definita da uno spazio di Hilbert a $\mathbb{C}$ oppure $\mathbb{R}$ (a seconda del campo su cui $H$ è spazio vettoriale), che in gergo è chiamato funzionale lineare a continuo $L:H\rightarrow \mathbb{R}\,(L\in H’)$, può essere associata ad uno ed un solo elemento $v_L$ dello spazio di Hilbert, in modo che applicare la funzione $L$ ad un vettore $w\in H$ equivale a moltiplicare questo vettore $w$ per il rappresentante $v_L$:

$L(w) = \langle v_L,w \rangle$ per ogni $w\in H$.

Se ci pensi, è un po’ come la matrice associata univocamente ad ogni funzione lineare che si vede in algebra lineare (se non conosci questo risultato, qui trovi una spiegazione molto chiara : Matrice associata a un’applicazione lineare) , solo che qui va richiesta la continuità perché, su spazi a dimensione infinita, si possono costruire funzioni lineari ma non continue 😉 .

Bene, prima di passare alle motivazioni fisiche dello sviluppo della teoria sugli spazi di Hilbert, ci tengo a dirti che quest’ultimo teorema fu dimostrato in via indipendente da Maurice Fréchet e Frigyes Riesz nel 1907.

Ah..un’ultima cosa! Ma chi ha introdotto il termine SPAZIO DI HILBERT? Il colpevole è John von Neumann, che coniò il termine spazio di Hilbert astratto nel suo lavoro sugli operatori Hermitiani illimitati. Von Neumann fu di per sé il primo a fornire una trattazione completa e assiomatica di questi spazi, prima di lui i matematici li utilizzavano ma più per interesse fisico.

Ma quindi servono a qualcosa questi spazi? Sono usati per la fisica? Proprio così, la motivazione principale che portò alla formalizzazione di questi spazi fu il fornire una struttura matematica alla meccanica quantistica. Infatti gli stati in un sistema quantistico sono vettori in un certo spazio di Hilbert.

Ma non mi dilungo oltre su questo tema, dato che Gianluca sta trattando proprio questi aspetti nei suoi articoli! Il primo lo trovi qui: https://www.mathone.it/meccanica-quantistica-1/

P.S. Questa parte storica l’ho tradotta e rielaborata a partire dalla pagina inglese di Wikipedia, che se vuoi più dettagli puoi trovare qui: Wikipedia – Hilbert Spaces

Conclusione

Perfetto, con questa parte storica direi che può dirsi conclusa una prima panoramica su questi strani oggetti, gli spazi di Hilbert. Se hai notato nel corso dell’articolo ho disseminato link per tuoi eventuali approfondimenti, perché come mi piace dire spesso, qui sul blog non abbiamo l’obiettivo di insegnare nulla ma solamente di incuriosire e dare gli strumenti per approfondire 😉

Detto ciò, se può interessarti qui sotto trovi un video davvero molto chiaro sugli spazi vettoriali astratti (è inglese) e il link a un libro di testo in cui si parla anche di questo argomento (più in generale di analisi funzionale) che magari può interessarti. Inoltre ti ricordo che questa è solo la prima puntata di due e tre che farò sugli spazi di Hilbert, quindi ti aspetto per le prossime 😉 !

Il libro che ti voglio suggerirti è un classico dell’analisi funzionale e lo trovi qui: Functional Analysis, Sobolev Spaces and Partial Differential Equations .

Il video invece è questo: