Spazio di Hilbert (PARTE 1) : concetti base e cenni storici

Magari ti è già capitato di sentire nominare Hilbert, ma a meno che tu non abbia già seguito un corso di analisi funzionale o qualcosa di analogo, probabilmente non sai cosa sia uno spazio di Hilbert.

Andremo quindi alla scoperta di questi particolari spazi, vedendone un po’ di storia, una caratterizzazione formale e rigorosa, le principali proprietà, alcuni esempi e per finire introdurremo l’importante concetto di Serie di Fourier generalizzata parlando di proiezioni.

In questo articolo lascerò da parte gli ultimi tre punti di questa lista, “limitandomi” quindi a introdurre alcuni concetti base e a fare un preambolo storico, perché altrimenti verrebbe troppo lungo. Termineremo quindi questo percorso alla scoperta degli spazi di Hilbert in un secondo episodio che scriverò tra non molto. Se vedo che sarebbe troppo lungo anche il secondo non si sa mai che lo spezzi in un ulteriore terzo, tanto di cose da dire ce ne sarebbero una marea 😉

Di strada da fare quindi ne abbiamo parecchia, ma cercherò di renderla il più scorrevole e piacevole possibile quindi, cosa stiamo aspettando?! Iniziamo con il succo dell’articolo!

Spazio di Hilbert

Prima di iniziare ti lascio una piccola legenda della notazione matematica che userò, e che è usata classicamente, per rendere il testo più scorrevole (nel caso tu non ci fossi già abituato):

  • $v\in V$ vuol dire che l’elemento $v$ appartiene all’insieme $V$
  • $\exists x\in X$ significa che esiste una $x$ nell’insieme $X$
  • $\forall x\in X$ sta ad indicare per ogni $x$ dell’insieme $X$.

Definizioni e concetti base che useremo per scoprire gli spazi di Hilbert

Per poter parlare di spazi di Hilbert, è necessario che alcuni concetti siano noti, vediamo quindi di sintetizzarli in questo paragrafo 😉 . Non voglio fare sbrodoloni inutili in questa sezione, per cui tutte queste nozioni sono organizzate qui sotto in maniera sintetica ma più che sufficiente per capire il seguito dell’articolo e soprattutto le prossime puntate.

Spazio vettoriale su $\mathbb{R}$

Diciamo spazio vettoriale rispetto al campo $\mathbb{R}$ un insieme $V$, i cui elementi saranno chiamati vettori, equipaggiato di due operazioni

$+ : V\times V\rightarrow V$ e $* : \mathbb{R}\times V \rightarrow V$ tali che soddisfino le seguenti proprietà:

  • $(V,+)$ è un gruppo abeliano, ovvero:
  1. Esiste un elemento neutro $0_V$ rispetto a $+$, quindi esiste $0_V$ tale che $a+0_V=a\,\forall a\in V$.
  2. Esiste un elemento inverso rispetto a $+$, quindi esiste un $\bar{a}$ tale che $a+\bar{a}=0_V\,\forall a\in V$.
  3. L’operazione $+$ è associativa, ovvero $(a+b)+c=a+(b+c)$, $\forall a,b,c\in V$.
  4. Vale la proprietà commutativa (perché è abeliano): $a+b=b+a$, $\forall a,b\in V$.
  • Vale la proprietà distributiva tra $*$ e $+$:
  1. $k*(a+b) = k*a + k*b$, $\forall a,b\in V,\,k\in\mathbb{R}$.
  2. $(k+m)*a = k*a + m*a$, $\forall k,m\in\mathbb{R},\,a\in V$.
  • Proprietà di neutralità
  1. Se $1_{\mathbb{R}}*k = k\,\forall k\in\mathbb{R}$, allora deve valere che $1_{\mathbb{R}}*a=a\,\forall a\in V$.

P.S. Ci tengo a sottolineare che le due operazioni $+$ e $*$ non sono necessariamente le classiche addizione e moltiplicazione che siamo abituati a usare con i numeri reali. Si possono definire le più svariate operazioni sullo spazio $V$, purché la terna $(V,+,*)$ soddisfi le proprietà elencate qui sopra 🙂 . D’ora in poi parleremo di spazio vettoriale $V$ per denotare questa terna, quindi si sottintende che esso sia equipaggiata di due operazioni come sopra.

Prodotto scalare

Dato uno spazio vettoriale $V$ possiamo introdurvi un prodotto scalare, che è un’operazione tra elementi $v,w\in V$ che soddisfa alcune proprietà. Vediamo quindi come definirlo:

Un prodotto scalare sullo spazio vettoriale $V$ è un’operazione $\langle\cdot\,,\,\cdot\rangle : V\times V\rightarrow \mathbb{R}$ tale che

  1. $\langle v,v \rangle \geq 0$ per ogni $v\in V$, ovvero è un’operazione definita positiva, in particolare è $=0$ se e solo se $v=0_V$.
  2. Sia simmetrica, ovvero $\langle v,w\rangle = \langle w,v\rangle$ per ogni $v,w\in V$.
  3. Sia bilineare, data la simmetria però basta la linearità rispetto al primo termine:
  • $\langle kv,w \rangle = k\langle v,w\rangle$ per ogni $k\in\mathbb{R}$ e $v,w\in V$.
  • $\langle v+v’,w\rangle = \langle v,w \rangle + \langle v’,w\rangle.$

Si dice il prodotto scalare essere degenere, e quindi non ben definito, se esiste un vettore $w\neq 0$ tale che

$\langle v,w \rangle = 0$ per ogni $v\in V$, ovvero un vettore $w\in V$ perpendicolare a tutti gli altri vettori di $V$.

Infatti il concetto di prodotto scalare, deve essere ricondotto da un punto di vista geometrico al concetto di proiezione ortogonale. In particolare quando si calcola $\langle v,w\rangle$ non si sta altro che cercando la lunghezza della proiezione di $v$ lungo $w$ (o viceversa) rispetto ad una particoalre proiezione.

Questo è un classico esempio dove lo spazio vettoriale usato è $\mathbb{R}^2$ e la proiezione standard, quella basata sul prodotto scalare euclideo.

Un prodotto scalare è in grado di definire una norma, ovvero una nozione di lunghezza, sullo spazio $V$. Per farlo si può semplicemente procedere così: $||v|| = \langle v,v \rangle ^{\frac{1}{2}}$ per ogni $v\in V$. L’idea dietro a questa definizione e di definire la norma come la lunghezza della proiezione di un vettore su se stesso.

Prima di proseguire, vediamo un’importante proprietà che segue da quelle che caratterizzano il prodotto scalare: la disuguaglianza triangolare.

Questa si può esprimere così: $||u+v||\leq ||u|| + ||v||$ per ogni $u,v\in V$. In termini pratici, hai già visto di sicuro questa disuguaglianza quando hai studiato i triangoli. Ricordi infatti che la somma delle lunghezze di due lati è sempre maggiore del terzo singolarmente? Ecco, se ogni lato lo vedi come un vettore tutto torna 😉

Se vuoi approfondire il concetto di prodotto scalare ti consiglio questa pagina: Prodotto scalare.

Proiezione ortogonale

Ci siamo, vediamo l’ultimo concetto per poi passare a parlare sul serio di spazi di Hilbert! 🙂 Se ti è capitato di studiare un minimo la geometria nello spazio euclideo $\mathbb{R}^n$, anche solo in $\mathbb{R}^2$ è sufficiente, certo saprai che in questo spazio è ben definito un prodotto scalare.

In particolare lo possiamo definire come segue presi due vettori $\vec{x},\vec{y}\in\mathbb{R}^n$, dove $\vec{x}=(x_1,x_2,…,x_n)$ mentre $\vec{y}=(y_1,y_2,…,y_n)$:

$\langle (x_1,x_2,…,x_n), (y_1,y_2,…,y_n)\rangle := x_1\cdot y_1 + x_2\cdot y_2 + … +x_n\cdot y_n = \sum_{i=1}^n x_i\cdot y_i.$

Grazie all’esistenza di un prodotto scalare possiamo anche parlare di proiezione ortogonale , che in termini intuitivi si equivale al concetto di ombra. Infatti ti sarai certamente accorto che, nella realtà, quando un oggetto come una matita è posto in posizione inclinata sopra una superficie, con una luce che lo illumina dall’alto, sul tavolo potrai vedere un’ombra. Bene, da un punto di vista matematico quest’ombra si chiama la proiezione ortogonale del vettore matita sul piano del tavolo 😉 .

In alternativa potresti anche proiettare un vettore su un altro vettore, rappresentando il concetto intuitivamente nello stesso modo.

Proiezione ortogonale

Nell’immagine qui sopra non ho una luce perfettamente sopra la penna, ma il concetto penso sia chiaro. Infatti nonostante la luce venga un po’ in diagonale, abbiamo un ombra sul tavolo. Questa non sarà una proiezione ortogonale ma qualcosa di leggermente diverso, ma non curiamocene visto che non è questo il tema dell’articolo. La foto qui sopra vuole solo essere da immagine per capire ciò di cui stiamo parlando 😉

Per concludere, come si calcola la proiezione ortogonale (che d’ora in poi chiamerò solo con proiezione) di un vettore $v=(v_1,…,v_n)\in\mathbb{R}^n$ su un vettore $w=(w_1,…,w_n)\in\mathbb{R}^n$?

Beh, è molto semplice! Per trovare la lunghezza del vettore di proiezione basta fare il prodotto scalare tra i due vettori, poi basta trovare la direzione lungo la quale si trova $w$ e quindi moltiplicare la lunghezza della proiezione per questo vettore unitario di direzione 😉 Ma vediamo un po’ di conti che sono sicuro che ti chiariranno il concetto. Qui sotto denoteremo con $P_w(v)$ il vettore proiezione ortogonale di $v$ lungo il vettore $w$.

$P_w(v) = \langle v,w\rangle \frac{w}{||w||} = \frac{1}{\sqrt{w_1^2+…+w_n^2}}(w_1,…,w_n) \sum_{i=1}^n v_i\cdot w_i $.

Dove all’inizio vedi il vettore $w’= \frac{w}{||w||} $, intendo il vettore unitario di direzione lungo la quale vive il vettore $w$, infatti ho usato il vettore $w$ è l’ho diviso per la sua norma, così che $||w’||=1$. Chiaramente, visto che stiamo parlando di $\mathbb{R}^n$ mi è venuto naturale spiegarti questi concetti usando norma euclidea e il classico prodotto scalare euclideo, ma si può fare lo stesso discorso con un qualunque prodotto scalare e la relativa norma indotta. Infatti la prima uguaglianza qui sopra vale ancora, poi quando ho esplicitato i conti invece va sostituita la corretta norma e prodotto scalare.

Ci siamo! Ora siamo pronti per addentrarci negli spazi di Hilbert, che sostanzialmente ambiscono a definire questi strumenti su spazi più generali, a dimensione infinita in particolare. Ma non spaventarti, pian piano ti sarà tutto più chiaro.

Ti faccio una doverosa premessa…la parte storica qui sotto nomina parecchi concetti avanzati che provo a spiegarti ma se non li hai mai sentiti immagino sarà di difficile lettura. Per cui se ti interessa sapere cosa si nasconde nella storia dietro il concetto di Spazio di Hilbert ti consiglio di fare un tentativo, magari non capirai tutto ma in linea generale lo sviluppo e le motivazioni dietro questo oggetto matematico ti saranno chiari 🙂

Altrimenti, se al momento non hai voglia di cose difficili o se non ti interessa la parte storica e preferisci aspettare che esca la seconda puntata sulle proprietà e sugli esempi, ci possiamo salutare qui e amici come prima 😎 .

Un po’ di storia sugli spazi di Hilbert

Prima dello sviluppo del concetto di spazio di Hilbert, furono ottenute altre generalizzazioni degli spazi Euclidei $\mathbb{R}^n$, che erano note ed utilizzate sia da fisici che matematici. In particolare, l’idea di uno spazio lineare astratto maturò e ricevette sempre più interesse verso la fine del 19° secolo.

Questo spazio a cui si arrivò, era uno spazio i cui elementi potessero essere sommati tra loro e moltiplicati per uno scalare (un numero reale o complesso per esempio) senza però doverli necessariamente associare con il classico vettore geometrico di $\mathbb{R}^n$. Un esempio classico sono gli spazi di matrici, che godono tranquillamente di queste proprietà ma non sono intuitivamente associabili all’immagine di un vettore (in realtà si può fare questa associazione, ma non è necessaria per poter lavorare con le matrici).

Anche altri oggetti studiati dai matematici a cavallo del 20° secolo, in particolare gli spazi di sequenze e gli spazi di funzioni, possono essere naturalmente intesi come spazi lineari (ti ricordo che per spazi lineari, di per sè, intendiamo gli spazi vettoriali di cui abbiamo parlato prima 😉 ).

Le funzioni, per esempio, possono essere sommate tra loro e moltiplicate per una costante, e queste operazioni obbediscono alle classiche proprietà delle operazioni di somma e prodotto per uno scalare che rispettano i vettori nello spazio Euclideo.

Nel primo decennio del 20° secolo, sviluppi paralleli portarono all’introduzione degli spazi di Hilbert. Il primo di questi sviluppi fu l’osservazione, emersa quando David Hilbert e Erhard Schimidt stavano studiando le equazioni integrali (se non ne hai mai vista una ecco qui qualcosa che può esserti utile: equazioni integrali), che due funzioni quadrato sommabili a valori reali, $f$ e $g$, su un intervallo $[a,b]$ (ovvero $f,g:[a,b]\rightarrow\mathbb{R}$), ammettono un prodotto scalare:

$\langle f,g\rangle = \int_a^b f(x)g(x)dx$

che ha tutte le classiche proprietà a cui siamo abituati per il prodotto scalare dei vettori nello spazio $\mathbb{R}^n$ e di cui abbiamo parlato in generale nel paragrafo sopra.

Ah…per non spaventare nessuno, quando scrivo che una funzione è “quadrato sommabile”, intendo che l’integrale del quadrato della funzione è finito:

$\int_a^b f^2(x)dx < +\infty$.

Un esempio di funzione che non è quadrato sommabile è la funzione $f(x)=\frac{1}{\sqrt{x}}$ nell’intervallo $[0,1]$, infatti si ha:

$\int_0^1 \Big(\frac{1}{\sqrt{x}}\Big)^2dx = \int_0^1 \frac{1}{x} dx = \log{1}-\lim_{x\to 0^+} \log{x} = +\infty$.

Giusto per completezza, ti dico che lo spazio delle funzioni che hanno questa proprietà si denota solitamente con $\mathcal{L}^2([a,b])$ ed è uno spazio di Hilbert se equipaggiato del prodotto scalare definito qualche riga più in su.

Schmidt sfruttò le somiglianze tra questo prodotto interno (scalare) con il classico prodotto di $\mathbb{R}^n$ per dimostrare una versione ampliata del teorema spettrale dell’algebra lineare (se non lo conosci qui trovi una bella spiegazione: Teorema spettrale) per ottenere una decomposizione di un operatore della forma:

$f(x)\rightarrow \int_a^b K(x,y)f(y)dy$

con $K$ che è una funzione continua e simmetrica di $x$ ed $y$. Questo operatore è chiamato operatore di Hilbert-Schmidt 😎 (questa non tutti la capiranno, ma va bene così: symmetric 👉🏼 self-adjoint, smooth 👉🏼 compact!)

Il secondo sviluppo che portò alla costruzione della nozione di spazio di Hilbert fu l’integrale di Lebesgue. Questo è un’alternativa all’integrale di Riemann che solitamente si studia ad analisi 1 e che è poi quello che si vede anche in quinta superiore 😉

Questo “nuovo integrale” fu introdotto da Henri Lebesgue nel 1904 e permise di integrare più funzioni, una classe più ampia di funzioni. Questo integrale permise, nel 1907, a Frigyes Riesz e Ernst Sigismund Fischer di dimostrare, indipendentemente, che lo spazio $\mathcal{L}^2$ di cui ti ho parlato prima è uno spazio metrico completo.

La completezza è una proprietà fondamentale di $\mathbb{R}^n$ e questo non fa che aumentare le somiglianze tra gli spazi euclidei e questa nuova tipologia di spazi che questi grandi matematici stavano introducendo. Se non conosci il termine spazio completo ti consiglio di dare una letta qui, è spiegato in modo chiaro: Spazio metrico completo.

Come conseguenza naturale del forte legame tra la geometria dello spazio Euclideo e il risultato di completezza, i risultati del 19° secolo raggiunti da Joseph Fourier (se vuoi qui trovi un articolo che avevo scritto sulla Trasformata di Fourier che è strettamente legata con ciò di cui stiamo parlando), Friedrich Bessel e Marc-Antoine Parseval sulle serie di Fourier, o comunque sulle serie trigonometriche, si generalizzarono a questi spazi più ricchi e “potenti”. Andarono così a costituire la struttura geometrica e analitica del teorema di Riesz-Fischer.

Chiudo questa serie di teoremi importanti con il riferimento a un altro che è obbligatorio citare, il teorema di Rappresentazione di Riesz. Questo, in linea pratica, dice che ogni funzione lineare

$L(\alpha v + w) = \alpha L(v) + L(w)$, $\forall \alpha\in\mathbb{R}$ o $\mathbb{C}$ e $\forall v,w\in H$

e continua definita da uno spazio di Hilbert a $\mathbb{C}$ oppure $\mathbb{R}$ (a seconda del campo su cui $H$ è spazio vettoriale), che in gergo è chiamato funzionale lineare a continuo $L:H\rightarrow \mathbb{R}\,(L\in H’)$, può essere associata ad uno ed un solo elemento $v_L$ dello spazio di Hilbert, in modo che applicare la funzione $L$ ad un vettore $w\in H$ equivale a moltiplicare questo vettore $w$ per il rappresentante $v_L$:

$L(w) = \langle v_L,w \rangle$ per ogni $w\in H$.

Se ci pensi, è un po’ come la matrice associata univocamente ad ogni funzione lineare che si vede in algebra lineare (se non conosci questo risultato, qui trovi una spiegazione molto chiara : Matrice associata a un’applicazione lineare) , solo che qui va richiesta la continuità perché, su spazi a dimensione infinita, si possono costruire funzioni lineari ma non continue 😉 .

Bene, prima di passare alle motivazioni fisiche dello sviluppo della teoria sugli spazi di Hilbert, ci tengo a dirti che quest’ultimo teorema fu dimostrato in via indipendente da Maurice Fréchet e Frigyes Riesz nel 1907.

Ah..un’ultima cosa! Ma chi ha introdotto il termine SPAZIO DI HILBERT? Il colpevole è John von Neumann, che coniò il termine spazio di Hilbert astratto nel suo lavoro sugli operatori Hermitiani illimitati. Von Neumann fu di per sé il primo a fornire una trattazione completa e assiomatica di questi spazi, prima di lui i matematici li utilizzavano ma più per interesse fisico.

Ma quindi servono a qualcosa questi spazi? Sono usati per la fisica? Proprio così, la motivazione principale che portò alla formalizzazione di questi spazi fu il fornire una struttura matematica alla meccanica quantistica. Infatti gli stati in un sistema quantistico sono vettori in un certo spazio di Hilbert.

Ma non mi dilungo oltre su questo tema, dato che Gianluca sta trattando proprio questi aspetti nei suoi articoli! Il primo lo trovi qui: https://www.mathone.it/meccanica-quantistica-1/

P.S. Questa parte storica l’ho tradotta e rielaborata a partire dalla pagina inglese di Wikipedia, che se vuoi più dettagli puoi trovare qui: Wikipedia – Hilbert Spaces

Conclusione

Perfetto, con questa parte storica direi che può dirsi conclusa una prima panoramica su questi strani oggetti, gli spazi di Hilbert. Se hai notato nel corso dell’articolo ho disseminato link per tuoi eventuali approfondimenti, perché come mi piace dire spesso, qui sul blog non abbiamo l’obiettivo di insegnare nulla ma solamente di incuriosire e dare gli strumenti per approfondire 😉

Detto ciò, se può interessarti qui sotto trovi un video davvero molto chiaro sugli spazi vettoriali astratti (è inglese) e il link a un libro di testo in cui si parla anche di questo argomento (più in generale di analisi funzionale) che magari può interessarti. Inoltre ti ricordo che questa è solo la prima puntata di due e tre che farò sugli spazi di Hilbert, quindi ti aspetto per le prossime 😉 !

Il libro che ti voglio suggerirti è un classico dell’analisi funzionale e lo trovi qui: Functional Analysis, Sobolev Spaces and Partial Differential Equations .

Il video invece è questo:

Cosa ne pensi dell'articolo?

Questo sito usa Akismet per ridurre lo spam. Scopri come i tuoi dati vengono elaborati.

    • Thanks, yes it is not an easy topic, I’ve tried to focus just on an introduction here and go through more specific topics in the following ones.