22/09/19

Come un paradosso diventò un teorema 1/2 ***

Indice di tutti gli articoli di Umberto presenti in archivio-Matematica

 

Premessa

In questi  (presumibilmente due) articoli parleremo dei fondamenti delle moderne teorie degli insiemi. Ogni branca della matematica possiede il suo linguaggio. Il linguaggio delle teorie degli insiemi è quello della logica matematica; connettivi logici;proposizioni, predicati, enunciati e proprietà che hanno solo due possibili valori: vero o falso. Noi semplificheremo il tutto, perchè in questo primo approccio considereremo solo delle proprietà particolari, senza introdurre tutta la teoria dei connettivi logici e dei predicati, ma solo accennando ad essi. Non tratteremo tutti gli assiomi delle teorie; il nostro scopo sarà capire quali assiomi abbiano evitato i paradossi della teoria "ingenua degli insiemi" introdotta da  Cantor e Frege, primo fra tutti il paradosso di Russel.

Gli elementi del nostro discorso saranno  gli insiemi; tratteremo  insiemi che a loro volta saranno fatti di insiemi ecc, ecc. Questi insiemi si dicono ereditari. Non tratteremo l'insieme delle parole scritte in questo articolo, o l'insieme delle persone che stanno in una data città.  Semplificheremo la scrittura(A,B)_{\in} che è una relazione binaria fra due insiemi, con il simbolo \in; mentre indicheremo con \notin la sua negazione. Dopodichè tutti sappiamo che la scrittura \dpi{100} A\in B significa A appartiene a B.

Proposizioni , predicati, proprietà.

Una proposizione logica (o enunciato) è un’espressione linguistica per la quale si possa stabilire con oggettività se essa è vera oppure è falsa.

Intendiamo dunque espressioni di questo tipo:

3<10 (vero)

4=3 (falso)

che possono assumere due soli valori, vero o falso, che indichiamo più semplicemente con 0,1. Ma non possono assumere entrambi i valori (principio di non contraddizione).

x<10 è un proposizione che dipende da un parametro (x) e prende il nome di predicato.

Indicheremo con A, B le proposizioni, e con P(x),Q(x) i predicati che dipendono da un parametro.

Connettivi logici

I connettivi logici servono per costruire i predicati formalmente, senza usare espressioni linguistiche, che possono dare adito ad ambiguità. Con le loro combinazioni con delle variabili  possiamo costruire predicati complessi. Siano A,B delle proposizioni. Introduciamo ora i connettivi più noti:

{\ displaystyle \ neg} :negazione;  {\ displaystyle \ neg} A significa "non A"

{\ displaystyle \ land} : and : A  {\ displaystyle \ land} B significa A e B

{\displaystyle \lor }:or:      A {\displaystyle \lor } B significa  A o B

\dpi{120} \rightarrow: implicazione;   A \dpi{120} \rightarrow  B significa " se A, allora B"

\dpi{120} \leftrightarrow ; doppia implicazione, A \dpi{120} \leftrightarrow B significa "A se e solo se B"

Per analizzare il significato dei connettivi, è necessario usare le cosiddette "tavole di verità", che furono introdotte dal matematico Ludwig Josef Johann Wittgenstein. Per chi vuole approfondire:

I quantificatori

Sono dei particolari connettivi che indicano per l' appunto per quanti elementi vale una certo predicato P(x).

Se scriviamo :

{\displaystyle \exists }xP(x)

significa che esiste almeno un elemento, chiamiamolo a, per cui è vera la  proposizione P(x).

se invece scriviamo:

{\displaystyle \forall }xP(x)

ci dice che per ogni elemento   del dominio del discorso vale P(a).

Proprietà

Useremo il termine proprietà come sinonimo di predicato, riferendolo principalmente a predicati ad un solo argomento.

Per proprietà intendiamo quindi qualsiasi predicato che si possa esprimere (rispettando la sintassi) usando l'appartenenza (\dpi{100} \in) l'uguaglianza , le variabili, e gli usuali connettivi logici, i quantificatori, dove le variabili variano su insiemi.

russel
Una proprietà P o Q  si ottiene mescolando i simboli che appaiono nell'immagine rispettando opportune regole formali.

La crisi generata da Russel.

Nel 1901 Un lord Inglese Filosofo e matematico,Bertrand Russel,  mise in crisi il tentativo di Frege di definire le basi della matematica partendo dalla logica pura, con un paradosso arcinoto a tutti. Tale paradosso era dovuto al fatto che la teoria "ingenua" ovvero intuitiva degli insiemi non era ben fondata. Questo destò grande preoccupazione nel mondo della matematica; se gli insiemi sono alla base della matematica e sono non consistenti, allora tutta la matematica potrebbe essere non consistente, ovvero contraddittoria, e si temette anche per la teoria di Cantor. Ma vediamo  perchè successe tutto ciò.

Il paradosso di Russel

Nella teoria ingenua degli insiemi ci sono sostanzialmente due modi per definire un insieme. Uno è quello di elencare direttamente i suoi elementi, come ad esempio:

A={-1,1}

oppure di esplicitare una qualche proprietà(un predicato unario) che descriva (cioè tale che sia soddisfatta da) tutti e soli gli elementi dell'insieme che vogliamo definire.  Per esempio A può essere definito come:

A={i numeri interi tali che il loro quadrato sia uguale a 1}

Frege definiva gli insiemi proprio così, in modo che fossero generati da una qualche proprietà "valida". Quindi indicava semplicemente un insieme in questo modo:

A={x: \phi(x)} (che si legge:tutti gli x per cui vale la proprietà \phi(x)) (si chiama  assioma di comprensione)

dove \phi(x) è una certa proprietà. Questo modo di definire gli insiemi si rilevò un po' troppo liberale.

Se prendiamo per buono il fatto che un insieme possa  appartenere o   non appartenere a se stesso(si cita spesso l'esempio dei numeri naturali N; l'insieme N non è un numero naturale, quindi non appartiene a se stesso,se invece V è l'insieme di tutte le cose pensate, allora V appartiene a V, essendo esso stesso una cosa pensata) possiamo definire l'insieme:

R=\begin{Bmatrix} x: x \notin x \end{Bmatrix}.

Essendo R un insieme (secondo la definizione di Frege), o R \in R oppure R\notin R.

se  R \in R allora  R\notin R

(R appartiene a sé stesso;Quindi R soddisfa la definizione;Quindi R è uno degli "insiemi che non appartengono a sé stessi";Quindi R non appartiene a sé stesso, il che contraddice il primo enunciato.)

mentre se R\notin R allora R \in R

(R non appartiene a sé stesso;Quindi R non soddisfa la definizione;Quindi R non è uno degli "insiemi che non appartengono a sé stessi";Quindi R è un insieme che appartiene a sé stesso.)

QuindiR \in R se e solo se  R\notin R. Ma questa è evidentemente una contraddizione. Quindi R non può essere un insieme. Questo è proprio il paradosso di Russel. Tale paradosso afferma che non ogni proprietà definisce un insieme.

(il paradosso di Russel è una cosa diversa dall'antinomia di Russel, quella del barbiere, che è solo una versione popolare del paradosso, ma in qualche modo aggirabile, come affermò lo stesso Russel). Chi comunque vuole approfondire:

Paradosso dei barbiere. Il barbiere rade tutti gli uomini del villaggio che non radono se stessi. Chi rade il barbiere?

Detto più precisamente:

il barbiere è un uomo abitante del villaggio che rade tutti gli uomini del villaggio che non radono se stessi." Qui, il trabocchetto è  che, essendo abituati alla sua figura reale, siamo condizionati a pensare al barbiere come esistente.

Questa definizione di barbiere è contraddittoria,  non può cioè essere soddisfatta da alcun abitante uomo del villaggio.

Per chi ha approfondito la parte sui connettivi logici, potremmo esprimere formalmente il paradosso in questo modo:

Supponiamo che V sia l'insieme degli abitanti del villaggio, e R una relazione fra tali abitanti aRb che si esprime linguisticamente come " a rade b"; cerchiamo un abitante x che rada quelli che non si radono da soli.

\dpi{100} \exists x \forall a:(\neg(aRa)\rightarrow xRa)  1)

qui si vede ancora meglio che tale x non esiste. Infatti  se esistesse un x che soddisfa la 1) , essa varrebbe in particolare per a=x ma non è possibile che  \dpi{100} (\neg(xRx)\rightarrow xRx) .

Il paradosso del barbiere, pur  avendo affinità col vero paradosso di Russel, è sostanzialmente diverso;Nel caso del barbiere, la relazione che interviene come nella (1) è definita su un insieme ben fondato e definito per altre vie (quello degli uomini del villaggio ) mentre nel paradosso di Russell, semplificando molto, essa fa parte della definizione stessa di insieme, cioè degli oggetti sui quali si applica.

Fu in questo contesto (paradosso di Russel)  che Hilbert pronunciò la storica frase "Nessuno riuscirà a cacciarci dal Paradiso che Cantor ha creato per noi." .Hilbert ebbe un’idea geniale: non riformare la logica, ma usarla solo per tradurre in formule tutti i ragionamenti matematici.A  questo punto si rese necessario assiomatizzare gli insiemi in modo di evitare contraddizioni come quella appena esposta.

Tre modi diversi di assiomatizzare gli insiemi.

Esistono tre principali assiomatizzazioni della teoria degli insiemi, che sono molto simili: la teoria di Zermelo-Fraenkel (ZF), la teoriadi Godel-Bernays (GB) (anche detta teoria NBG di von Neumann, Bernays e Godel), e la teoria di Morse-Kelley (MK). Noi seguiremo principalmente le idee esposte in ZF e  GB, nel modo più intuitivo possibile.

Si tratta di soluzioni pratiche: si pongono degli assiomi che impediscono (almeno si spera) la costruzione di entità paradossali. Si  riesce fortunatamente a far ciò senza al contempo impedire la costruzione di tutte quelle entità che servono ai matematici.

La concezione moderna di una teoria assiomatica

Fu Hilbert il primo ad affrontare l'assiomatizzazione di una teoria, ponendosi il problema di dare un fondamento assiomatico rigoroso alla geometria, ossia di descrivere la geometria euclidea senza lasciare nessun assioma inespresso.

Una teoria assiomatica moderna deve contenere:

Termini primitivi, cioè concetti o relazioni che non vengono definiti, ma sono usati per definire altri concetti e relazioni.
Termini definiti, cioè concetti e relazioni che vengono definiti combinando direttamente i termini primitivi o termini già definiti.
 Postulati o assiomi, cioè proposizioni che non vengono dimostrate, per libera scelta dell’autore, ma che poste a fondamento per la dimostrazione di altre proposizioni.
 Teoremi, cioè proposizioni che vengono dimostrate utilizzando i postulati o altri teoremi già dimostrati.
Hilbert amava dire che i concetti di punto, retta e piano potevano essere sostituiti da «tavoli, sedie, boccali di birra», se tra questi si definivano le necessarie relazioni in modo che gli assiomi diventassero veri. Altri condividevano questa visione e da allora il metodo assiomatico definisce la matematica.

Come Zermelo e Fraenkel  evitarono il paradosso di Russel.

Parliamo  degli assiomi  che riguardano gli insiemi. Intanto non definiremo in alcun modo un insieme. L'insieme è un concetto che in matematica è detto "primitivo"; la frase "un insieme è  una collezione di elementi" non è una definizione , in quanto rimanda la definizione di insieme a quella di collezione. Non definiremo nemmeno la nozione di appartenenza \in (anch'essa un concetto primitivo). Useremo poi l'abbreviazione \notin per dire \neg \in,ossia la negazione logica dell'appartenenza. Sappiamo solo che la relazione di appartenenza è una relazione binaria fra insiemi.

Vediamo adesso due assiomi della teoria ZF che ci permetteranno di capire il modo per evitare i paradossi.

Assioma 1. Estensionalità:

comunque dati due insiemi, se essi hanno gli stessi elementi, allora sono uguali.

un insieme è determinato dagli insiemi che gli appartengono (atteggiamento estensionale), e non anche da come esso è stato "pensato" (atteggiamento intensionale).

Assioma 2 (Schema di Separazione).

Sia \phi(x) una proprietà, e sia A un insieme. Allora anche:

\begin{Bmatrix} x\in A : \phi(x) \end{Bmatrix}

è un insieme. Vediamo subito che la differenza fra la definizione data da Frege ({x: \phi(x)}) consiste nel fatto che l'insieme x viene preso già da un insieme, mentre  nella definizione di Frege non veniva specificata la provenienza. Tramite la proprietà  \dpi{100} \phi(x) si effettua una separazione sull'insieme A, ovvero se ne prende una parte che soddisfa tale proprietà.

Pensiamo adesso all "insieme di tutti gli insiemi", ovvero un insieme V tale che x \dpi{100} \in V per qualsiasi x.

Se V fosse un insieme, potremmo definire R=\begin{Bmatrix} x\in V: x \notin x \end{Bmatrix}=\begin{Bmatrix} x: x \notin x \end{Bmatrix} usando lo schema di separazione su V  e ricadremmo nel paradosso di Russel. Il paradosso diventa allora un teorema*:

Non esiste l'insieme di tutti gli insiemi

Questo ci dice che non tutte le proprietà generano degli insiemi; ma allora collezioni  come R e V cosa sono? Prendono il nome di classi proprie.

In ZFC non possiamo che accennare a questo, ma vedremo che invece in GB si sviluppa una apposita teoria per le classi. Nel prossimo articolo tratteremo proprio i fondamenti della teoria GB.

(* questo fatto era già noto a Cantor, all'interno della sua teoria ingenua.  Supponiamo infatti che V esista. Essendo V un insieme universale, ogni parte di V appartiene a V . Questo vuol dire che l'insieme delle parti di V , P(V), è un sottoinsieme di V. Ma allora la cardinalità di  P(V) è minore o uguale a quella di V. Ma questo contraddice il Teorema di Cantor, che afferma che |P(V)|>|V|, ovvero che la cardinalità di P(V) è maggiore di V.)

2 commenti

  1. Giorgio

    Innanzi tutto: Grazie Umberto per questa nuova "avventura" !

    Avrei preferito non iniziare subito da *** ... che rischiano di intimidire il lettore o, peggio, di non fargli affrontare l'ostacolo.

    Confido comunque nelle prossime puntate un ritorno su alcune definizioni con maggiori esempi di applicazione.

    Ottimi gli spunti "storici" che non bastano mai !

    Bravo ed ancora grazie

  2. Umberto

    grazie Giorgio. Mi fanno piacere i tuoi consigli.

Lascia un commento

*

:wink: :twisted: :roll: :oops: :mrgreen: :lol: :idea: :evil: :cry: :arrow: :?: :-| :-x :-o :-P :-D :-? :) :( :!: 8-O 8)

 

Questo sito usa Akismet per ridurre lo spam. Scopri come i tuoi dati vengono elaborati.