A proposito di antialiasing

Milotto · 01 Marzo 2003, 17:36:22

Citazione
CitazioneSe questo fosse possibile, si potrebbe filtrare le comunicazioni per sapere se si parla di attentati...
Secondo me all'NSA hanno già qualcosa di simile.

Cio che dice Lexiw e' corretto, teoricamente si potrebbe capire che si sta parlano di attentati anche se parliamo in codice e utilizzando parole strambe (cifrato), poiche' tutti i discorsi terroristici "hanno una medesima distribuzione matematica indipendente dalle parole usate".

Devo verificare tutto cio'. E' per questo che voglio capire, PRIMA, cosa ci devono fare i miei finanziatori.

--

Un sistema che fa uso di questo tipo si algoritmi è già esistente , il suo nome è ECHELON....
Il parere di molti eperti del settore è che questa rete di intercettazione e catalogazione è totalmente priva di utilità (salvo i casi in cui le intercettazioni avvengono in maniera mirata :vedi caso Boing vs Airbus)...
Se dall'Iraq parlassi ad un mio amico e gli dicessi d'aver mangiato una grande bomba , automaticamente susciterei l'interesse di Echelon ,che per semplice confronto con un database catalogherebbe l'intercettazione come utile...
Il punto è che in milioni di comunicazioni potrebbe esserci un riferimento utile as Echelon , ma discriminare quelle che si riferiscono ad esplosivi da quelle che si riferiscono a semplici graffe alla crema è praticamente impossibile...
Del resto se questo sistema avesse avuto la benchè minima utilità non ci sarebbe stato un 11 Settembre oppure , oggi , l'ing. Bin Laden (ammesso che realmente esista) sarebbe carne da macello...

Khana · 01 Marzo 2003, 19:43:10

Se questo avviene per Echelon, non "dovrebbe" avvennire per il sistema che sta progettando Repne.
Parlare di una gita in Iraq NON ha lo stesso valore in termini di legge di Zipf che può avere un piano terroristico.
Si ritorna al mio esempio del kamasutra con le parole di Suor Germana, che ora so confutare da solo:
Parlare di Cucina ha un valore in termini di legge di Zipf.
Parlare di Sesso, ne ha un altro.
Questo INDIPENDENTEMENTE dalle parole usate.

Vai su Google, cerca Zipf e, se sai l'inglese, leggiti un paio di articoli (come ho fatto io) e capirai.

La teoria applicata al linguaggio sostiene che, semplificando e approssimando, in un discorso riferito ad una gita turistica, il rapporto tra la parola più usata e la seconda parola più usata ha unvalore costante, indipendentemente da quali siano queste 2 parole.
Tale valore, in un discorso sul terrorismo, è differente: la prima parola più usata sta, rispetto alla seconda, in un rapporto differente, indipendentemente dalle parole usate.

Infatti ora, il mio dubbio, Repne, risiede nel fatto che tale valore dovrebbe essere costante anche indipendentemente dalla lingua...

Lexiw · 01 Marzo 2003, 20:06:45

Secondo me il problema delle varie lingue non sussiste. Mi spiego meglio, se noi diamo in "pasto" al programma una lettera di cui conosciamo la lingua e il contenuto(terroristico), il programma in base alla distribuzione dovrebbe saper riconoscere se un altra lettera della stessa lingua parla dello stesso argomento(ecco spiegati forse i database). La statistica...., non ho mai capito come grazie alla lambda si possa sapere il giorno esatto in cui cadrà una meteorite...(cioè a livello matematico si, ma purtroppo ho anche la logica).

repne scasb · 01 Marzo 2003, 21:04:15

CitazioneUn sistema che fa uso di questo tipo si algoritmi è già esistente , il suo nome è ECHELON....
Il parere di molti eperti del settore è che questa rete di intercettazione e catalogazione è totalmente priva di utilità (salvo i casi in cui le intercettazioni avvengono in maniera mirata :vedi caso Boing vs Airbus)...
Se dall'Iraq parlassi ad un mio amico e gli dicessi d'aver mangiato una grande bomba , automaticamente susciterei l'interesse di Echelon ,che per semplice confronto con un database catalogherebbe l'intercettazione come utile...
Il punto è che in milioni di comunicazioni potrebbe esserci un riferimento utile as Echelon , ma discriminare quelle che si riferiscono ad esplosivi da quelle che si riferiscono a semplici graffe alla crema è praticamente impossibile...
Del resto se questo sistema avesse avuto la benchè minima utilità non ci sarebbe stato un 11 Settembre oppure , oggi , l'ing. Bin Laden (ammesso che realmente esista) sarebbe carne da macello...

Echelon non funziona perche' e' un comparatore 1:1, Se io dico: "Domani lancero' un ordigno su XYZ" segnala la mia comunicazione su "red", se dico: "inamoD 'orecnal nu ongidro us ZYX" non segnalera' nulla.

La congettura per la quale mi sto impegnando funziona indipendentemente dai vocabili usati. Senza scendere in inutili ed incmoprensibili tecnicismi, dovrebbe saper riconoscere che si parla di terrorismo in base al fatto che "in genere" nei discorsi di terrorismo i rapporti di frequenza tra le parole utilizzate sono "tipico" (ho semplificato parecchi).

repne scasb · 01 Marzo 2003, 21:12:49

CitazioneInfatti ora, il mio dubbio, Repne, risiede nel fatto che tale valore dovrebbe essere costante anche indipendentemente dalla lingua...

Sembrerebbe di si (non e' un valore, ma non voglio cavillare), tranne per alcune lingue. Da un'analisi preliminare sembrerebbe che: Le lingue di culture simile alla nostra hanno a parita' di argomento "valori" uguali. Tali "valori" differiscono per lingue con culture molto diverse dalla nostra (ho un riferimento sull'idioma aborigeno).

Ossia gli aborigeni distribuiscono le parole in modo diverso da noi quando parlano di terrorismo (ammesso cha abbiano un concetto di terrorismo).

Quindi la congettura senza conoscere ne italiano ne inglese saprebbe dire: il documento A in italiano e simile al documento B in inglese, ma non saprebbe dire il documento A in inglese e simile al documento B in "aborigeno".

Khana · 01 Marzo 2003, 21:23:02

Caspita, già raggruppare tutte le lingue occidentali non è male.
Fai un database con le lingue indo-europee, poi fai un'altro database con le lingue asiatiche, e così via...
Una volta che hai le tracce delle diverse regioni linguistiche, puoi incrociarle. Credo...

repne scasb · 01 Marzo 2003, 21:30:42

CitazioneFai un database con le lingue indo-europee, poi fai un'altro database con le lingue asiatiche, e così via...
Una volta che hai le tracce delle diverse regioni linguistiche, puoi incrociarle. Credo...

Realmente non ne ho idea, ma un problema sorge subito. Il convertitore tra italiano e aborigeno non e' lineare (questa volta inteso come retta).

Ossia se il "valore" di una categoria in Italiano vale 1 e quello della medesima categoria in aboorigeno vale 2, saresti propenso a dire che se un "valore" di un'altra categoria in italiano vale 2 allora in aborigeno vale 4.

Tutto cio' non e' vero. Il valore per l'aborigeno nell'ultima categria potrebbe essere 1.45.

Come lo fai un convertitore?

Khana · 01 Marzo 2003, 21:56:19

Lo farei fisso.
Nel senso che dovresti passare da una fase precedente di "raccolta dati" in cui i vari database dei diversi gruppi linguistici lavorino da soli, separati.
Presupponendo che la suddivisione per argomenti ci sia in tutti, non interessa in effetti controllare un documento in italiano con uno in aborigeno, ma controllerai il documento in italiano con la categoria di appartenenza, e l'aborigeno con la sua.
Se le die categorie sono uguali, i docuemti hanno lo stesso argomento.
Questo potresti farlo. Certo, è lungo e complesso, ma mi pare fattibile.

Sarebbe come avere diverse congetture funzionanti e paragonare le categorie.
Non so se mi sono spiegato.

Poi però, nel contesto, c'è da sottolineare che gli aborigeni australiani e la loro cultura del Sogno sono sempre stati fuori da qualsiasi riduzione matematica...

Superbox · 01 Marzo 2003, 22:16:02

...Questo thread andrebbe rinominato...

amicofritz · 18 Maggio 2003, 22:15:22

da quello che ho capito è che il computer è e rimarra' stupido.sbaglio o no?comunque mi congratulo con voi per le vostre conoscienze!ho riletto tutte e 5 le pagine 3 volte per capirci qualcosa!
ciao ciao!

In evidenza per te:

A proposito di antialiasing