A proposito di antialiasing

Khana · 28 Febbraio 2003, 15:04:32

Certo che riconoscere due tipi di musica è molto più semplice, proprio perchè le note sono poche e le sequenze caratteristiche facilmente individuabili
AAaaaaaaaaaaaaaaaaaaaaaaaahhh!!! L'ERESIA!!!
Le note non sono poche, ci sono solo pochi nomi per definirle, ma un Do1 non ha niente a che vedere con un Do7, nonostante si chiamino allo stesso modo.
Le note sono infinite.
La musica occidentale ha strutturato col tempo (J.S. Bach) un sistema definito "ben temperato" che riconosce 7 gradi in una scala detta tonale.
Il rapporto tra questi gradi è costante, così da avere 2 semi toni di distanza tra tutti gli intervalli ad eccezione del 3°/4° e del 7°/8° che hanno 1 semitono. Questo però vale solo per il "modo" maggiore.
Il modo minore, ad esempio, ha il semitono tra il 2° e il 3° grado.
Esistono 7 differenti modi per fare una scala: Maggiore (o Ionia), Dorica, Frigia, Lidia, Missolidio, Minore (o Eolia) e Locria.
Esistono 12 possibili tonalità con cui questi modi possono essere applicati.
Il risultato è che la musica ha a disposizione 12^7 modi diversi per "esprimersi".
E non ho analizzato le alterazioni, le scale pentatoniche e la teoria dell'armonia funzionale (ossia il Jazz, che non prevede "tonalità" ma solo "modalità"

.
Lasciando perdere la Dodecafonia di Schomberg...

Scusate l'off topic, ma dire che la musica ha solo 7 note è come dire che la natura ha solo 7 colori.

Khana · 28 Febbraio 2003, 15:36:48

Ad ogni modo...
Correggimi se sbaglio, Repne (ma lo fai già

).
Le mie critiche e quelle di Devilman si riferiscono ad un eventuale software che analizzasse da zero il documento A e cercasse di definire se il documento B posto affianco abbia lo stesso argomento.

Invece, quello che stai cercando di fare tu è raccogliere dati statistici sui rapporti Zipf tra le parole di determinati documenti di un determinato argomento, per definire una traccia riconoscibile dell'argomento stesso. Una "costante" di Zipf.
In effetti, questo è del tutto plausibile e il problema semantico in effetti non si pone perché viene confrontato un rapporto costante di valori, e non delle variabili.
Così facendo, non importa il segno (la parola), ma solo la denotazione, per cui tutti i documenti (tutte le frasi) non sono altro che un soggetto S che esegue un'azione A nei confronti di un oggetto O, con svariati e differenti attributi complementari C^n.
La funzione generata dovrebbe avere, sto generalizzando anche il linguaggio, un risultato univoco a seconda dell'argomento.
Questo rientra nelle teorie base della filosofia del linguaggio e della logica, anche sillogistica. Il primo a sostenere che poteva capire l'argomento dei discorsi dalla disposizione degli enti sintattico/grammaticali all'interno di una frase è stato Aristotele. Aveva trovato 12 categorie, ma adesso non me le ricordo...

Nell'esempio del Kamasutra con le parole di Suor Germana, sarebbe che se un trattato di cucina ha un valore Zipf (o come si chiama) di, poniamo 12345, il Kamasutra che parla di sesso avrà 17890, indipendentemente dal segno/parola con cui ci si riferisca ai vari "attributi".

Per chiudere in bellezza: il Klingon è una lingia strutturata e codificata da un pool di sociologi e linguisti che, pagati dalla casa produttrice di Star Trek, ha partorito TUTTE le lingue di tutte le razze esistenti nell'universo ST. I vocabolari e i manuali di grammatica si trovano in internet. Troverete anche manuali di fisica anti-materia che vi spiegano cos'è e come funziona la velovità di curvatura (e come ci si arriva) e il teletrasporto. Nulla di quello che si vede in ST potrebbe non essere verosimile.
Lo stesso aveva fatto JRR Tolkien con le lingue della Terra di Mezzo (lui, per da solo).

Per quanto riguarda le fotografie, invece, concordo con Repne che il rapporto fra testo/immagini dovrebbe essere fatto sun un album di foto, visto che una foto sola, è come una parola sola.

Lexiw · 28 Febbraio 2003, 15:43:20

Se questo fosse possibile, si potrebbe filtrare le comunicazioni per sapere se si parla di attentati...
Secondo me all'NSA hanno già qualcosa di simile.

repne scasb · 28 Febbraio 2003, 15:47:23

1) La musica non ha 7 note.
2) Un immagine non va bene poiche' anche somponendola in pixel, il campo di interazione di un pixel e' invariante rispetto alla posizione. Semplificando: un pixel e' un informazione troppo scarna dal punto di vista statistico (rispetto all'intera immagine). Anche dividendo un 'immagine in texel da 8x8 otterresti (con 8bit per colore) 2.4*10^462 combinazioni diverse, che sono troppo anche per me. Quindi STOP con le immagini, non funziona.
3) Non va bene per un motore di ricerca, in quanto il tutto si base su reti neurali, e questo implicherebbe la capacita' del motore di ricerca di adattarsi alle richieste dell'utente. Cio' non e' impossibile, ma la potenza di calcolo necessaria per svolgere un tale compito e' la seguente: consideranto 10.000 di richieste al motore al secondo su un database di 100.000.000 recorc per la fase di automodificata sarebbero necessarie 5.5*10^67 operazioni di accesso ad database al secondo.
4) Quello che fa questo algoritmo e' archiviare. Ossia gli dai in pasto 100.000 documenti generici (dopo una prima fase di apprendimento), e il software ti dividera' i documenti di sport, i documenti di arte, i documenti di storia,...., i documenti di cio' che hai deciso nella fase di apprendimento.
5) Non funziona con le immagini.
6) Ci ho gia' provato, non funziona con le immagini.
7) Se nell'universo in cui viviamo ci sono 10^88 atomi (circa), e' chiaro che non posso gestire 2.4*10^462 entita', non ho atomi sufficienti per contare le entita'. Anche se funzionasse con le immagini e un tipico problema del "no go".

repne scasb · 28 Febbraio 2003, 15:51:59

CitazioneSe questo fosse possibile, si potrebbe filtrare le comunicazioni per sapere se si parla di attentati...
Secondo me all'NSA hanno già qualcosa di simile.

Cio che dice Lexiw e' corretto, teoricamente si potrebbe capire che si sta parlano di attentati anche se parliamo in codice e utilizzando parole strambe (cifrato), poiche' tutti i discorsi terroristici "hanno una medesima distribuzione matematica indipendente dalle parole usate".

Devo verificare tutto cio'. E' per questo che voglio capire, PRIMA, cosa ci devono fare i miei finanziatori.

repne scasb · 28 Febbraio 2003, 16:05:36

CitazioneInvece, quello che stai cercando di fare tu è raccogliere dati statistici sui rapporti Zipf tra le parole di determinati documenti di un determinato argomento, per definire una traccia riconoscibile dell'argomento stesso. Una "costante" di Zipf.

Quest'uomo ("Khana"

dimostra di usare correttamente il proprio cervello.

E' quasi cosi', solo che non e' una costante di Zipf (primo lavoro svolto dal mio amico), che per sua natura e' troppo riduttiva, ma e' un array multimensionale (ben piu' preciso, mia idea e correttivo all'algoritmo originale) + la capacita' di automodificarsi nel caso in cui sbagli a prendere una decosione (reti neurali).

Puoi notare l'assurdita' della cosa. Se tutto questo e' vero un PC puo' dire A=B senza "capire" ne il significato A ne quello di B.

Khana · 28 Febbraio 2003, 19:34:47

Non è poi così assurdo se ci pensi: qualsiasi proposizione logica è vera in quanto corrisponde ad una tabella di verità di un connettivo logico e ciò succede indipendentemente dal significato dei membri che compongono la proposizione.
"Se piove, allora prendo l'ombrello" ha gli stessi risultati V/F di "Se scrivo allora il sole sorge", o banalmente di "Se S allora P", o meglio "S -> P".
Ora che ho capito cosa stai realizzando, quella che all'inizio era la base della mia critica diventa il fondamento della convinzione che il tuo progetto è possibile: PROPRIO perché il PC non comprende il significato è in grado di stabilire se due oggetti sono simili SOLO da un punto di vista "logico/matematico".
Tu definisci un campo d'esistenza entro cui il computer determina se esiste o no (e qual'è) il risultato dell'operazione.

Grazie per il "dimostra di usare correttamente il proprio cervello", detto da te ha un sapore diverso.

Flash · 28 Febbraio 2003, 19:55:23

Ciao a tutti!
Sono nuovo qui, ma in realtà vi seguo da una vita!
Sono un fortunato possessore di una Voodoo5 completa di imballo originale (che conservo con religiosa cura!) mai modificata e che non ha mai visto un overclock, neanche per una prova(sono uno smanettone incallito, ma la voodoo essendo ormai diventato un pezzo raro merita rispetto e quindi credo che rimarrà così finche campa!!).
Avevo deciso di non postare mai e leggere solo anche se nn c'è una ragione specifica, ma questo 3d ha veramente stimolato la mia curiosità; sono da sempre un appassionato di crittografia, ma anche molto ignorante in materia (eh si, le teorie sui grandi numeri, i sistemi non lineari, e quant'altro non sono cose facili e immediate da digerire

C'è pero' una domanda che mi assilla riguardo al discorso di Repne Scasb (un giorno spero di riuscire a decrittare il tuo nick, la firma e la picture!!Ma se hanno significato solo per te sarà ovviamente impossibile

La domanda è questa: verificata la teoria riguardo questo algoritmo che permette di associare un coefficiente ad un certo tipo di testo con un certo tipo di argomento, che quindi assume il valore di una sorta di impronta digitale per quel testo con quell'argomento (questo è quello che + o - ho capito dal discorso, ti prego di correggermi se sto sbagliando) come faccio a creare un decrittatore pur avendo un database di impronte vastissimo? Il problema che mi pongo è questo: la confrontabilità di testi (diciamo brani) puo' avvenire solo tra lingue uguali, ma un algoritmo di crittografia, non "cambia la lingua"? Lo scopo supremo di un algoritmo di crittografia è quello di crare il caos, di eliminare qualsiasi ordine matematico laddove un ordine già esiste, e piu' è efficiente tale algoritmo, piu' lo schema di crittatura è incomprensibile e irrecuperabile e quindi indecifrabile (a partire dal brano crittato)! Se ipoteticamente esistesse un algoritmo di crittatura "ideale", questo non creerebbe uno stream di dati con distribuzione statistica bianca (sia per posizione dei simboli sia per ricorrenza) e quindi non imbrigliabile in un modello matematico?
Forse ho detto un mare di idiozie, ma la mia idea di base è questa, se i presupposti di tale idea sono che le lingue dei due brani debbano essere le medesime, un algoritmo di crittografia, non viola questi presupposti cambiando la lingua?
Probabilmente ho detto un mare di cavolate e spero non me ne vogliate, è il mio primo messaggio su questo forum che seguo da tanto!
Ringrazio Scasb per questo suo discorso che mi ha molto affascinato e che ripeto prego umilmente di correggermi per le cavolate che probabilmente ho sparato data la mia ignoranza in materia!

Un grazie anche ad Amigamerlin per il suo grande lavoro "dietro le quinte" molto spesso anche criticato da gente che probabilmente non si rende conto del lavoro che sta dietro alla scrittura e ancor peggio ottimizzazione di un driver, e che indipendentemente dall'hardware per cui lo fai è un lavoro che poche persone possono vantarsi di saper fare, e credetemi ci si puo' anche "vantare" di saper fare una cosa del genere!

Grazie a tutti dell'ascolto e a risentirci!!

repne scasb · 28 Febbraio 2003, 21:35:55

CitazioneCiao a tutti!

Qui https://www.3dfxzone.it/forumzone/topic.asp?whichpage=1&Forum_Title=Memorie+di+massa&Topic_Title=azz+mi+%E8+saltato+l%27hard+disk%21&CAT_ID=23&FORUM_ID=47&TOPIC_ID=4364 trovi informazioni (18° post) sul mio nick, sulla mia firma, sul mio avatar (picture).

La tua osservazione necessita di un risposta articolata anche se non mi e' possibile essere completamente esaustiva:

Come utilizzare la congettura fin qui evidenziata per decrittare un testo?

1) Si supponga di avere un blocco di dati (stream), per prima cosa valutiamone la quantita' di entropia contenuta nel blocco di dati.

2) Valutazione entropia: leggi 1 bit alla volta se e' caos la distribuzione statistica dei valori generati da 1 bit (0 e 1) sara' piatta (50% di 0, 50% di 1). Leggi 2 bit alla volta se e' caos la distribuzione statistica dei valori generati da 2 bit (00,01,10,11) sara' piatta (25% di 00, 25% di 01, 25% di 10, 25% di 11). Leggi 'n' bit alla volta se e' caos distribuzione statistica dei valori generati da 'n' bit sara' piatta. Non esagerare con 'n' (n<
3) Per ogni 'n' generico siano k=2^n i possibili valori generati da 'n' bit e sia a(k) un array composto da k elementi inizializzato con le ricorrenze del k-esimo valore generato da 'n' Ossia supposto n=2 -> k=4 se 00 ricorre 1254 volte 01 ricorre 1316 volte 10 ricorre 1156 volte e 11 ricorre 1410 volte allore a(0)=1254, a(1)=1316, a(2)=1156, a(3)=1410. Si M=((Sommatoria per i=0 to k) di a(i))/k l'entropia E=1/SQR(((Sommatoria per i=0 to k) di (a(i) - M)^2))

4) Calcola E per ogni n (chiaramente devi normalizzare E) con n opportuno, sia E(n) l'array che ne deriva.

5) Se e' caos E(n) e' uniformemente distribuito.

6) I moderno sistemi di crittatura hanno E(n) uniformemente distribuito, ed e' per questo che sono stati inventati i pattern di bit. Ossia: fai la stessa cosa punti da 1) a 5) ma solo sui bit dispari o solo su quelli pari, o solo su quelli che aderiscono ad una legge qualsiasi. Sono stati scoperti algoritmi a generazione di patter che generano miliardi di pattern diversi (non e' cosi difficile da farli). Ossia un patter e' basato sul principio che: non analizzo tutto lo stream ma solo una parte (i moderni algoritmi di crittatura usano insozzare il segnale con vero caos). Se vuoi mandate 10 bit di informazione nascondili in 1000 bit di caos vero.

7) Solo il caos fatto da Dio supera un analisi 6). Tutti gli altri per quanto complessi non sono caos sono solo complessi, e quindi decodificabili con un analizzatore complesso.

Ora supponi di aver trovato un vettore E(n) fuori distribuzione, mettilo da parte.

9) Trova il vettore E(n) per tutti i messaggi crittati che intercetti.

10) Gli elementi di tali vettori E(n) fuori distribuzione sono le parole del linguaggio crittato.

11) Applica la congettura estesa di Zipf ai vettori E(n) ed avrai un sistema che ti dira'

12) Il messaggio crittato XYZ e' simile al messaggio crittato ABC (cio' viene fatto senza decrittare il messaggio!)

Ossia hai un arma in piu' nelle operazioni di decodifica. Tutto si basa che se la congettura funziona su parole o musica (gruppi di note) perche' non dovrebbe funzionare su numeri?

Chiaramente se la congettura su parole e' ad uno stato primordiale figurati a che livello sia la congettura su numeri

Chiaramente sto solo supponendo che il tutto funzioni, non ho ancora verificato alcunche.

Devilman · 28 Febbraio 2003, 21:41:05

mi scuso per l'ignoranza musicale

;

se l'algoritmo fa quel che dice dovrebbe riportare la stessa cifra per testi crittografati nello stesso modo, quindi di fatto questa "costante multidimensionale" o "rapporto" dovrebbe in maniera inequivocabile scoprire la stessa "mano"?
se fosse così sarebbe un buon strumento per decriptare qualsiasi codice?
io continuo a sostenere che è un miraggio, alla fine se nn ho capito male dall'elaborazione di un testo attraverso questo fantomatico algoritmo si dovrebbe tirar fuori un valore univuco per ogni tipologia esistente, o uno spazio multidimensionale preciso... ma qual'è questa dimensione? a me sembra assurdo trattare le parole come addendi di una espressione, complicata quanto si voglia ed alla fine per magia ottenre questo valore.
E' tutta una congettura, basata su un ipotesi che secondo il mio modesto parere non sta insieme. Per quanto concerne il discorso delle cifre più usate e dell'adozione come metodo per scovare i bilanci truccati, NESSUNA LEGGE può dimostrare che il metodo è efficace, di sicuro può aver portato a buoni risultati, ma niente ci dice che operando su un altro campione si sarebbero potuti ottenere risultati migliori. Quella scelta a mio parere è solo una scommessa basata su congetture statistiche.

massacratemi pure

In evidenza per te:

A proposito di antialiasing