Category Archives: News

Bot AI e attacchi DDoS al sito del GOLEM (parte prima)

Negli ultimi mesi, su Internet, si è registrato un sensibile aumento del traffico web dovuto ai bot.

Ma cosa sono i bot?

Noti anche come crawler o spider, ciò che li caratterizza è che sono programmi automatici che navigano sul web, e non normali esseri umani. Lo scopo di questi programmi è vario: possono servire a recuperare dati dai siti web, quando questi non forniscano interfacce macchina adatte, per esempio per creare servizi aggiuntivi; possono avere come scopo l’archiviazione dei siti, una specie di “fotografia” che li immortala nel tempo, come fa il noto web.archive.org; questi bot possono anche essere degli esploratori per i motori di ricerca, che creano un indice di ciò che si trova sul web, e permettono poi di cercarlo con facilità, come fanno Startpage, Bing, Duckduckgo e Google, solo per citare alcuni dei più famosi; infine, in seguito alla nascita dei moderni modelli di intelligenza artificiale generativa, alcuni bot sono impiegati per la lettura di testi di ogni tipo, in modo da allenare queste intelligenze artificiali.

Come si vede, gli scopi per cui i bot navigano il web sono numerosi e diversi, e tutti anche piuttosto nobili.

Perché i bot possono essere un problema

Ciò che li rende però diversi dai navigatori umani, è che sono dei programmi automatici, che possono dunque navigare molto più velocemente: possono leggere, cliccare, scaricare, e fare qualunque cosa in molto meno tempo di un essere umano. Questa caratteristica fa sì che, se programmati senza cognizione di causa, possono facilmente diventare dannosi per i siti a cui si collegano. Infatti, se fanno molte richieste ravvicinate, possono mettere in difficoltà il server che deve loro rispondere, che si trova sovraccarico di lavoro.

Il web come un luogo civile

Le risorse che hanno a disposizione i bot e i server sono delle più varie. È facile immaginare che un’azienda come Google, che ha 180 mila dipendenti, possa mettere a disposizione molte più persone, denaro e computer per i suoi bot, rispetto a quanto può mettere a disposizione per i suoi server un’associazione come il GOLEM, che ha 40 soci, 10 volontari, e fattura un fico secco.

(Però l’Officina del GOLEM ha la sua personalissima pianta di fichi che cresce bucando l’asfalto)

È così che, per permettere ai siti web di fornire un servizio senza essere oberati di richieste, e per permettere ai bot di svolgere il loro utile lavoro senza essere d’intralcio, sono state concordate alcune buone regole per la convivenza civile.

  • user agent: quando un bot fa una richiesta ad un sito web, trasmette il suo nome, identificandosi chiaramente come un bot. In questo modo, il sito web può attuare delle contromisure per proteggersi da sovraccarico, per esempio rallentando solo i bot quando è già impegnato a gestire le richieste di molti utenti umani.
  • robots.txt: l’amministratore di un sito web può specificare quali pagine del suo sito possono essere recuperate dai bot, da quali bot, e con che frequenza. Un bot che desidera accedere a un sito web, deve prima controllare il contenuto di questo file, e poi regolarsi automaticamente, in modo da svolgere il suo lavoro senza arrecare danno o disturbo.

Da qualche mese a questa parte, tuttavia, alcune compagnie che allenano intelligenze artificiali, come Amazon, Meta, OpenAI e Alibaba, hanno smesso di comportarsi da onesti cittadini della rete, e hanno iniziato a contravvenire a tutte le norme di convivenza civile. In particolare:

  • alcuni effettuano numerose richieste in breve tempo: le richieste giungono in modo aggressivo, anche centinaia di richieste al secondo, per un lasso di tempo di diversi minuti, e in più, dopo qualche ora, sebbene il contenuto del sito non cambi, il treno di richieste si ripete.
  • alcuni falsificano lo user agent: non si identificano più come bot, ma cercano di aggirare i controlli fingendo di essere comuni browser comandati da esseri umani.
  • altri trascurano il robots.txt: visitano qualunque pagina in modo indiscriminato e senza alcun freno temporale.

Il web come un luogo di malintenzionati

Fino a qui, questo comportamento potrebbe essere quasi giustificato dall’ignoranza: se il bot viene scritto dal primo script kiddie che passa per strada, potrebbe anche essere che egli ignori queste buone maniere, e, utilizzando sistemi con molte risorse per il suo bot, danneggi involontariamente le infrastrutture dei server più piccoli. Poco male: un bot così maleducato, comunque, è abbastanza facile da tenere sotto controllo: è sufficiente notare che un solo computer sta accedendo al sito in modo molto più frequente del normale, e bloccarlo.

Tuttavia, questi bot non solo sono maleducati, ma sono progettati in maniera tale da eludere deliberatamente le misure di contenimento. Infatti, invece di apparire come singoli computer, essi appaiono come tanti diversi computer, cambiano continuamente il loro indirizzo IP, e si collegano in maniera coordinata da più “luoghi” della rete.

Questo problema ha iniziato ad affliggere molto pesantemente tutto il web.

Questo dunque non è l’errore di un ignorante: questo è un comportamento malevolo e deliberato. Questo è un attacco DDoS (Distributed Denial of Service) realizzato per mezzo di una botnet.

Non esiste altra definizione per un simile comportamento. Infatti, anche ammesso di voler ulteriormente giustificare l’ingiustificabile, non si capisce quale altro dovrebbe essere lo scopo di questi bot, se non quello di causare disservizi, inondando i server con migliaia di richieste. Si potrebbe argomentare che stanno “semplicemente” allenando la loro intelligenza artificiale alla massima velocità possibile. Ma quando i piccoli server si trovano ad affrontare un’orda di migliaia e migliaia di richieste, ogni secondo, non fanno altro che soccombere, si bloccano e diventano irraggiungibili. Quindi su cosa si dovrebbero mai allenare queste intelligenze artificiali, se buttano giù i siti da cui risucchiano avidamente la loro stessa linfa vitale?

L’associazione GOLEM

Il GOLEM — Gruppo Operativo Linux Empoli, è un Linux Users Group (LUG) con sede a Empoli (FI). Da mesi i siti web del GOLEM sono instabili, a volte ci sono downtime prolungati, anche di diversi minuti, e ormai questi disservizi sono all’ordine del giorno.

Una volta, in seguito ad un attacco da parte di alcuni di questi avidi bot, quando siamo riusciti a collegarci al server, il carico del sistema registrava 172. Considerato che il VPS del GOLEM ha solo 4 processori, significa che il suo carico massimo è 4, e che quindi stava cercando di gestire, da solo, un carico 43 volte più grande di quello che poteva sostenere. (con le dovute approssimazioni)

In modo molto approssimativo, si immagini di perdere tutto il lavoro che si è fatto fatto nell’ultimo mese e mezzo, e il capo chieda di rifarlo daccapo entro oggi. Non c’è nessuna speranza che qualcuno ci possa riuscire, dunque si soccombe.

Per non soccombere, sono state dunque prese alcune contromisure.

(segue parte 2)

Sondaggio

Da quanto tempo usi Linux? Facci indovinare!

Linux Day 2025

Sabato 25 ottobre 2025 torna il Linux Day: la principale manifestazione comunitaria italiana dedicata al software libero, alla cultura aperta e alla condivisione! L’evento è coordinato a livello nazionale da ILS – Italian Linux Society, e si svolge contemporaneamente in numerose città in tutta Italia.

Quest’anno, l’evento locale, a cui parteciperà il GOLEM, sarà organizzato a Prato, insieme a PLUG – Prato Linux User Group, al FLUG – Firenze Linux User Group e al LuccaLUG.

Parleremo di programmazione, cloud, sicurezza, ma anche di come la tecnologia influenzi la nostra società, i nostri diritti e le nostre comunità. Discuteremo di software, hardware, cultura libera, open data, privacy e libertà digitali.

La manifestazione è aperta a tutti, dai programmatori agli attivisti ai semplici curiosi. L’obiettivo è creare un ponte tra chi sviluppa la tecnologia e chi la usa ogni giorno per costruire una società più consapevole.

Tutti i dettagli su sede e programma sul sito ufficiale.

Ci faccio un serverino

Per quanto ora sia un’attività trascurabile, le radici del GOLEM affondano nel trashware, pratica che ha visto la sua età dell’oro tra la fine degli anni ’90 e la prima metà dei 2000.

All’epoca i rarissimi portatili in giro erano un lusso riservato ai pochi addetti ai lavori ed i PC desktop erano la forma di computer più diffusa. Il loro costo era decisamente maggiore rispetto a quello a cui siamo abituati oggi così, se proprio ce n’era bisogno, piuttosto che acquistare un computer nuovo, era più probabile accontentarsi di aggiornare singole componenti come RAM, processore o hard disk. Recuperare almeno case e alimentatore era il minimo che si potesse fare per risparmiare qualche centinaio di “milalire” .

Questa prassi iniziò non essere più praticabile a partire dal ’99 con l’arrivo dei Pentium II (l’anno successivo nascerà il GOLEM, un caso?). Questi processori necessitavano di un nuovo tipo di schede madri (ATX) che non era compatibile con i vecchi case ed alimentatori, impedendo perciò ai consumatori di ripiegare per il solito aggiornamento di componenti e forzandoli alla sostituzione in blocco delle loro macchine. Per prime le aziende, ma a seguire anche gli utenti domestici, per esigenze di spazio, iniziarono a sbarazzarsi di migliaia di computer: grossi, lenti, ma completi e funzionanti.

Microsoft approfittò di questa situazione di mercato favorevole rilasciando a cadenza quasi annuale sistemi operativi che richiedevano il doppio dei requisiti minimi della versione precedente, nemmeno la comunità opensource non riuscì a fare di meglio vista la deriva mangia risorse di progetti come GNOME e KDE.
L’estrema rapidità con cui si esauriva la attività residua di quelle macchine trasformò il trashware in una vera e propria lotta contro il tempo. Non era facile nemmeno per noi smaltire tutto quell’hardware e diventò sempre più frequente vedere pile di Pentium tornare ad invecchiare sugli scaffali.

L’aspetto positivo di tutto questo esubero di hardware fu che le nostre scrivanie di casa si popolarono di computer sacrificabili, su cui sperimentare qualsiasi cosa ci venisse in mente, dove l’unico limite era la fantasia RAM!

Ma cosa ci poteva fare un niubbo di Linux (a caso) nel 2002 con un Pentium 200, 48MB RAM, un paio di dischi da 2GB ed una scheda di rete ISA NE2000?
Svariate cose, perché quel trabiccolo fu adibito a server DNS, proxy, ftp e smtp; inizialmente grazie ad una Debian Woody che però qualche anno più tardi, per motivi didattici, fu rimpiazzata da OpenBSD.
Ma che razza di prestazioni poteva offrire una reliquia del genere? E quale sistema operativo l’avrebbe sfruttata al meglio?

Nel mio prossimo post vedremo un confronto tra alcuni dei principali sistemi operativi per server disponibili all’epoca.