Google dorks

I motori di ricerca (Google, Bing, DuckDuckGo) hanno contribuito a diffondere l’utilizzo di Internet tra le persone comuni: ti basta una parola chiave per accedere al tutto il contenuto inerente a quell’argomento. In origine non esisteva una funzione “Cerca” all’interno della rete: bisognava visitare infatti tutte le pagine (sempre cercando di ricordare gli indirizzi!).

Si stima che Google abbia archiviato più pagine di un qualsiasi altro motore di ricerca del mondo; con oltre miliardi di pagine e un tempo relativamente basso di esecuzione, il popolare motore di ricerca californiano riesce a soddisfare tutte le ricerche, sia eseguite per fini didattici che per fini puramente di curiosità. Dal numero di granelli di sabbia all’ultima soap opera del momento, le informazioni che si possono trovare sono miliardi! Nel corso del tempo, si sono evoluti tanto da essere i protagonisti indiscussi del Web: vuoi vedere gli orari di un particolare negozio? “Cerca su Google”.

Google è affamato di informazioni: attraverso dei programmi chiamati crawler, Google reperisce quante più informazioni possibili sui più disparati argomenti. Il motore di ricerca è così potente da poter categorizzare oltre 15 milioni di pagine in meno di un minuto grazie a potenti algoritmi di ricerca. Non sempre è stato così: nel 1999 ci voleva più di un mese per un operazione del genere.

Oltre a ciò, si ipotizza che al secondo siano condotte oltre 60 mila di ricerche attraverso il popolare motore di ricerca Google. Questo significa oltre 1000 miliardi di ricerche all’anno! Numeri astronomici a cui i popolari motori di ricerca, Google in primis riesce a stare dietro con l’enorme infrastruttura.

Sicuramente i motori di ricerca hanno stravolto la vita di molte persone; avere così tante informazioni nel giro di mezzo secondo è un punto di riflessione per chiunque. Eppure non tutti riescono a sfruttare appieno il popolare motore Google per effettuare ricerche. Negli ultimi giorni, da una ricerca condotta da un importante istituto sembra sia emersa l’incapacità di molte persone, studenti e non, di trovare qualcosa (significati o raccolta dati) su un preciso argomento tramite i motori di ricerca.

Da qui, nasce l’esigenza di scrivere un articolo su questo, sperando di poter insegnare un po’ di più a tutti i lettori che leggono il mio blog quel poco che esiste di “teoria” su Google.

Cosa sono le Google Dorks?

Le dork vengono definite come query di ricerca, preparati in modo limitato per lo scopo, composte da diverse keywods, che vengono immesse in un motore di ricerca per avere dei risultati specifici.

Scopi per cui vengono utilizzate

Le dorks vengono utilizzate principalmente per affinare i risultati di ricerca, al fine di avere link più specifici.

Esempio molto concreto potrebbe essere la ricerca sulla pizza napoletana. La keyword pizza, cercata su Google, ha oltre 1.010.000.000 risultati mentre le keyword combinate pizza napoletana hanno già diversi risultati in meno. Questa è già un tentativo di raffinare la nostra ricerca. Avendo molti risultati differenti sia per qualità sia per origine, abbiamo sempre bisogno di restringere il campo di ricerca. I motori di ricerca infatti non trovano in modo preciso il contenuto che vogliamo, ma semplicemente trovano contenuti affini alla nostra query di ricerca.

Non dobbiamo dimenticare però che i crawler catalogano e archiviano tutte le informazioni presenti su internet, anche quelle che talvolta non sono rivolte al grande pubblico. Errori di misconfigurazione, un link privato che condividiamo al grande pubblico sui social, potrebbero rivelare informazioni o documenti privati. Se non opportunamente specificato tramite un file speciale chiamato robots.txt, o motori di ricerca non riconoscono ciò che deve essere archiviato per future ricerche e quello che invece non devono visualizzare.

Se si cerca in maniera specifica alcuni parametri come la parola “confidenziale” o riservato all’interno dei motori di ricerca, è possibile scovare alcuni documenti privati tra cui bilanci aziendali, progetti in via di sviluppo e persino e-mail!

Mentre alcuni webmaster espongono informazioni sensibili per conto proprio, questo non significa che sia legale sfruttare o sfruttare tali informazioni. Se lo fai, sarai marcato come criminale informatico. È abbastanza facile tracciare l’IP di navigazione, anche se si utilizza un servizio VPN. Non è così anonimo come si pensa.

Ma non solo, vulnerabilità vengono cercate da script kiddie proprio tramite Google. Un’attenta query infatti cerca per messaggi di errori, file di configurazione o altro che potrebbero in qualche modo esporre all’esterno versione del software o altro ancora.

Prima di leggere qualsiasi altra cosa, sappiate che Google inizierà a bloccare la vostra connessione se vi connettete da un singolo IP statico. Chiederà di “vincere” il captcha per prevenire le query automatiche.

Sintassi

Le google dorks hanno una sintassi basilare del tipo nomedork: parametro. Possono essere utilizzati operatori logici di base come il not, or, e l’and, scrivendoli in maiuscoletto.

Caratteri speciali

DorkDescrizioneEsempio
Doppi apici [ “stringa di ricerca” ]I doppi apici sono usati per cercare una parola specifica o un insieme di parole scritte esattamente in quel modo.“gelato”
Segno meno [ -stringa ]Il segno meno davanti la parola indica a Google di escludere quella specifica parola dalla ricerca.-cripto
Tilde [ ~stringa ]Nello specifico indica a Google di cercare oltre a quella parola anche i suoi sinonimi.~macchina
Operatore “OR” [stringa OR stringa_2]Questo operatore logico dice a Google di cercare una parola o l’altra. Può essere utilizzato anche più di una volta.[monero OR serhack]

Lista di keyword utili su Google

Tabella di una serie di opzioni utili.

Dork nameDescriptionExample
site: domaini risultati di ricerca saranno file e pagine presenti nel dominio domainsite:w3school.com
intitle: parolai risultati di ricerca conterranno nel titolo la parola dopo la dork “intitle”intitle:hi
inurl : parolai risultati di ricerca conterranno nel titolo la parola dopo la dork “inurl”inurl:gallery
filetype: typei risultati di ricerca conterranno file della estensione specificata da typefiletype:pdf
cache: urlreindirizza l’utente alla cache Google dell’url specificatocache:serhack.me
info: root domainil risultato di ricerca conterrà il dominio principale (root domain) e tutte le informazioni che Google hariguardo quel specifico dominioinfo:amazon.com
related: urlil risultato di ricerca conterrà siti correlati all’url selezionatorelated:repubblica.it

Un consiglio: notate bene come tra la “definizione” delle dork e il contenuto non ci siano spazi. Questo è stato sviluppato maggiormente per non dare luogo a query ambigue. Se si vuole cercare ad esempio pizza napoletana, si cerchi intext:“pizza napoletana” .

Personal feedback

Personalmente, ritengo che le Google dorks aiutano molto, sia chi ha buone intenzioni sia chi, purtroppo, ne ha di cattive. Infatti si stanno sempre più registrando attacchi di ingegneria sociale, utilizzando dati confidenziali e interni scoperti tramite una semplice ricerca.

Random Google dorks

parent directory /appz/ -xxx -html -htm -php -shtml -opendivx -md5 -md5sums
parent directory DVDRip -xxx -html -htm -php -shtml -opendivx -md5 -md5sums
parent directory Xvid -xxx -html -htm -php -shtml -opendivx -md5 -md5sums
parent directory Gamez -xxx -html -htm -php -shtml -opendivx -md5 -md5sums
parent directory MP3 -xxx -html -htm -php -shtml -opendivx -md5 -md5sums
parent directory Name of Singer or album -xxx -html -htm -php -shtml -opendivx -md5 -md5sums
filetype:config inurl:web.config inurl:ftp
“Windows XP Professional” 94FBR
ext:(doc | pdf | xls | txt | ps | rtf | odt | sxw | psw | ppt | pps | xml) (intext:confidential salary | intext:"budget approved") inurl:confidential
ext:(doc | pdf | xls | txt | ps | rtf | odt | sxw | psw | ppt | pps | xml) (intext:confidential salary | intext:”budget approved”) inurl:confidential
ext:inc "pwd=" "UID="
ext:ini intext:env.ini
ext:ini Version=... password
ext:ini Version=4.0.0.4 password
ext:ini eudora.ini
ext:ini intext:env.ini
ext:log "Software: Microsoft Internet Information Services *.*"
ext:log "Software: Microsoft Internet Information
ext:log "Software: Microsoft Internet Information Services *.*"
ext:log \"Software: Microsoft Internet Information Services *.*\"
ext:mdb   inurl:*.mdb inurl:fpdb shop.mdb
ext:mdb inurl:*.mdb inurl:fpdb shop.mdb
ext:mdb inurl:*.mdb inurl:fpdb shop.mdb
filetype:SWF SWF
filetype:TXT TXT
filetype:XLS XLS
filetype:asp   DBQ=" * Server.MapPath("*.mdb")
filetype:asp "Custom Error Message" Category Source
filetype:asp + "[ODBC SQL"
filetype:asp DBQ=" * Server.MapPath("*.mdb")
filetype:asp DBQ=\" * Server.MapPath(\"*.mdb\") 
filetype:asp “Custom Error Message” Category Source
filetype:bak createobject sa
filetype:bak inurl:"htaccess|passwd|shadow|htusers"
filetype:bak inurl:\"htaccess|passwd|shadow|htusers\" 
filetype:conf inurl:firewall -intitle:cvs 
filetype:conf inurl:proftpd. PROFTP FTP server configuration file reveals
filetype:dat "password.dat
filetype:dat \"password.dat\" 
filetype:eml eml +intext:"Subject" +intext:"From" +intext:"To"
filetype:eml eml +intext:\"Subject\" +intext:\"From\" +intext:\"To\" 
filetype:eml eml +intext:”Subject” +intext:”From” +intext:”To”
filetype:inc dbconn 
filetype:inc intext:mysql_connect
filetype:inc mysql_connect OR mysql_pconnect 
filetype:log inurl:"password.log"
filetype:log username putty PUTTY SSH client logs can reveal usernames
filetype:log “PHP Parse error” | “PHP Warning” | “PHP Error”
filetype:mdb inurl:users.mdb
filetype:ora ora
filetype:ora tnsnames
filetype:pass pass intext:userid
filetype:pdf "Assessment Report" nessus
filetype:pem intext:private
filetype:properties inurl:db intext:password
filetype:pst inurl:"outlook.pst"
filetype:pst pst -from -to -date
filetype:reg reg +intext:"defaultusername" +intext:"defaultpassword"
filetype:reg reg +intext:\"defaultusername\" +intext:\"defaultpassword\" 
filetype:reg reg +intext:â? WINVNC3â?
filetype:reg reg +intext:”defaultusername” +intext:”defaultpassword”
filetype:reg reg HKEY_ Windows Registry exports can reveal
filetype:reg reg HKEY_CURRENT_USER SSHHOSTKEYS
filetype:sql "insert into" (pass|passwd|password)
filetype:sql ("values * MD5" | "values * password" | "values * encrypt")
filetype:sql (\"passwd values\" | \"password values\" | \"pass values\" ) 
filetype:sql (\"values * MD\" | \"values * password\" | \"values * encrypt\") 
filetype:sql +"IDENTIFIED BY" -cvs
filetype:sql password
filetype:sql password 
filetype:sql “insert into” (pass|passwd|password)
filetype:url +inurl:"ftp://" +inurl:";@"
filetype:url +inurl:\"ftp://\" +inurl:\";@\" 
filetype:url +inurl:”ftp://” +inurl:”;@”
filetype:xls inurl:"email.xls"
filetype:xls username password email
index of: intext:Gallery in Configuration mode
index.of passlist
index.of perform.ini mIRC IRC ini file can list IRC usernames and
index.of.dcim 
index.of.password 
intext:" -FrontPage-" ext:pwd inurl:(service | authors | administrators | users)
intext:""BiTBOARD v2.0" BiTSHiFTERS Bulletin Board"
intext:"# -FrontPage-" ext:pwd inurl:(service | authors | administrators | users) "# -FrontPage-" inurl:service.pwd
intext:"#mysql dump" filetype:sql
intext:"#mysql dump" filetype:sql 21232f297a57a5a743894a0e4a801fc3
intext:"A syntax error has occurred" filetype:ihtml
intext:"ASP.NET_SessionId" "data source="
intext:"About Mac OS Personal Web Sharing"
intext:"An illegal character has been found in the statement" -"previous message"
intext:"AutoCreate=TRUE password=*"
intext:"Can't connect to local" intitle:warning
intext:"Certificate Practice Statement" filetype:PDF | DOC
intext:"Certificate Practice Statement" inurl:(PDF | DOC)
intext:"Copyright (c) Tektronix, Inc." "printer status"
intext:"Copyright © Tektronix, Inc." "printer status"
intext:"Emergisoft web applications are a part of our"
intext:"Error Diagnostic Information" intitle:"Error Occurred While"
intext:"Error Message : Error loading required libraries."
intext:"Establishing a secure Integrated Lights Out session with" OR intitle:"Data Frame - Browser not HTTP 1.1 compatible" OR intitle:"HP Integrated Lights-
intext:"Fatal error: Call to undefined function" -reply -the -next
intext:"Fill out the form below completely to change your password and user name. If new username is left blank, your old one will be assumed." -edu
intext:"Generated   by phpSystem"
intext:"Generated by phpSystem"
intext:"Host Vulnerability Summary Report"
intext:"HostingAccelerator" intitle:"login" +"Username" -"news" -demo
intext:"IMail Server Web Messaging" intitle:login
intext:"Incorrect syntax near"
intext:"Index of" /"chat/logs"
intext:"Index of /network" "last modified"
intext:"Index of /" +.htaccess
intext:"Index of /" +passwd
intext:"Index of /" +password.txt
intext:"Index of /admin"
intext:"Index of /backup"
intext:"Index of /mail"
intext:"Index of /password"
intext:"Microsoft (R) Windows * (TM) Version * DrWtsn32 Copyright (C)" ext:log
intext:"Microsoft CRM : Unsupported Browser Version"
intext:"Microsoft ® Windows * ™ Version * DrWtsn32 Copyright ©" ext:log
intext:"Network Host Assessment Report" "Internet Scanner"
intext:"Network Vulnerability   Assessment Report"
intext:"Network Vulnerability Assessment Report"
intext:"Network Vulnerability Assessment Report" 本文来自 pc007.com
intext:"SQL Server Driver][SQL Server]Line 1: Incorrect syntax near"
intext:"Thank you for your order"   +receipt
intext:"Thank you for your order" +receipt
intext:"Thank you for your purchase" +download
intext:"The following report contains confidential information" vulnerability -search
intext:"phpMyAdmin MySQL-Dump" "INSERT INTO" -"the"
intext:"phpMyAdmin MySQL-Dump" filetype:txt
intext:"phpMyAdmin" "running on" inurl:"main.php"
intextpassword | passcode)   intextusername | userid | user) filetype:csv
intextpassword | passcode) intextusername | userid | user) filetype:csv
intitle:"index of" +myd size
intitle:"index of" etc/shadow
intitle:"index of" htpasswd
intitle:"index of" intext:connect.inc
intitle:"index of" intext:globals.inc
intitle:"index of" master.passwd
intitle:"index of" master.passwd 007电脑资讯
intitle:"index of" members OR accounts
intitle:"index of" mysql.conf OR mysql_config
intitle:"index of" passwd
intitle:"index of" people.lst
intitle:"index of" pwd.db
intitle:"index of" spwd
intitle:"index of" user_carts OR user_cart
intitle:"index.of *" admin news.asp configview.asp
intitle:("TrackerCam Live Video")|("TrackerCam Application Login")|("Trackercam Remote") -trackercam.com
intitle:(“TrackerCam Live Video”)|(“TrackerCam Application Login”)|(“Trackercam Remote”) -trackercam.com
inurl:admin inurl:userlist Generic userlist files

inurl:php?=id1
inurl:index.php?id=
inurl:trainers.php?id=
inurl:buy.php?category=
inurl:article.php?ID=
inurl:play_old.php?id=
inurl:declaration_more.php?decl_id=
inurl:pageid=
inurl:games.php?id=
inurl:page.php?file=
inurl:newsDetail.php?id=
inurl:gallery.php?id=
inurl:article.php?id=
inurl:show.php?id=
inurl:staff_id=
inurl:newsitem.php?num= andinurl:index.php?id=
inurl:trainers.php?id=
inurl:buy.php?category=
inurl:article.php?ID=
inurl:play_old.php?id=
inurl:declaration_more.php?decl_id=
inurl:pageid=
inurl:games.php?id=
inurl:page.php?file=
inurl:newsDetail.php?id=
inurl:gallery.php?id=
inurl:article.php?id=
inurl:show.php?id=
inurl:staff_id=
inurl:newsitem.php?num=